Disco MapReduce

Disco MapReduce

Disco ist ein leichtes Open-Source-Framework für verteiltes Computing, das auf dem MapReduce-Paradigma basiert und in Python geschrieben ist.
Disco ist eine Implementierung von Mapreduce für Distributed Computing.Disco unterstützt parallele Berechnungen über große Datenmengen, die auf einem unzuverlässigen Cluster von Computern gespeichert sind, wie im ursprünglichen von Google erstellten Framework.Dies macht es zu einem perfekten Tool zum Analysieren und Verarbeiten großer Datenmengen, ohne sich um schwierige verteilungsbezogene Techniken wie Kommunikationsprotokolle, Lastausgleich, Sperren, Auftragsplanung und Fehlertoleranz kümmern zu müssen, die von Disco verarbeitet werden.
disco-mapreduce

Eigenschaften

Kategorien

Alternativen zu Disco MapReduce für alle Plattformen mit einer Lizenz

Apache Hadoop

Apache Hadoop

Apache Hadoop ist ein Open Source-Software-Framework, das datenintensive verteilte Anwendungen unterstützt, die unter der Apache v2-Lizenz lizenziert sind.
Apache Spark

Apache Spark

Apache Spark ™ ist eine schnelle und allgemeine Engine für die Datenverarbeitung in großem Maßstab. SpeedRun-Programme sind bis zu 100-mal schneller als Hadoop MapReduce im Arbeitsspeicher oder 10-mal schneller auf der Festplatte.
Amazon Kinesis

Amazon Kinesis

Mit Amazon Kinesis-Diensten können Sie problemlos mit Echtzeit-Streaming-Daten in der AWS-Cloud arbeiten.
dispy

dispy

dispy ist ein Python-Framework für die parallele Ausführung von Berechnungen, indem sie auf mehrere Prozessoren auf einer einzelnen Maschine (SMP) verteilt werden, auf viele Maschinen in einem Cluster oder ...