1
Disco ist eine Implementierung von Mapreduce für Distributed Computing.Disco unterstützt parallele Berechnungen über große Datenmengen, die auf einem unzuverlässigen Cluster von Computern gespeichert sind, wie im ursprünglichen von Google erstellten Framework.Dies macht es zu einem perfekten Tool zum Analysieren und Verarbeiten großer Datenmengen, ohne sich um schwierige verteilungsbezogene Techniken wie Kommunikationsprotokolle, Lastausgleich, Sperren, Auftragsplanung und Fehlertoleranz kümmern zu müssen, die von Disco verarbeitet werden.
disco-mapreduce
Webseite:
http://discoproject.org/Eigenschaften
Kategorien
Disco MapReduce-Alternativen für Mac
18
Apache Hadoop
Apache Hadoop ist ein Open Source-Software-Framework, das datenintensive verteilte Anwendungen unterstützt, die unter der Apache v2-Lizenz lizenziert sind.
9
Apache Spark
Apache Spark ™ ist eine schnelle und allgemeine Engine für die Datenverarbeitung in großem Maßstab. SpeedRun-Programme sind bis zu 100-mal schneller als Hadoop MapReduce im Arbeitsspeicher oder 10-mal schneller auf der Festplatte.