1
Disco ist eine Implementierung von Mapreduce für Distributed Computing.Disco unterstützt parallele Berechnungen über große Datenmengen, die auf einem unzuverlässigen Cluster von Computern gespeichert sind, wie im ursprünglichen von Google erstellten Framework.Dies macht es zu einem perfekten Tool zum Analysieren und Verarbeiten großer Datenmengen, ohne sich um schwierige verteilungsbezogene Techniken wie Kommunikationsprotokolle, Lastausgleich, Sperren, Auftragsplanung und Fehlertoleranz kümmern zu müssen, die von Disco verarbeitet werden.
Webseite:
http://discoproject.org/Eigenschaften
Kategorien
Alternativen zu Disco MapReduce für alle Plattformen mit einer Lizenz
18
Apache Hadoop
Apache Hadoop ist ein Open Source-Software-Framework, das datenintensive verteilte Anwendungen unterstützt, die unter der Apache v2-Lizenz lizenziert sind.
9
Apache Spark
Apache Spark ™ ist eine schnelle und allgemeine Engine für die Datenverarbeitung in großem Maßstab. SpeedRun-Programme sind bis zu 100-mal schneller als Hadoop MapReduce im Arbeitsspeicher oder 10-mal schneller auf der Festplatte.
1
Amazon Kinesis
Mit Amazon Kinesis-Diensten können Sie problemlos mit Echtzeit-Streaming-Daten in der AWS-Cloud arbeiten.
- Bezahlte
- Web