
9
Apache Spark ™ ist eine schnelle und allgemeine Engine für die Datenverarbeitung in großem Maßstab.Geschwindigkeit Führen Sie Programme bis zu 100-mal schneller als Hadoop MapReduce im Arbeitsspeicher oder 10-mal schneller auf der Festplatte aus.Spark verfügt über eine fortschrittliche DAG-Ausführungs-Engine, die den zyklischen Datenfluss und In-Memory-Computing unterstützt.
Webseite:
http://spark.apache.orgEigenschaften
Kategorien
Apache Spark-Alternativen für Linux

18
Apache Hadoop
Apache Hadoop ist ein Open Source-Software-Framework, das datenintensive verteilte Anwendungen unterstützt, die unter der Apache v2-Lizenz lizenziert sind.

1
Disco MapReduce
Disco ist ein leichtes Open-Source-Framework für verteiltes Computing, das auf dem MapReduce-Paradigma basiert und in Python geschrieben ist.