9
Apache Spark ™ ist eine schnelle und allgemeine Engine für die Datenverarbeitung in großem Maßstab.Geschwindigkeit Führen Sie Programme bis zu 100-mal schneller als Hadoop MapReduce im Arbeitsspeicher oder 10-mal schneller auf der Festplatte aus.Spark verfügt über eine fortschrittliche DAG-Ausführungs-Engine, die den zyklischen Datenfluss und In-Memory-Computing unterstützt.
apache-spark
Webseite:
http://spark.apache.orgEigenschaften
Kategorien
Apache Spark-Alternativen für Windows
18
Apache Hadoop
Apache Hadoop ist ein Open Source-Software-Framework, das datenintensive verteilte Anwendungen unterstützt, die unter der Apache v2-Lizenz lizenziert sind.
1
Disco MapReduce
Disco ist ein leichtes Open-Source-Framework für verteiltes Computing, das auf dem MapReduce-Paradigma basiert und in Python geschrieben ist.