Der Kern von Flink ist eine Streaming-Datenfluss-Engine, die Datenverteilung, Kommunikation und Fehlertoleranz für verteilte Berechnungen über Datenströme bietet.Flink enthält mehrere APIs zum Erstellen von Anwendungen, die die Flink-Engine verwenden: DataSet-API für in Java, Scala und Python eingebettete statische Daten, DataStream-API für in Java und Scala eingebettete unbegrenzte Streams und Tabellen-API mit einer in SQL eingebetteten AusdrucksspracheJava und Scala.Flink bündelt außerdem Bibliotheken für domänenspezifische Anwendungsfälle: Machine Learning-Bibliothek und Gelly, eine API und Bibliothek für die Grafikverarbeitung.Sie können Flink problemlos in andere bekannte Open-Source-Systeme integrieren, sowohl für die Dateneingabe und -ausgabe als auch für die Bereitstellung.(Früher Stratosphäre)
Webseite:
http://flink.apache.orgKategorien
Apache Flink-Alternativen für Linux
27
18
Apache Hadoop
Apache Hadoop ist ein Open Source-Software-Framework, das datenintensive verteilte Anwendungen unterstützt, die unter der Apache v2-Lizenz lizenziert sind.
9
Apache Spark
Apache Spark ™ ist eine schnelle und allgemeine Engine für die Datenverarbeitung in großem Maßstab. SpeedRun-Programme sind bis zu 100-mal schneller als Hadoop MapReduce im Arbeitsspeicher oder 10-mal schneller auf der Festplatte.
1
Disco MapReduce
Disco ist ein leichtes Open-Source-Framework für verteiltes Computing, das auf dem MapReduce-Paradigma basiert und in Python geschrieben ist.