Gigablast

Gigablast

Gigablast ist eine leistungsstarke, neue OpenSource-Suchmaschine, die Echtzeitindizierungen durchführt!
Gigablast ist eine leistungsstarke, neue OpenSource-Suchmaschine, die Echtzeitindizierungen durchführt!Funktionen Skalierbar auf Tausende von Servern.Skaliert auf über 12 Milliarden Webseiten auf über 200 Servern.Ein Dual Quad Core mit 32 GB RAM und zwei 160 GB Intel SSDs, auf denen 8 Gigablast-Instanzen ausgeführt werden, können bei einem Index von 10 Millionen Seiten ungefähr 8 qps (Abfragen pro Sekunde) ausführen.Die Laufwerke haben fast die maximale Speicherkapazität.Durch das Verdoppeln der Indexgröße wird die QPS-Rate mehr oder weniger halbiert.(Performance-Metriken können ungefähr zehnmal schneller erstellt werden, aber ich habe mich noch nicht darum gekümmert. Die Speicherplatznutzung wird wahrscheinlich in etwa gleich bleiben, da sie bereits ziemlich effizient ist.) 1 Million Webseiten erfordern 28,6 GB Speicherplatz.Dazu gehören der Index, Metainformationen und das komprimierte HTML aller Webseiten.Die Spinnenrate beträgt ungefähr 1 Seite pro Sekunde und Kern.Ein Dual-Quad-Core kann also 8 Seiten pro Sekunde spinnen und indizieren, was 691.200 Seiten pro Tag entspricht.Pro Gigablast-Instanz sind 4 GB RAM erforderlich.(instance = process) Live-Demo bei Written in C / C ++ für optimale Leistung.Über 500.000 Zeilen C / C ++.100% benutzerdefinierte.Eine einzelne Binärdatei.Der Webserver, die Datenbank und alles andere sind in diesem Quellcode auf höchst effiziente Weise enthalten.Erleichtert die Verwaltung und Fehlerbehebung.Zuverlässig.Wurde seit 2002 in der Live-Produktion auf Milliarden von Abfragen auf einem Index von über 12 Milliarden einzigartigen Webseiten getestet, 24 Milliarden gespiegelt.Super schnell und effizient.Eine von wenigen Suchmaschinen, die so viele Treffer erzielt haben.Die einzige Open-Source-Suchmaschine, die hat.Unterstützt alle Sprachen.Kann die Ergebnisse in bestimmten Sprachen zur Abfragezeit verbessern.Verwendet intern die UTF-8-Darstellung.Streckenrekord.Wurde von vielen Kunden genutzt.Wurde erfolgreich in verteilten Unternehmenssoftware verwendet.Im Cache gespeicherte Webseiten mit hervorgehobenem Suchbegriff ....

Kategorien

Gigablast-Alternativen für Self-Hosted

searx

searx

Searx ist eine Metasuchmaschine, die die Ergebnisse anderer Suchmaschinen zusammenfasst und keine Informationen über ihre Benutzer speichert.Warum Searx verwenden?
Seeks

Seeks

Seeks ist ein kostenloses und offenes P2P-Design und eine Anwendung zur Ermöglichung der Suche in sozialen Netzwerken.
Sphider

Sphider

Sphider ist ein leichtgewichtiger Web-Spider und eine Suchmaschine, die in PHP geschrieben wurde und MySQL als Back-End-Datenbank verwendet.
Inout Search Engine

Inout Search Engine

So wie Google oder Yahoo Ergebnisse abruft, können Sie auch eine private Suchmaschine mit einem Klonskript erstellen.
SSEP - Site Search Engine PHP-Ajax

SSEP - Site Search Engine PHP-Ajax

Dies ist ein Site Search Engine-Skript, das MySQL verwendet, um die indizierten Seiten Ihrer Website zu speichern und Ihrer Website Suchfunktionen hinzuzufügen.