Heritrix

Heritrix

Heritrix ist das Open-Source-Webcrawler-Projekt von Internet Archive, das erweiterbar und in Webgröße in Archivqualität ist.Heritrix (manchmal buchstabiert Heretrix oder falsch geschrieben oder falsch als Heratrix / Heritix / Heretix / Heratix) ist ein archaisches Wort für Erbin (Frau, die erbt).Da unser Crawler versucht, die digitalen Artefakte unserer Kultur zum Nutzen zukünftiger Forscher und Generationen zu sammeln und zu bewahren, schien dieser Name passend.

Kategorien

Alternativen zu Heritrix für alle Plattformen mit Open Source-Lizenz