Heritrix

Heritrix

Heritrix ist das Open-Source-Webcrawler-Projekt von Internet Archive, das erweiterbar und in Webgröße in Archivqualität ist.Heritrix (manchmal buchstabiert Heretrix oder falsch geschrieben oder falsch als Heratrix / Heritix / Heretix / Heratix) ist ein archaisches Wort für Erbin (Frau, die erbt).Da unser Crawler versucht, die digitalen Artefakte unserer Kultur zum Nutzen zukünftiger Forscher und Generationen zu sammeln und zu bewahren, schien dieser Name passend.
heritrix

Kategorien

Alternativen zu Heritrix für Linux mit Open Source-Lizenz