ArchiveBox

ArchiveBox

🗃 Das selbst gehostete Open Source-Webarchiv.Nimmt Browserverlauf / Lesezeichen / Pocket / Pinnwand / etc. Auf, speichert HTML, JS, PDFs, Medien und mehr.
  • Kostenlose
Da moderne Websites kompliziert sind und häufig auf dynamischen Inhalten beruhen, archiviert ArchiveBox die Websites in verschiedenen Formaten, die nicht nur von öffentlichen Archivierungsdiensten wie Archive.org und Archive.is gespeichert werden können.ArchiveBox importiert eine Liste von URLs aus stdin, remote url oder file und fügt die Seiten dann mithilfe von wget einem lokalen Archivordner hinzu, um einen durchsuchbaren HTML-Klon, YouTube-dl zum Extrahieren von Medien und eine vollständige Instanz von Chrome headless for PDF zu erstellen.Screenshots, DOM-Dumps und mehr ... Durch die Verwendung mehrerer Methoden und des marktbeherrschenden Browsers zur Ausführung von JS wird sichergestellt, dass wir selbst die komplexesten, kniffligsten Websites in mindestens einigen hochwertigen Langzeitdatenformaten speichern können.### Kann Links importieren von: - Pocket, Pinboard, Instapaper - RSS, XML, JSON oder Klartextlisten - Browserverlauf oder Lesezeichen (Chrome, Firefox, Safari, IE, Opera und mehr) - Shaarli, Delicious, RedditGespeicherte Posts, Wallabag, Unmark.it und jeder andere Text mit darin enthaltenen Links!### Kann diese Dinge für jede Site speichern: - `favicon.ico` favicon der Site -` example.com / page-name.html` wget Klon der Site, mit angehängter .html wenn nicht vorhanden - `Ausgabe.pdf` Gedrucktes PDF der Site mit kopflosem Chrom - `screenshot.png` 1440x900 Screenshot der Site mit kopflosem Chrom -` output.html` DOM Dump des HTML nach dem Rendern mit kopflosem Chrom - `archive.org.txt` Ein Link zurgespeicherte Seite auf archive.org - `warc /` für die HTML + Gzipped Warc Datei.gz - `media /` beliebige mp4, mp3, Untertitel und Metadaten, die mit youtube-dl gefunden wurden - `git /` Klon eines beliebigen Repositorys für github-, bitbucket- oder gitlab-Links - `index.html` &` index.json`HTML- und JSON-Indexdateien mit Metadaten und Details Die Archivierung ist additiv, sodass Sie die regelmäßige Ausführung von `. / Archive` einplanen und neue Links in den Index ziehen können.Der gesamte gespeicherte Inhalt ist statisch und mit JSON-Dateien indiziert, sodass er für immer lebt und leicht zu analysieren ist. Es ist kein ständig laufendes Backend erforderlich.
archivebox

Kategorien

ArchiveBox-Alternativen für Windows

Wget

Wget

GNU Wget ist ein kostenloses Softwarepaket zum Abrufen von Dateien über HTTP (S) und FTP, die am häufigsten verwendeten Internetprotokolle.
HTTrack

HTTrack

Ein Website-Kopierdienst, der ganze Websites herunterlädt und lokal rekursiv erstellt.
wallabag

wallabag

wallabag ist eine OpenSource-Anwendung zum Speichern von Webseiten. ## Komfortables Lesen
Stash.ai

Stash.ai

Stash ist eine intelligente, geräteübergreifende Lesezeichen-App, die von künstlicher Intelligenz unterstützt wird.Speichern Sie Artikel, Videos und alles andere.Sie werden automatisch für Sie kategorisiert.
PageArchiver

PageArchiver

PageArchiver (früher als "Scrapbook for SingleFile" bezeichnet) ist eine Chrome-Erweiterung, mit der Sie Webseiten zum Offline-Lesen archivieren können.
Fossilo

Fossilo

Fossilo.com archiviert fortlaufend komplette Websites als PDF und in zahlreichen anderen Formaten, damit sie in Zukunft problemlos und ohne Abhängigkeiten geöffnet und angezeigt werden können.Sie können innerhalb der Plattform durch die Archive navigieren oder sie als eigenständiges Paket herunterladen.
Web Dumper

Web Dumper

Laden Sie ganze Websites aus dem Internet herunter und speichern Sie sie auf Ihrer Festplatte ...