12
ArchiveBox
🗃 Das selbst gehostete Open Source-Webarchiv.Nimmt Browserverlauf / Lesezeichen / Pocket / Pinnwand / etc. Auf, speichert HTML, JS, PDFs, Medien und mehr.
- Kostenlose
Da moderne Websites kompliziert sind und häufig auf dynamischen Inhalten beruhen, archiviert ArchiveBox die Websites in verschiedenen Formaten, die nicht nur von öffentlichen Archivierungsdiensten wie Archive.org und Archive.is gespeichert werden können.ArchiveBox importiert eine Liste von URLs aus stdin, remote url oder file und fügt die Seiten dann mithilfe von wget einem lokalen Archivordner hinzu, um einen durchsuchbaren HTML-Klon, YouTube-dl zum Extrahieren von Medien und eine vollständige Instanz von Chrome headless for PDF zu erstellen.Screenshots, DOM-Dumps und mehr ... Durch die Verwendung mehrerer Methoden und des marktbeherrschenden Browsers zur Ausführung von JS wird sichergestellt, dass wir selbst die komplexesten, kniffligsten Websites in mindestens einigen hochwertigen Langzeitdatenformaten speichern können.### Kann Links importieren von: - Pocket, Pinboard, Instapaper - RSS, XML, JSON oder Klartextlisten - Browserverlauf oder Lesezeichen (Chrome, Firefox, Safari, IE, Opera und mehr) - Shaarli, Delicious, RedditGespeicherte Posts, Wallabag, Unmark.it und jeder andere Text mit darin enthaltenen Links!### Kann diese Dinge für jede Site speichern: - `favicon.ico` favicon der Site -` example.com / page-name.html` wget Klon der Site, mit angehängter .html wenn nicht vorhanden - `Ausgabe.pdf` Gedrucktes PDF der Site mit kopflosem Chrom - `screenshot.png` 1440x900 Screenshot der Site mit kopflosem Chrom -` output.html` DOM Dump des HTML nach dem Rendern mit kopflosem Chrom - `archive.org.txt` Ein Link zurgespeicherte Seite auf archive.org - `warc /` für die HTML + Gzipped Warc Datei.gz - `media /` beliebige mp4, mp3, Untertitel und Metadaten, die mit youtube-dl gefunden wurden - `git /` Klon eines beliebigen Repositorys für github-, bitbucket- oder gitlab-Links - `index.html` &` index.json`HTML- und JSON-Indexdateien mit Metadaten und Details Die Archivierung ist additiv, sodass Sie die regelmäßige Ausführung von `. / Archive` einplanen und neue Links in den Index ziehen können.Der gesamte gespeicherte Inhalt ist statisch und mit JSON-Dateien indiziert, sodass er für immer lebt und leicht zu analysieren ist. Es ist kein ständig laufendes Backend erforderlich.
Kategorien
Alternativen zu ArchiveBox für alle Plattformen mit einer Lizenz
785
Speichern Sie Webseiten, um sie später lesen zu können, und vermeiden Sie das Durcheinander von Lesezeichen mit Websites, die nur einmalig von Interesse sind.
358
284
191
Wayback Machine
Durchsuchen Sie über 150 Milliarden Webseiten, die von 1996 bis vor einigen Monaten archiviert wurden.
184
wallabag
wallabag ist eine OpenSource-Anwendung zum Speichern von Webseiten. ## Komfortables Lesen
124
67
Evernote Web Clipper
Speichern Sie alles, was Sie online sehen - einschließlich Text, Links und Bilder - mit einem einzigen Klick in Ihrem Evernote-Konto.
- Kostenlose
- Chrome
- Web
- Microsoft Edge
- Firefox
- Opera
- Safari
- Internet Explorer
67
Archive.is
Mit Archive.is können Sie ein Foto von einer Webseite machen, die immer verfügbar ist, auch wenn die Originalseite geändert oder gelöscht wird.
- Kostenlose
- Web
66
Internet Archive
Internet Archive ist eine gemeinnützige digitale Bibliothek, die freien Zugang zu Büchern, Filmen und Musik sowie zu 150 Milliarden archivierten Webseiten bietet.
- Kostenlose
- Web
19
17
SiteSucker
macOS-Anwendung, die automatisch Websites aus dem Internet herunterlädt.Dies geschieht durch asynchrones Kopieren der Webseiten, Bilder, PDFs, Stylesheets und anderer Dateien der Site auf Ihre lokale Festplatte, wobei die Verzeichnisstruktur der Site dupliziert wird.
14
PageArchiver
PageArchiver (früher als "Scrapbook for SingleFile" bezeichnet) ist eine Chrome-Erweiterung, mit der Sie Webseiten zum Offline-Lesen archivieren können.
7
Reminiscence
Selbst gehosteter Lesezeichen- und Archivmanager.Setzen Sie ein Lesezeichen für Links und bearbeiten Sie die Metadaten (wie Titel, Tags, Zusammenfassung) über das Webinterface.
- Kostenlose
- Self-Hosted
3
Fossilo
Fossilo.com archiviert fortlaufend komplette Websites als PDF und in zahlreichen anderen Formaten, damit sie in Zukunft problemlos und ohne Abhängigkeiten geöffnet und angezeigt werden können.Sie können innerhalb der Plattform durch die Archive navigieren oder sie als eigenständiges Paket herunterladen.