ArchiveBox

ArchiveBox

🗃 Das selbst gehostete Open Source-Webarchiv.Nimmt Browserverlauf / Lesezeichen / Pocket / Pinnwand / etc. Auf, speichert HTML, JS, PDFs, Medien und mehr.
  • Kostenlose
Da moderne Websites kompliziert sind und häufig auf dynamischen Inhalten beruhen, archiviert ArchiveBox die Websites in verschiedenen Formaten, die nicht nur von öffentlichen Archivierungsdiensten wie Archive.org und Archive.is gespeichert werden können.ArchiveBox importiert eine Liste von URLs aus stdin, remote url oder file und fügt die Seiten dann mithilfe von wget einem lokalen Archivordner hinzu, um einen durchsuchbaren HTML-Klon, YouTube-dl zum Extrahieren von Medien und eine vollständige Instanz von Chrome headless for PDF zu erstellen.Screenshots, DOM-Dumps und mehr ... Durch die Verwendung mehrerer Methoden und des marktbeherrschenden Browsers zur Ausführung von JS wird sichergestellt, dass wir selbst die komplexesten, kniffligsten Websites in mindestens einigen hochwertigen Langzeitdatenformaten speichern können.### Kann Links importieren von: - Pocket, Pinboard, Instapaper - RSS, XML, JSON oder Klartextlisten - Browserverlauf oder Lesezeichen (Chrome, Firefox, Safari, IE, Opera und mehr) - Shaarli, Delicious, RedditGespeicherte Posts, Wallabag, Unmark.it und jeder andere Text mit darin enthaltenen Links!### Kann diese Dinge für jede Site speichern: - `favicon.ico` favicon der Site -` example.com / page-name.html` wget Klon der Site, mit angehängter .html wenn nicht vorhanden - `Ausgabe.pdf` Gedrucktes PDF der Site mit kopflosem Chrom - `screenshot.png` 1440x900 Screenshot der Site mit kopflosem Chrom -` output.html` DOM Dump des HTML nach dem Rendern mit kopflosem Chrom - `archive.org.txt` Ein Link zurgespeicherte Seite auf archive.org - `warc /` für die HTML + Gzipped Warc Datei.gz - `media /` beliebige mp4, mp3, Untertitel und Metadaten, die mit youtube-dl gefunden wurden - `git /` Klon eines beliebigen Repositorys für github-, bitbucket- oder gitlab-Links - `index.html` &` index.json`HTML- und JSON-Indexdateien mit Metadaten und Details Die Archivierung ist additiv, sodass Sie die regelmäßige Ausführung von `. / Archive` einplanen und neue Links in den Index ziehen können.Der gesamte gespeicherte Inhalt ist statisch und mit JSON-Dateien indiziert, sodass er für immer lebt und leicht zu analysieren ist. Es ist kein ständig laufendes Backend erforderlich.
archivebox

Kategorien

Alternativen zu ArchiveBox für alle Plattformen mit einer Lizenz

Pocket

Pocket

Speichern Sie Webseiten, um sie später lesen zu können, und vermeiden Sie das Durcheinander von Lesezeichen mit Websites, die nur einmalig von Interesse sind.
Wget

Wget

GNU Wget ist ein kostenloses Softwarepaket zum Abrufen von Dateien über HTTP (S) und FTP, die am häufigsten verwendeten Internetprotokolle.
HTTrack

HTTrack

Ein Website-Kopierdienst, der ganze Websites herunterlädt und lokal rekursiv erstellt.
Wayback Machine

Wayback Machine

Durchsuchen Sie über 150 Milliarden Webseiten, die von 1996 bis vor einigen Monaten archiviert wurden.
wallabag

wallabag

wallabag ist eine OpenSource-Anwendung zum Speichern von Webseiten. ## Komfortables Lesen
Pinboard

Pinboard

Pinnwand ist ein persönliches Archiv für Dinge, die Sie online finden und nicht vergessen möchten.
Evernote Web Clipper

Evernote Web Clipper

Speichern Sie alles, was Sie online sehen - einschließlich Text, Links und Bilder - mit einem einzigen Klick in Ihrem Evernote-Konto.
Archive.is

Archive.is

Mit Archive.is können Sie ein Foto von einer Webseite machen, die immer verfügbar ist, auch wenn die Originalseite geändert oder gelöscht wird.
  • Kostenlose
  • Web
Internet Archive

Internet Archive

Internet Archive ist eine gemeinnützige digitale Bibliothek, die freien Zugang zu Büchern, Filmen und Musik sowie zu 150 Milliarden archivierten Webseiten bietet.
  • Kostenlose
  • Web
Stash.ai

Stash.ai

Stash ist eine intelligente, geräteübergreifende Lesezeichen-App, die von künstlicher Intelligenz unterstützt wird.Speichern Sie Artikel, Videos und alles andere.Sie werden automatisch für Sie kategorisiert.
SiteSucker

SiteSucker

macOS-Anwendung, die automatisch Websites aus dem Internet herunterlädt.Dies geschieht durch asynchrones Kopieren der Webseiten, Bilder, PDFs, Stylesheets und anderer Dateien der Site auf Ihre lokale Festplatte, wobei die Verzeichnisstruktur der Site dupliziert wird.
PageArchiver

PageArchiver

PageArchiver (früher als "Scrapbook for SingleFile" bezeichnet) ist eine Chrome-Erweiterung, mit der Sie Webseiten zum Offline-Lesen archivieren können.
Reminiscence

Reminiscence

Selbst gehosteter Lesezeichen- und Archivmanager.Setzen Sie ein Lesezeichen für Links und bearbeiten Sie die Metadaten (wie Titel, Tags, Zusammenfassung) über das Webinterface.
Fossilo

Fossilo

Fossilo.com archiviert fortlaufend komplette Websites als PDF und in zahlreichen anderen Formaten, damit sie in Zukunft problemlos und ohne Abhängigkeiten geöffnet und angezeigt werden können.Sie können innerhalb der Plattform durch die Archive navigieren oder sie als eigenständiges Paket herunterladen.
WebCull

WebCull

WebCull ist ein Link-Organizer, mit dem Sie im Web produktiver und organisierter arbeiten können.
  • Kostenlose
  • Web