Backups / Exports

Hallo,

in der Masterclass wird empfohlen das „pgdata“-Verzeichnis zu verwenden, um das Backup der Datenbank zu vereinfachen. Hierzu habe ich jedoch noch einige Fragen:

  • Muss man die Datenbank wirklich separat sichern (ist diese nicht Teil eines Exports)?
  • Falls die Datenbank nicht Teil eines Exports ist, was fehlt sonst noch alles in den Exports (sind z.B. alle Einstellungen vorhanden, welche im WebUI durchgeführt wurden)?
  • Muss die paperless-ngx Instanz via „docker-compose down“ vor dem Backup der Datenbank angehalten werden um die Konsistenz des Backups sicherzustellen (es kann ja sonst vorkommen, dass paperless-ngx gerade in die Datenbank schreibt, während das Backup erstellt wird und man am Ende ein inkonsistentes Backup hat)?

Vielen Dank,

Thomas

Hier gibts mehr zum Thema.

Das Backup is All-Inkl. …

Vielen Dank für den Link, welcher den generellen Ablauf von Backups und Restores erklärt.

Ich habe aber noch nicht verstanden, wieso Stefan seinen „pgdata“-Ordner bevorzugt, wenn doch eh schon alles im Export drin steckt.

Du spielst jetzt wohl auf die Sicherung via HyperBackup an ?

Im pgdata ist die Datenbank ausgelagert… deshalb muss die mit dem normalen Backup gesichert werden…
Der Export ist aber zu empfehlen da dort alle relevanten Daten vorhanden sind für nen Umzug oder was auch immer.

Das heißt die Datenbank wurde nur in pgdata ausgelagert, weil sie in dem Fall von HyperBackup nicht mit „sudo docker-compose exec webserver document_exporter“ gesichert wird? Ok, das macht Sinn.

Allerdings sehe ich es trotzdem als kritisch an, die Datenbank einfach mit HyperBackup zur Laufzeit von Paperless-ngx zu sichern. Falls genau zu dem Zeitpunkt wo das Backup erstellt wird, von Paperless-ngx Daten in die Datenbank geschrieben werden, kann dies zu einem inkonsistenten Datenbank-Backup führen. Daher sollte man vor jedem Backup einer Datenbank die Anwendung, welche darauf schreibt, beenden. Bei der Verwendung von „sudo docker-compose exec webserver document_exporter“ mag das gutgehen, da die Entwickler von Paperless-ngx das in ihrem Tool sicher berücksichtigt haben und intern abfangen.

Die Datenbank liegt in diesem Ordner.
Außerdem könnte man vorher paperless beenden lassen und dann erst das backup machen lassen.

Der Ordner ist eigentlich gänzlich Tabu bis auf solche Zwecke.