Document_exporter und document_importer backup geht, aber wiederherstellung nicht möglich

hoffmaa · 6. Oktober 2025 um 09:41

Hallo,ich hoffe das mir hier geholfen werden kann.Ich finde Paperless super und möchte das auch in mein Unternehmen(Küchentudio einbinden)der Exporter läuft bedenklos durch.Bevor man so was fest integriert sollte der Backup und Restore einwandfrei laufen.Paperless läuft auf meinem Proxmox im Container,die Sicherung von Container etc.funktioniert zum Glück.Wenn ich meine Zip Datei zu Hause versuche mit document_importer wiederherzustellen klappt es nicht.Mit der weile sind es über 2000 Dokumente.Fehlermeldung hängt mit Dateien zusammen(Genau Fehlerbeschreibung aus dem importer wird nachgereicht)Hat Paperless ein Problem mit Umlauten?Ist das evtl. das Hauptproblem?Wenn ich so was tolles nutze muss es reibungslos funktionieren.Ich bin gespannt ob ihr mir helfen könnt.Bis die Tage und schon einmal vielen Dank im voraus für eure Hilfe

Jake · 6. Oktober 2025 um 09:54

Hi,

Umlaute sind kein Problem, hab ich jede Menge in meinen Dokumentnamen.

Du musst die zip Datei entpacken, es sollten nur die Dokument und die json Files im Export Ordner sein.
Außerdem muss die gleiche Paperless Version installiert sein wenn du den Export einliest.
Unterschiedliche Versionen wird dir als Fehler angezeigt wenn du den Import per SSH machst.

hoffmaa · 6. Oktober 2025 um 10:10

Die Zip Datei ist entpackt und mit weniger Dateien hatte das zurückspielen funktioniert.Wie kann ich denn Überprüfen ob mein Export mit den Versionen übereinstimmt.Die Version habe ich in der Compose Datei angepasst.Im Hinterkopf habe ich die Fehlermeldung das ein paar Dateien nicht im Archive hinterlegt seien.

Jake · 6. Oktober 2025 um 10:17

Dein export muss schon fehlerfrei durchlaufen, sonst sind Probleme beim import vorprogrammiert.

Die Version deiner ersten Instanz kannst du im Paperless Menü unten links sehen.
Diese Version trägst du in der docker-compose beim Imgage vom Webserver ein wenn du die 2. Instanz installierst.

hoffmaa · 6. Oktober 2025 um 10:55

Dann sage ich erstmal Dankeschön für die raschen Antworten und werde mich der Sache noch einmal intensiv widmen. Ist halt doof wenn man über 2000 Dokumente hat.Ich werde Bescheid geben.

hoffmaa · 7. Oktober 2025 um 09:18

Über Nacht hat er die PDF ´s erneut eingelesen. Die Spannung steigt ob es Heute Abend funktioniert.Danke nochmal Jake

hoffmaa · 7. Oktober 2025 um 21:34

Folgendes Szenario nun zu Hause

Found file *.pdf, this might indicate a non-empty installation
Found file .pdf, this might indicate a non-empty installation
Checking the manifest
CommandError: The manifest file refers to ".pdf" which does not appear to be in the source directory.

Mit dem * habe ich nur den Namen unkenntlich gemacht. Was mache ich falsch?

Ganz frische neue Installation

Jake · 8. Oktober 2025 um 07:01

Du kannst nur in eine neu installierte bzw. leere Installation einen Import machen.
Am besten den Media, data und db Ordner löschen und neu anlegen.
Kann sein dass deine Ordner anders heißen, je nachdem welche Vorlage du benutzt hast.

Kannst auch den Inhalt deiner docker-compose posten, dann sieht man wie Paperless installiert wurde.
Die Funktion </> anklicken und den Inhalt einfügen.

hoffmaa · 8. Oktober 2025 um 20:32

services:
  broker:
    image: docker.io/library/redis:8
    restart: unless-stopped
    volumes:
      - redisdata:/data
  db:
    image: docker.io/library/postgres:17
    restart: unless-stopped
    volumes:
      - ./database:/var/lib/postgresql/data
    environment:
      POSTGRES_DB: paperless
      POSTGRES_USER: paperless
      POSTGRES_PASSWORD: paperless
  webserver:
    image: ghcr.io/paperless-ngx/paperless-ngx:latest
    restart: unless-stopped
    depends_on:
      - db
      - broker
      - gotenberg
      - tika
    ports:
      - "8000:8000"
    volumes:
      - ./data:/usr/src/paperless/data
      - ./media:/usr/src/paperless/media
      - ./export:/usr/src/paperless/export
      - /home/paperless/paperless-ngx/consume:/usr/src/paperless/consume
    env_file: docker-compose.env
    environment:
      PAPERLESS_REDIS: redis://broker:6379
      PAPERLESS_DBHOST: db
      PAPERLESS_TIKA_ENABLED: 1
      PAPERLESS_TIKA_GOTENBERG_ENDPOINT: http://gotenberg:3000
      PAPERLESS_TIKA_ENDPOINT: http://tika:9998
  gotenberg:
    image: docker.io/gotenberg/gotenberg:8.22
    restart: unless-stopped
    # The gotenberg chromium route is used to convert .eml files. We do not
    # want to allow external content like tracking pixels or even javascript.
    command:
      - "gotenberg"
      - "--chromium-disable-javascript=true"
      - "--chromium-allow-list=file:///tmp/.*"
  tika:
    image: docker.io/apache/tika:latest
    restart: unless-stopped
volumes:
  redisdata:

hoffmaa · 8. Oktober 2025 um 20:35

Habe eben die Ordner gelöscht und Neu angelegt.Der Versuch den Import sofort zumachen schlug fehl.Nun habe ich zuerst Docker Compose up -d laufen lassen, danach der Import Versuch mit dem selbigen Fehler wie oben beschrieben.Ich finde das Problem leider nicht.

Der Fehler kommt jetzt

CommandError: The manifest file refers to „*.pdf“ which does not appear to be in the source directory.

hoffmaa · 8. Oktober 2025 um 20:54

Füge noch hinzu das ich es mit einer andere Export Zip Datei eines anderen Datums versucht habe. Hier kommt die selbige Fehlermeldung, jedoch mit einem anderen Dateinamen.Ich bin am verzweifeln.

Zum Testen habe ich auch mal docker-compose statt docker compose probiert.

Jake · 9. Oktober 2025 um 07:14

Du musst folgende Ordner löschen und neue erstellen:
database, data und media

Die Dateien der entzippten Export-Datei muss in den Export Ordner.
Paperless läuft und du könntest sich anmelden? Was du nicht tust!!
Du bist per ssh auch im richtigen Pfad?

hoffmaa · 9. Oktober 2025 um 14:59

Nachdem ich Heute auf der Arbeit nach Container Sicherung den Export und Import versucht haben.Schlug dieses Gnadenlos fehl.Wer hat noch möglichkeiten zu helfen?Meiner Meinung nach liegt es an den Umlauten, kann das jemand bestätigen.Es ist ein tolles Programm,aber wenn die Sicherung nicht zurückgespielt werden kann hilft es nicht wirklich weiter.

IhDuepfe · 9. Oktober 2025 um 16:52

Ein bisschen wenig informationen um dir wirklich zu helfen.

Welches System verwendest du wo und auf welcher Platform läuft es ?

Die exakten ausgaben aus der shell wären das mindeste um nachvollziehen zu können wo es liegt.

je nach System gibt es ein docker-compose nicht !

sudo docker-compose exec -T webserver document_exporter -z ../export

und 

sudo docker-compose exec -T webserver document_importer ../export

hoffmaa · 9. Oktober 2025 um 21:41

Das interessante an der Sache.Ich habe den Export Befehl mit 23 Dokumenten als Inhalt vollzogen und auch wieder fehlerfrei zurückspielen können.

Checking the manifest
Installed 315 object(s) from 1 fixture(s)
Copy files into paperless…
100%|██████████████████████████████████████████████████████| 23/23 [00:00<00:00, 130.01it/s]
Updating search index…
100%|███████████████████████████████████████████████████████| 23/23 [00:00<00:00, 65.61it/s]

Bei der großen Datei kommt folgender Fehler " Checking the manifest
CommandError: The manifest file refers to „2025-09-30 1190750.074_132.pdf“ which does not appear to be in the source directory.Den Namen habe ich aus der PDF entfernt.

Der Export hatte zuvor einwandfrei funktioniert bei der großen Datei.HILFE

Zu dem System der Container läuft auf Proxmox und in einer Ubuntu Umgebung

IhDuepfe · 9. Oktober 2025 um 22:21

Das Dokument wird nicht mehr vorhanden sein in deiner Instanz da entweder in den Ordnern verschoben oder umbenannt…

Da musst dich dann im Django-Panel bemühen das zu finden wenn noch vorhanden.
Dort musst du dann die Abhängigkeiten auflösen.
Denke da werden aber noch mehr Dokumente kommen die nicht mehr vorhanden sind.

Mit der SuFu kannst dir gerne mal die anderen Beiträge ansehen mit selbem Problem.

„which does not appear to be“ als Suchbegriff verwenden.

hoffmaa · 10. Oktober 2025 um 06:03

Die Datei befindet sich ganz Normal im Export Ordner.Gelöscht habe ich auch nie was.Bin mit meinem Latein am Ende.Ein letzter Test wird die Sache mit den Umlauten werden.

IhDuepfe · 10. Oktober 2025 um 06:30

Ich dachte eher anders herum, aber wenn die im Export Ordner ist aber nicht in der JSON steht könnte man davon ausgehen das die Datei vielleicht nicht Teil des exports ist ?

Was passiert wenn du die Datei vor dem Export verschiebst ?
Bist du dir sicher das die Datei im Export enthalten ist ?
Hast du den Export Inhalt jemals gelöscht ?

Jake · 10. Oktober 2025 um 08:12

Das Dokument muss im Export 3 mal vorhanden sein, als pdf, pdf mit Zusatz -archive und als -thumbnail.webp

Evtl hat das PDF auch ne Macke, würde ich vor dem export mal löschen.

hoffmaa · 10. Oktober 2025 um 14:53

Gibt es eine Möglichkeit Dateileichen ausfindig zumachen?Document Fuzzy z.B. so eine Art Chkdsk/Bleachbit?