Kein Export aus Paperless-ngx mehr möglich

Hallo Community,
zunächts mal einen Guten Start ins 2025 !!!

Ich habe ein NUC auf welchem Proxmox läuft. In Proxmox habe ich ein Container, mit dem aktuellsten Ubuntu und Paperless-ngx. Bin vom Prog begeistert. Ich wollte eine neue Installation aufsetzten und durch einen Export im bisherigen System und Import im neuen System die Dokumente übertragen, doch seit einiger Zeit schaffe ich kein Export mehr, bzw. das Verzeichnis /paperless/paperless-ngx/export wir nicht aktualisiert. Habe auch mal den kompletten Inhalt gelöscht in der Hoffnung ein Komplett-Export zu provuzieren, doch nun bleibt der Ordner komplett leer.

der Befehl: sudo docker ps bringt folgendes:

CONTAINER ID   IMAGE                                        COMMAND                  CREATED         STATUS                   PORTS                                       NAMES
bfc09b539c0a   ghcr.io/paperless-ngx/paperless-ngx:latest   "/sbin/docker-entryp…"   7 minutes ago   Up 7 minutes (healthy)   0.0.0.0:8000->8000/tcp, :::8000->8000/tcp   paperless
c0b81a7900e1   redis:7                                      "docker-entrypoint.s…"   7 minutes ago   Up 7 minutes             6379/tcp                                    paperless_broker_1
31f29ef1643a   gotenberg/gotenberg:8.7                      "/usr/bin/tini -- go…"   7 minutes ago   Up 7 minutes             3000/tcp                                    paperless_gotenberg_1
7c21a65d4556   ghcr.io/paperless-ngx/tika:latest            "/bin/sh -c 'exec ja…"   7 minutes ago   Up 7 minutes             9998/tcp                                    paperless_tika_1
4eb34052fe22   postgres:15                                  "docker-entrypoint.s…"   7 minutes ago   Up 7 minutes             5432/tcp                                    paperless_db_1
acbb950bf410   frooodle/s-pdf:latest                        "/scripts/init.sh ja…"   15 months ago   Up 7 hours               0.0.0.0:8080->8080/tcp, :::8080->8080/tcp   stirling-pdf_stirling-pdf_1

in der „docker-compose.yml“ steht unter Volumes folgendes:

volumes:
- /paperless/paperless-ngx/data:/usr/src/paperless/data
- /paperless/paperless-ngx/media:/usr/src/paperless/media
- /paperless/paperless-ngx/export:/usr/src/paperless/export
- /paperless/paperless-ngx/scaninput:/usr/src/paperless/consume

Beim Aufruf: sudo docker exec paperless document_exporter ../export kommt folgende Meldung:

No passphrase was given, sensitive fields will be in plaintext
0%| | 0/164 [00:00<?, ?it/s]
Traceback (most recent call last):
File „/usr/src/paperless/src/manage.py“, line 10, in
execute_from_command_line(sys.argv)
File „/usr/local/lib/python3.12/site-packages/django/core/management/init.py“, line 442, in execute_from_command_line
utility.execute()
File „/usr/local/lib/python3.12/site-packages/django/core/management/init.py“, line 436, in execute
self.fetch_command(subcommand).run_from_argv(self.argv)
File „/usr/local/lib/python3.12/site-packages/django/core/management/base.py“, line 413, in run_from_argv
self.execute(*args, **cmd_options)
File „/usr/local/lib/python3.12/site-packages/django/core/management/base.py“, line 459, in execute
output = self.handle(*args, **options)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File „/usr/src/paperless/src/documents/management/commands/document_exporter.py“, line 217, in handle
self.dump()
File „/usr/src/paperless/src/documents/management/commands/document_exporter.py“, line 318, in dump
self.copy_document_files(
File „/usr/src/paperless/src/documents/management/commands/document_exporter.py“, line 499, in copy_document_files
self.check_and_copy(
File „/usr/src/paperless/src/documents/management/commands/document_exporter.py“, line 551, in check_and_copy
copy_file_with_basic_stats(source, target)
File „/usr/src/paperless/src/documents/utils.py“, line 46, in copy_file_with_basic_stats
shutil.copy(source, dest)
File „/usr/local/lib/python3.12/shutil.py“, line 435, in copy
copyfile(src, dst, follow_symlinks=follow_symlinks)
File „/usr/local/lib/python3.12/shutil.py“, line 260, in copyfile
with open(src, ‚rb‘) as fsrc:
^^^^^^^^^^^^^^^
FileNotFoundError: [Errno 2] No such file or directory: ‚/usr/src/paperless/media/documents/originals/0000004.pdf‘

Vielleich gibt es auch ein anderen Weg die Dokumente zu übertragen ?

Hat jemand ein Tip ?
Sind noch Daten notwendig um zu helfen ?
Grüße Stephan

Vor dem export ruft man halt den sanity_checker auf, der sagt einem weniger kryptisch ob der export Probleme machen wird oder nicht.

sudo docker exec containername document_sanity_checker

Aber auch so ist die Fehlermeldung klar: im originals Verzeichnis ist die Datei 00000…4.pdf nicht vorhanden, in der Datenbank gibt es sie aber noch. Das musst du vorher bereinigen.

Genau so ist es.

Woher kommt das Problem? Das taucht immer dann auf, wenn man händisch eine Datei verschiebt oder umbenennt (im Archiv oder in den Originals), auf die man nur lesend zugreifen darf (siehe Hinweis im Kurs dazu :wink: )

gibt es die Möglichkeit die Datenbank neu zu erstellen, z.B. anhand der vorhandenen Dokumente ? Offensichtlich fehlt die angezeigte Datei im Ordner.

Grüße Stephan

Du kannst die Datei einfach suchen und in PLNGX dann löschen :wink:

:slight_smile: allo huebi,
komm leider nicht weiter und möchte euch jetzt auch nicht dauernd belästigen.
Finde die Date nicht und mir sagt der Begriff PLNGX auch nichts, nicht mal Google kann das finden. Bin einfach noch zu unerfahren auf diesem Sektor und werde wohl nochmals von null anfangen müssen.

Wenn ich den „document_sanity_checker“ ausführe kommen auch noch ein paar andere Meldungen.

100%|███████████████████████████████████████████████████████████████████████████| 163/163 [00:01<00:00, 111.28it/s]
[2025-01-02 12:51:52,007] [INFO] [paperless.sanity_checker] Detected following issue(s) with document #458, titled Information zur steuerlichen absetzbaren Beoträge 2023
[2025-01-02 12:51:52,007] [ERROR] [paperless.sanity_checker] Checksum mismatch. Stored: 7bcd84d7fb7911255cc7fcd9cca88f8c, actual: 94c4a53fbe8e0cd71223da9eef861c24.
[2025-01-02 12:51:52,007] [ERROR] [paperless.sanity_checker] Checksum mismatch of archived document. Stored: 810de227e768c6aee31a97776d42735f, actual: 94c4a53fbe8e0cd71223da9eef861c24.
[2025-01-02 12:51:52,008] [INFO] [paperless.sanity_checker] Detected following issue(s) with document #413, titled Fahrzeugschein ES-RU 215E
[2025-01-02 12:51:52,009] [ERROR] [paperless.sanity_checker] Checksum mismatch. Stored: 905f95f762d81e3d725e88b20afad6e7, actual: 94c4a53fbe8e0cd71223da9eef861c24.
[2025-01-02 12:51:52,009] [ERROR] [paperless.sanity_checker] Checksum mismatch of archived document. Stored: 1f95167080b3cef1d7b7aa16a95f6c58, actual: 94c4a53fbe8e0cd71223da9eef861c24.
[2025-01-02 12:51:52,010] [INFO] [paperless.sanity_checker] Detected following issue(s) with document #4, titled 2023-02-20 Hallesche_Information zu Ihrer steuerleichen absetzbaren Beiträge für 2022
[2025-01-02 12:51:52,010] [ERROR] [paperless.sanity_checker] Checksum mismatch of archived document. Stored: 8bf12025b5f2e72f957e7a342adae959, actual: 4e441b33e0176a8a611d8675411679f7.
[2025-01-02 12:51:52,012] [INFO] [paperless.sanity_checker] Detected following issue(s) with document #28, titled ABE Scheibenfolie C180
[2025-01-02 12:51:52,012] [INFO] [paperless.sanity_checker] Document contains no OCR data
[2025-01-02 12:51:52,012] [WARNING] [paperless.sanity_checker] Orphaned file in media dir: /usr/src/paperless/media/documents/archive/._.DS_Store
[2025-01-02 12:51:52,012] [WARNING] [paperless.sanity_checker] Orphaned file in media dir: /usr/src/paperless/media/.DS_Store
[2025-01-02 12:51:52,012] [WARNING] [paperless.sanity_checker] Orphaned file in media dir: /usr/src/paperless/media/documents/originals/._.DS_Store
[2025-01-02 12:51:52,013] [WARNING] [paperless.sanity_checker] Orphaned file in media dir: /usr/src/paperless/media/._.DS_Store
[2025-01-02 12:51:52,013] [WARNING] [paperless.sanity_checker] Orphaned file in media dir: /usr/src/paperless/media/documents/originals/.DS_Store
[2025-01-02 12:51:52,013] [WARNING] [paperless.sanity_checker] Orphaned file in media dir: /usr/src/paperless/media/documents/archive/.DS_Store
[2025-01-02 12:51:52,013] [WARNING] [paperless.sanity_checker] Orphaned file in media dir: /usr/src/paperless/media/documents/._.DS_Store
[2025-01-02 12:51:52,013] [WARNING] [paperless.sanity_checker] Orphaned file in media dir: /usr/src/paperless/media/documents/.DS_Store

Trotzdem Danke der versuch war es wert :-)

Ist jetzt aber erstmal nichts was man nicht reparieren könnte. Man kann die 163 Dokumente aber auch herauskopieren und ganz neu anfangen, also wirklich alles löschen und dann die Dateien wieder konsumioeren. Dann stimen auch die Metadaten wieder.

Dann das obige Bild ausdrucken und über dem Schreibtisch aufhängen.

Hallo huebi,
habe nun alle Dakumente zuerst mal ganz flach (Standard Ordnerstruktur) in einem Ordner dargestellt. Dann habe ich alle Dokumente in den neuen Ziel Consumer Ordner kopiert, damit diese konsumiert werden.
Zuletzt das Bild ausgedruck und auf mein Mainboard geheftet.

Danke für die Unterstützung. War jetzt aufgrund der geringeren Anzahl von Dokumente nicht so umfangreich.

Was denkst du, bringt mir der Masterclass Videokurs den Stefan anbietet auch was, auch wenn ich nicht auf einem Synology-NAS sondern auf Proxmox installiert habe. Die Daten habe ich dann auf einem OMV NAS in einer anderen Instanz.

Grüße Stephan

Das hängt ganz und gar von deinen Kentnissen und deiner Zielsetzung ab. Und da ich den Kurs nicht habe und auch nicht brauche werde ich mich dazu auch nicht äussern.