ich habe gelegentlich den Fall, dass Dokumente zwar erfolgreich verarbeitet werden können, ich kann sie dann auch in Paperless finden, taggen, etc. Die Dokumente sehen in Paperless selbst völlig unauffällig aus, es gibt von ihnen aber keine Archiv-Datei.
Stosse ich die Verarbeitung erneut an, ändert sich nichts, keine Archiv Datei.
Lösche ich die Datei vollständig aus Paperless und lasse sie erneut konsumieren, wird sie wieder fehlerfrei verarbeitet, es gibt aber keine Archiv-Datei.
Das kam bei ein paar hundert Dokumenten jetzt zweimal vor. Ist nicht oft aber scheinbar stimmt hier doch irgendwas nicht. Das schwächt mein Vertrauen in die Software, wenn alles nur zu 99% funktioniert. Irgendwann betrifft es ein wichtiges Dokument und es ist verloren.
Hat das auch schon mal jemand beobachtet und kennt eine Ursache dafür und wie ich dafür sorgen kann, dass wirklich jedes Dokument archiviert wird?
So was ähnliches ist mir mit einer Datei aufgefallen.
Datei kam per eMail ins System, wurde verarbeitet, in paperless alles fein. Wenn ich nun aber diese Datei, sowohl im Original, als auch die OCR Version vom Finder/Explorer aus öffnen wollte ging das nicht. Datei nicht lesbar. In Paperless funktionierte die Datei…
Ziemlich kritischer Bug, wie ich finde. Im Originale-Verzeichnis ist die Datei auch vorhanden und umbenannt wie ich es für den Speicherpfad konfiguriert habe. Hab etwas in der Doku gesucht und bin auf das Setting PAPERLESS_OCR_SKIP_ARCHIVE_FILE gestossen. Hab ich ursprünglich nicht gesetzt, was laut Doku bedeutet Paperless nimmt den Default never. Habe den Wert testweise trotzdem explizit gesetzt, das ändert aber leider gar nix. Paperless weigert sich manche Dokument so zu verarbeiten, wie es konfiguriert wurde. Bevor ich dafür keine Lösung finde, lasse ich die Finger leider wieder von Paperless. Ist mir zu riskant, wegen so einem Bug irgendwann Dokumente zu verlieren. Blöd, dass ich schon einige Abende in die Software versenkt habe…
Zur Dokumentation, falls noch jemand drüber stolpert:
Zu früh Paperless eines Fehlers beschuldigt. Paperless trifft keine Schuld. Dass in meinem Fall für manche Dokumente keine Archivierten Dateien angelegt wurden lag daran, dass diese signiert sind. Ich hab jetzt noch folgende Parameter für OCRmyPDF im Paperless-Container konfiguriert: