Dateiaufgaben - Fehlgeschlagen

Hallo zusammen!

Beim import meiner Scans erhalte ich bei einigen Dateien folgende Fehlermeldung:

Der Papierkorb ist nicht aktiviert, auch habe ich überprüft, ob dort noch ein Recycle-File vorhanden ist, ebenfalls nicht der Fall. Woran kann das liegen? Wie gesagt, es tritt nicht bei allen Scanns auf. Von 144 Scans ist dieser Fehler bei 59 aufgetreten.

Beste Grüße
antoni105

Das hatte ich auch schon und die Datei war dann doch vorhanden.
Guck mal ins Protokoll da bekommst du noch merh Infos.

Ich habe ebenfalls den Fehler, wenn ich über den Scaninput Folder gehe der außerhalb des Docker Verzeichnis liegt.

Lade ich die Dokumente über die Gui hoch, gibt’s kein Fehler.

Generell scheint es mir, als würde der Paperless versuchen, die mehrfach sich in die Warteschlange zu ziehen. Sobald nämlich der erste Durchlauf erfolgreich durchgelaufen ist , wird die Datei natürlich verschoben / gelöscht aus dem dem ScanInput Folder. Entsprechend gibt es dann im zweiten Durchlauf ein Fehler, dass die Datei nicht mehr gefunden werden kann :-/

Irgendeine Idee, was man noch prüfen könnte?

Als Anhang mal ein Beispiel von einer Datei die ich in den ScanInput Folder gezogen habe… (3x in der Warteschlange)

edit: Ich glaube ich habe die Lösung für mein Problem gefunden, habe die docker-compose Datei erweitert um folgenden Befehl
PAPERLESS_CONSUMER_INOTIFY_DELAY=30, welcher dafür sorgt, das die Verarbeitung nicht sofort startet. Scheinbar war Paperless einfach ein bisschen zu schnell mit der Verarbeitung.
30 sek ist sicherlich etwas übertrieben, aber hat ja keine Eile.

1 „Gefällt mir“

5 Sekunden müssten doch auch reichen für andere Dateien ähnlicher Größe.
Default ist wohl 0.5 Sekunden wenn ich richtig gelesen habe.

Aber das ist ein Punkt wo ich mir jetzt auch mal die Config angucken werde und diese wohl etwas anpassen werde.

Danke

Hallo zusammen!

im Folgenden der Auszug aus dem Protokoll, interessanterweise ist die Datei konsumiert worden und findet sich in der Datenbank. Werde das jetzt noch sicherheitshalber für alle Dateien prüfen. Schade das gibt nicht wirklich Sicherheit, wenn man viele Dateien hintereinander scannt und Papiere in Richtung Papierkorb legt.

[2024-01-22 00:47:57,318] [INFO] [paperless.consumer] Consuming 20240121_MetallRente Kk.pdf

[2024-01-22 00:47:57,328] [DEBUG] [paperless.consumer] Detected mime type: application/pdf

[2024-01-22 00:47:57,343] [DEBUG] [paperless.consumer] Parser: RasterisedDocumentParser

[2024-01-22 00:47:57,352] [DEBUG] [paperless.consumer] Parsing 20240121_MetallRente Kk.pdf…

[2024-01-22 00:47:58,205] [DEBUG] [paperless.parsing.tesseract] Calling OCRmyPDF with args: {‚input_file‘: PosixPath(‚/tmp/paperless/paperless-ngxtn4ircw4/20240121_MetallRente Kk.pdf‘), ‚output_file‘: PosixPath(‚/tmp/paperless/paperless-ypvc00wt/archive.pdf‘), ‚use_threads‘: True, ‚jobs‘: 4, ‚language‘: ‚deu‘, ‚output_type‘: ‚pdfa‘, ‚progress_bar‘: False, ‚color_conversion_strategy‘: ‚RGB‘, ‚skip_text‘: True, ‚clean‘: True, ‚deskew‘: True, ‚rotate_pages‘: True, ‚rotate_pages_threshold‘: 12.0, ‚sidecar‘: PosixPath(‚/tmp/paperless/paperless-ypvc00wt/sidecar.txt‘)}

[2024-01-22 00:50:48,306] [DEBUG] [paperless.parsing.tesseract] Incomplete sidecar file: discarding.

[2024-01-22 00:50:48,943] [DEBUG] [paperless.consumer] Generating thumbnail for 20240121_MetallRente Kk.pdf…

[2024-01-22 00:50:48,954] [DEBUG] [paperless.parsing] Execute: convert -density 300 -scale 500x5000> -alpha remove -strip -auto-orient /tmp/paperless/paperless-ypvc00wt/archive.pdf[0] /tmp/paperless/paperless-ypvc00wt/convert.webp

[2024-01-22 00:51:02,396] [DEBUG] [paperless.classifier] Document classification model does not exist (yet), not performing automatic matching.

[2024-01-22 00:51:02,405] [DEBUG] [paperless.consumer] Saving record to database

[2024-01-22 00:51:02,406] [DEBUG] [paperless.consumer] Creation date from parse_date: 2023-05-01 00:00:00+02:00

[2024-01-22 00:51:02,884] [DEBUG] [paperless.consumer] Deleting file /tmp/paperless/paperless-ngxtn4ircw4/20240121_MetallRente Kk.pdf

[2024-01-22 00:51:02,950] [DEBUG] [paperless.parsing.tesseract] Deleting directory /tmp/paperless/paperless-ypvc00wt

[2024-01-22 00:51:02,954] [INFO] [paperless.consumer] Document 2023-05-01 20240121_MetallRente Kk consumption finished

[2024-01-22 00:51:03,646] [DEBUG] [paperless.tasks] Skipping plugin CollatePlugin

[2024-01-22 00:51:03,647] [DEBUG] [paperless.tasks] Executing plugin BarcodePlugin

[2024-01-22 00:51:03,649] [DEBUG] [paperless.barcodes] Scanning for barcodes using PYZBAR

[2024-01-22 00:51:03,669] [WARNING] [paperless.barcodes] File is likely password protected, not checking for barcodes: Unable to get page count.

I/O Error: Couldn’t open file ‚/usr/src/paperless/consume/20240121_MetallRente Kk.pdf‘: No such file or directory.

[2024-01-22 00:51:03,671] [DEBUG] [paperless.barcodes] Scanning for barcodes using PYZBAR

[2024-01-22 00:51:03,691] [WARNING] [paperless.barcodes] File is likely password protected, not checking for barcodes: Unable to get page count.

I/O Error: Couldn’t open file ‚/usr/src/paperless/consume/20240121_MetallRente Kk.pdf‘: No such file or directory.

[2024-01-22 00:51:03,692] [INFO] [paperless.tasks] BarcodePlugin completed with: No pages to split on!

[2024-01-22 00:51:03,694] [DEBUG] [paperless.tasks] Executing plugin WorkflowTriggerPlugin

[2024-01-22 00:51:03,700] [INFO] [paperless.tasks] WorkflowTriggerPlugin completed with no message

[2024-01-22 00:51:03,725] [ERROR] [paperless.consumer] Cannot consume /usr/src/paperless/consume/20240121_MetallRente Kk.pdf: File not found.

Probier einfach mal das was der @Raspinho gemacht hat mit der Config-File und stelle es einfach mal auf 1-5 Sekunden.
Komm leider im moment nicht dazu da das DIY-NAS erstmal laufen muss.

Hallo Raspinho!

Hast du diesen Befehl in der yml. hinzugefügt? Position egal?

Hi,

Danke für den Tip, hab bei mir 5 Sekunden eingestellt, bis jetzt keine Probleme.

VG