Scaninput wird nicht bearbeitet

Hallo,

nun habe ich erfolgreich mit der Konfiguration von Stefan paperless aufgesetzt und ich kann von meinem Scanner direkt nach scaninput scannen -alles funktioniert. Ich bin sehr angetan von der Lösung.

Wenn ich allerdings Dokumente direkt nach scaninput kopiere, werden sie nicht bearbeitet. Woran kann das liegen? Der Epson ist ein anderer Benutzer als mein Mac. Allerdings haben beide die gleichen Berechtigungen für den freigegebenen Ordner scaninput.

Hat vielleicht jemand eine Idee?
Vielen Dank schonmal!

Möglicherweise an den Eigentümer-Rechten der Dokumente… Bin mein MAC Nutzer. @Stefan ?

Aber bei mir ist es völlig wurscht welcher der rechner pdfs kopiert.
Ich hab 95% meiner 4000 dokumente so Konsumieren lassen.

Das ist seltsam und nicht das erwartete Verhalten. Poste gerne einmal den Log, da steht vermutlich drin, warum die Dokumente nicht konsumiert werden.

Ich vermute ja, dass das Kopieren zu langsam ist (die Datei also angelegt wird und etwas zu spät erst beschrieben wird). paperless-ngx wird sofort getriggert und beschwert sich dann über den Dateitype „empty“.

Das kann man über eine Verzögerung von ein paar Sekunden beheben, dazu gibt es im Forum schon einige Beiträge. Einfach mal nach „Delay“ suchen.

1 „Gefällt mir“

Nun funktioniert es irgendwie doch. Vielleicht hat es am Neustart gelegen.
Trotzdem danke für die schnelle Unterstützung!

Ich kann es mir nicht erklären, aber Dokumente, die manuel in den scaninput gelegt werden, werden nicht bearbeitet.
Ich habe eben ein Dokument eingescannt und der Epson scannt nach scaninput. Das Dokument wird erkannt und bearbeitet. Das alle passiert über den Nutzer Epson.

[2024-06-27 14:25:19,449] [INFO] [paperless.management.consumer] Adding /usr/src/paperless/consume/20240627_133201.pdf to the task queue.

[2024-06-27 14:25:20,833] [DEBUG] [paperless.tasks] Skipping plugin CollatePlugin

[2024-06-27 14:25:20,834] [DEBUG] [paperless.tasks] Skipping plugin BarcodePlugin

[2024-06-27 14:25:20,834] [DEBUG] [paperless.tasks] Executing plugin WorkflowTriggerPlugin

[2024-06-27 14:25:20,960] [INFO] [paperless.matching] Document matched WorkflowTrigger 2 from Workflow: Beschriftung

[2024-06-27 14:25:20,969] [INFO] [paperless.tasks] WorkflowTriggerPlugin completed with: Applying WorkflowAction 4 from Workflow: Beschriftung

[2024-06-27 14:25:20,969] [DEBUG] [paperless.tasks] Executing plugin ConsumeTaskPlugin

[2024-06-27 14:25:21,253] [INFO] [paperless.consumer] Consuming 20240627_133201.pdf

[2024-06-27 14:25:21,350] [DEBUG] [paperless.consumer] Detected mime type: application/pdf

[2024-06-27 14:25:21,385] [DEBUG] [paperless.consumer] Parser: RasterisedDocumentParser

[2024-06-27 14:25:21,389] [DEBUG] [paperless.consumer] Parsing 20240627_133201.pdf…

[2024-06-27 14:25:22,028] [INFO] [paperless.parsing.tesseract] pdftotext exited 0

[2024-06-27 14:25:22,998] [DEBUG] [paperless.parsing.tesseract] Calling OCRmyPDF with args: {‚input_file‘: PosixPath(‚/tmp/paperless/paperless-ngxsphbco1h/20240627_133201.pdf‘), ‚output_file‘: PosixPath(‚/tmp/paperless/paperless-kjd9_rta/archive.pdf‘), ‚use_threads‘: True, ‚jobs‘: 4, ‚language‘: ‚deu‘, ‚output_type‘: ‚pdfa‘, ‚progress_bar‘: False, ‚color_conversion_strategy‘: ‚RGB‘, ‚skip_text‘: True, ‚clean‘: True, ‚deskew‘: True, ‚rotate_pages‘: True, ‚rotate_pages_threshold‘: 12.0, ‚sidecar‘: PosixPath(‚/tmp/paperless/paperless-kjd9_rta/sidecar.txt‘)}

[2024-06-27 14:25:31,173] [INFO] [ocrmypdf._pipeline] page is facing ⇧, confidence 14.33 - rotation appears correct

[2024-06-27 14:25:58,360] [INFO] [ocrmypdf._pipelines.ocr] Postprocessing…

[2024-06-27 14:26:14,852] [INFO] [ocrmypdf._pipeline] Image optimization ratio: 1.27 savings: 21.4%

[2024-06-27 14:26:15,340] [INFO] [ocrmypdf._pipeline] Total file size ratio: 1.39 savings: 27.9%

[2024-06-27 14:26:19,149] [INFO] [ocrmypdf._pipelines._common] Output file is a PDF/A-2B (as expected)

[2024-06-27 14:26:22,057] [DEBUG] [paperless.parsing.tesseract] Using text from sidecar file

[2024-06-27 14:26:22,058] [DEBUG] [paperless.consumer] Generating thumbnail for 20240627_133201.pdf…

[2024-06-27 14:26:23,139] [DEBUG] [paperless.parsing] Execute: convert -density 300 -scale 500x5000> -alpha remove -strip -auto-orient -define pdf:use-cropbox=true /tmp/paperless/paperless-kjd9_rta/archive.pdf[0] /tmp/paperless/paperless-kjd9_rta/convert.webp

[2024-06-27 14:26:28,065] [INFO] [paperless.parsing] convert exited 0

[2024-06-27 14:26:34,953] [DEBUG] [paperless.consumer] Saving record to database

[2024-06-27 14:26:34,994] [DEBUG] [paperless.consumer] Creation date from parse_date: 2003-07-11 00:00:00+02:00

[2024-06-27 14:26:35,002] [ERROR] [paperless.consumer] Error occurred parsing title override ‚{created_year}{correspondent}‘, falling back to original. Exception: ‚created_year‘

[2024-06-27 14:26:41,614] [INFO] [paperless.handlers] Assigning correspondent Bank to 2003-07-11 20240627_133201

[2024-06-27 14:26:42,282] [INFO] [paperless.handlers] Assigning storage path Arbeit to 2003-07-11 Bank 20240627_133201

[2024-06-27 14:26:45,348] [DEBUG] [paperless.filehandling] Document has storage_path 5 ({created_year}/Arbeit/{created_year}-{correspondent}-{document_type}) set

[2024-06-27 14:26:45,479] [DEBUG] [paperless.filehandling] Document has storage_path 5 ({created_year}/Arbeit/{created_year}-{correspondent}-{document_type}) set

[2024-06-27 14:26:45,484] [DEBUG] [paperless.consumer] Deleting file /tmp/paperless/paperless-ngxsphbco1h/20240627_133201.pdf

[2024-06-27 14:26:46,412] [DEBUG] [paperless.parsing.tesseract] Deleting directory /tmp/paperless/paperless-kjd9_rta

[2024-06-27 14:26:46,420] [INFO] [paperless.consumer] Document 2003-07-11 Bank 20240627_133201 consumption finished

[2024-06-27 14:26:46,559] [INFO] [paperless.tasks] ConsumeTaskPlugin completed with: Success. New document id 101 created

Wenn ich nun aber am Mac mit meinem Standardprofil einfach manuell eine Datei nach scaninput kopiere, passiert einfach gar nichts. Die Datei bleibt einfach liegen. Die Berechtigungen habe ich durchforstet, allerdings sind die Rechte aus meiner Sicht identisch.

Woran könnte das noch liegen?

Hast du meinen Tipp gelesen?
Ich bin mir ziemlich sicher, dass es daran liegt:

Siehe auch hier:

1 „Gefällt mir“

Das hatte ich bereits probiert. Meine docker-compose.env sieht so aus:

# UID und GID können variieren. Einfach via SSH einloggen und den Befehl "id" ausführen.
# Diese Werte dann hier eintragen:
USERMAP_UID=1027
USERMAP_GID=100

# Falls weitere Sprachen installiert werden sollen, einfach das # vor der nächsten Zeile entfernen (und Sprachen eintragen)
#PAPERLESS_OCR_LANGUAGES=tur ces

# Zeitzone: Berlin
PAPERLESS_TIME_ZONE=Europe/Berlin

# OCR-Sprache: Deutsch
PAPERLESS_OCR_LANGUAGE=deu

# Ausgabeformat: Jahr/Dokumententitel (kann man ändern)
PAPERLESS_FILENAME_FORMAT={created_year}/{title}

# OCR-Modus: Dokumente, die bereits OCR eingebettet haben, werden nicht erneut OCRed. Archiv wird übersprungen.
PAPERLESS_OCR_MODE=skip

PAPERLESS_CONSUMER_POLLING=30
PAPERLESS_CONSUMER_POLLING_RETRY_COUNT=5
PAPERLESS_CONSUMER_POLLING_DELAY=5

Also wenn ich den Order einfach als Netzwerklaufwerk ansteuere klappt es jetzt. Da muss ich aber sehen ob mir unterwegs VPN schnell genug ist.

Offensichtlich hakt es bei Synology Drive.