Hallo zusammen,
mir ist folgendes aufgefallen:
Wenn ich mehrere Seiten auf einmal scanne (ca.25 Seiten, beidseitig bedruckt) dauert die Verarbeitung durch Paperless extrem lange. (mehrere Minuten)
Hierbei steigt die CPU Auslastung schlagartig auf 99%.
Ich nutze eine Synology DS723+.
RAM 32GB
CPU: AMD Ryzen R1600
Scanner: Epson ES580W
Während des Scannens laufen keine anderen Anwendungen!
Wenn die Verarbeitung von Paperless abgeschlossen ist sinkt die CPU Auslastung wieder schlagartig auf 1%.
Mich wundert die extrem lange Verarbeitungszeit und die hohe CPU Auslastung. Wie gesagt es dauert Minuten bis das Dokument bei Paperless ankommt und verarbeitet ist.
Ich hatte deswegen schon Kontakt mit Synology - Der Support meint das liegt an Paperless.
Was habt ihr hier für Erfahrungen?
Dauert das bei euch ach so lange?
Gibt es an der Synology oder an Paperless Einstellungen die angepasst werden müssen?
Ich kann dir nur sagen das die reine Verarbeitung der gescannten Daten und das erstellen eines PDF’s mit OCR auf einem Professionellem Multifunktionsgerät für 10.000 - 20.0000 € je nach Einstellungen auch nicht recht viel schneller ist.
Texterkennung ist ohne FPGA aufwändig … besagte Geräte besitzen FPGA’s die dafür dediziert effizienter sind.
Hast du schon mal geguckt ob deine PDF-Einstellungen die sich auf die finale Dateigröße auswirken etwas ändern ?
Bei 25 Seiten und 2 Cores halte ich diese Verarbeitungszeit für völlig normal.
Poste gerne mal die Logs, während paperless ein solches Dokument konsumiert. Dort steht auch, wie viele Worker verwendet werden.
Ein häufiges Problem ist, dass man mehr Worker zuteilt als es Threads gibt, aber das sehen wir an den Logs und deiner CPU.
Hmmm da kann ich nicht viel erkennen außer das er um 19:44:30 fertig war und eigentlich nicht mal angefangen hat… zumindest innerhalb einer Sekunde abgebrochen hat.
Wegen Verarbeitungsdauer…
Ich habe mir gestern auf meinem DIY-NAS den Spaß gemacht und die über 4400 PDF’s in den Scaninputordner zu schieben die ich aus meiner aktuellen Produktiv-Installation exportiert habe und habe dann Paperless gestartet…
Wohlgemerkt es waren lediglich die PDF’s die ich mit Order Struktur eingefügt habe ( Archive / Original )…
die Anzahl Ihrer CPU-Kerne nicht übersteigt, sonst wird paperless extrem langsam. Wenn Sie möchten, dass paperless viele Dokumente parallel verarbeitet, wählen Sie eine hohe Anzahl von Arbeitern. Wenn Paperless sehr große Dokumente schneller verarbeiten soll, wählen Sie eine höhere Anzahl von Threads pro Worker.