Wir setzen in meinem Büro einen professionellen Drucker/Scanner (DEVELOP ineo+ 368) ein, der u.a. sehr schnelle (auch beidseitige) Scans erstellt und optional an einen externen Speicherort weiterleitet.
Im Prinzip arbeitet der Scanner einwandfrei - auch in Verbindung mit Paperless.
Mit einer gravierenden Ausnahme:
Sobald ein PDF aus einem mehrseitigen Dokument erstellt wird, liest dies Paperless zwar so wie gewünscht ein und zeigt dies in seiner Inputliste auch an.
Dabei gibt es jedoch folgendes Phänomen: Es werden dann zusätzliche Dokumente erstellt, deren Anzahl mit der Seitenzahl des Originals übereinstimmt. Da es exakt die gleiche ID erhält, lehnt Paperless dies als redundanten (= bereits vorhandenen) Inhalt ab und wirft entsprechende Fehler.
Die „misslungenen“ Inputs müssen daher anschließend manuell entfernt werden.
Ich habe überprüft, dass tatsächlich nur eine(!) PDF-Datei durch den Scanner im scaninput-Ordner abgelegt wird!
Hoffentlich habe ich das Problem veranschaulichen können. Ich würde mich freuen, wenn mir jemand sagen könnte, an welcher „Stellschraube“ (Einstellung) ich da noch drehen muss, um die überflüssigen Fake-Inputs zu vermeiden.
Noch etwas sollte ich betonen: Sobald ich die selbe gescannte PDF manuell in paperless importiere (drag and drop), wird der Vorgang völlig korrekt mit nur einem Import abgeschlossen. Das Gleiche gilt für alle einseitigen gescannten PDFs.
Laienhaft ausgedrückt würde ich sagen Paperless beginnt sofort mit der Verarbeitung sobald das Dokument im Consume Ordner angelegt wird ob wohl es vom Scanner noch bearbeitet wird.
Stell mal folgenden ENV Parameter auf 10, 20 oder 30 Sekunden:
PAPERLESS_CONSUMER_INOTIFY_DELAY
Ich denke @Jake hat hier völlig recht und das dachte ich nir schon mehrfach wenn ich ahnliche Posts gelesen habe.
Könnt ihr nen Workaround umsetzen und in einen anderen Ordner scannen und per Cron-Job die datei in den Consume Ordner schieben lassen ?
Bei Xerox wird die datei auch erstellt und dann pro seite immer größer…
Hast du dir schon mal im Detail die Scaneinstellungen angesehen und auch mal andere Parameter verwendet und mal auch an PDF/a gedacht ?
Deine Anregung mit PDF/A ist wirklich bedenkenswert - leider bietet unser DEVELOP diese Option nicht an (müsste ich vielleicht mal nach einer neuen Soft-/Firmware schauen).
Und ein CronJob? Ich weiß nicht so recht…
Kann man denn auf der Synology-NAS auch CronJobs erstellen? Dann wäre es vielleicht einen Versuch wert!
Schade aber, sollte es keine anderen Lösungsmöglichkeiten geben.
Nennt sich Task-Planer oder so in der Verwaltung.
Die „Task“ sind im Prinzip nur befehle die man auch manuell via SSH eingeben könnte.
Habt ihr nen Wartungsvertrag für die Ineo ?
Wenn ja soll der Dienstleister/Händler mal auf die neuste Firmware Updaten und vielleicht kann der mehr über die Möglichkeiten dazu sagen.
Bitte keinesfalls selbst Updaten … im Worst Case wird es Vierstellig von den Kosten.
15 Sekunden ist auch nicht grad viel wenn man mehrere Seiten scannt, evtl. noch zwischendurch sortiert und manuell abschließen muss.
Und wie lange der Scanner für die Interne Verarbeitung braucht kommt sicher auch auf die Anzahl der Seiten an.
Stell den Parameter zum Testen mal auf 60 oder 120 Sekunden und schau was passiert.
Alternativ könnte man die Scans auch per Mail verschicken und Paperless holt sich das PDF von der speziell dafür eingerichteten Mailadresse.
Mit mehreren Mail Accounts kann man sich in Paperless entsprechende Arbeitsabläufe anlegen, für Rechnungen, Mahnungen, Angebote, … je nachdem welche Dokumente ihr in euerem Büro verwaltet.
Extern Mails lassen sich so ebenfalls in den Arbeitsprozess einbinden.
Nur mal als Anregung.
Ich mag den Gedanken… aber Scan2Mail Intern nutzt zum glück keiner mehr ebenso wenig wie FTP/SFTP (letzteres wäre mit Synology schnell umsetzbar).
Das Postfach/Mailserver muss dann auch wieder jemand pflegen und verursacht vielleicht auch wieder separate Kosten durch nen Provider oder gar der IT-ler der den Kaffee wegstellen muss und genervt das Managen muss ^^ … derjenige der das nun alles an der Maschine Programmieren muss ganz zu schweigen.
Wenn die Internetanbindung gut ist wäre es eine Möglichkeit (Notlösung), wenn es aber jetzt um Datenschutzrechtliche Unterlagen geht wie z.B. Notarielle Urkunden / Steuer-Krams usw. ein NoGo.
Zumal du bei Scan2Mail jedes mal die Adresse aus dem Adressbuch auswählen und einen Betreff eintippen musst… das will sich keiner mehr antun wenn du im Scan2SMB solche Dinge schon Vordefinieren kannst bei allen Herstellern und mehrere Profile auswählen kannst.
Naja man könnte eine kleine Tastatur via USB dazu anschließen
@prh Soll es einfach mal Probieren und wenn es immer noch nicht funktioniert kann man sich näher Gedanken dazu machen wenn er uns mit genug Infos versorgen kann.
Man kann zum Beispiel in der Synology im Aufgabenplaner eine neue Aufgabe einstellen.
Alle Dokumente werden in dem Beispiel in das Verzeichnis incoming gescannt und alle 60 min werden die neuen Dokumente in das Posteingangsverzeichnis von Paperless-ngx kopiert.
find /volume1/incoming/ -type f -mmin -65 -exec rsync -a --no-relative {} /volume1/docker/paperless-ngx/consume/ ; > /dev/null 2>&1
Wenn nicht eine Synology dann gib es noch ein Video von SemperVideo. Vielleicht hilft das auch weiter.
@anon58924890
Herzlichen Dank auch an Dich für Dein Engagement für die Lösung meines Problems!
Einen Wartungsvertrag haben wir seit etwa einem Jahr nicht mehr. Aber dass ich die Firmware (falls eine neue verfügbar ist) nicht selbst aktualisieren sollte, ist ein sehr guter Hinweis.
Für das Script gibt es eine gute Beschreibung von SemperVideo. Vielleicht hilft dir das ganze
weiter zu verstehen. habe das in der Synology-Aufgabenplaner eingebunden.
find /volume1/incoming/ -type f -mmin -65 -exec rsync -a --no-relative {} /volume1/docker/paperless-ngx/consume/ ; > /dev/null 2>&1
Hallo Peter, dies habe ich eine lange Zeit erfolgreich eingesetzt im Aufgabenplaner.
find /volume1/incoming/ -type f -mmin -65 -exec rsync -a --no-relative {} /volume1/docker/paperless/consume/ ; > /dev/null 2>&1
Bitte daran denken, dass die Aufgabe als root User ausgeführt werden muss. Ich habe es seinerzeit alle 60 Minuten starten lassen.