Laden der PDF dauert ewig bzw. funktioniert nicht

Hey zusammen,

ich bin ganz neu in diese Materie eingestiegen und habe erst seid Januar einen NAS und wollte jetzt mit Paperless endlich mein papierloses Büro angehen.
Ich habe angefangen Dokumente zu scannen. Wenn ich dann Paperless öffne, sehe ich meist keine Dokumente. Nach einer gefühlten Ewigkeit und einem Kaffee kann ich dann diese pdf sehen. Wenn ich dann anfange, diese mit einem entsprechenden Titel, Tags etc zu versehen, passiert gefühlt nichts mehr.
Ich habe ca 30 Seiten gescannt. Da ich noch in der Erprobung bin weiß ich gerade nicht, wo ich schauen könnte, was ich ggf. Nicht richtig eingerichtet habe. Ich habe mir gestern den Videokurs Synology NAS Masterclass gegönnt und habe auch bereist den Videokurs Paperless NGX (habe ich noch nicht komplett durchgearbeitet).
Vllt. habe ich den NAS auch nicht richtig eingerichtet?

Ich nutze den Synology DS220j, Scanner ScanSnap ix1300

Weiß jemand Rat, damit ich das Problem beheben kann?

Vielen Dank

Hallo,
ich würde mir als erstes mal im Synology-Menü die Auslastung der CPU und Arbeitsspeicher ansehen.
Die 220j ist mit 512MB Arbeitsspeicher nicht wirklich ausgelegt für speicherhungrige Programme. :neutral_face:

VG

Hallo Ulrike,

schau als aller erstes bitte mal nach was deine Synology als Auslastung deiner CPU und deines Arbeitsspeichers während der Verarbeitung deines Dokuments anzeigt.
Bitte gib dann Rückmeldung.
Ich möchte dir an dieser Stelle aber gleich nicht all zu große Hoffnungen machen.

Für einen reibungslosen Ablauf und genügend Leistung wird eigentlich eine Synology der Plus Serie empfohlen.

Ich nutze eine Synology DS 723+ mit 32GB RAM.
Hier besteht bei großen Dokumenten auch das Problem das die Verarbeitungszeit relativ lange ist. (CPU Auslastung lag bei 99%) - Einstellungen wurden mittlerweile aber angepasst.

Wie lange dauert die Verarbeitung bei dir wenn du nur eine Seite scannst ?

Ich habe wegen diesem Problem auch schon ein Thema aufgemacht und hatte diesbezüglich auch schon Kontakt über Github mit Paperless.
Es gibt Möglichkeiten wie die Einstellungen für Paperless auf deine NAS angepasst werden können.
Hier mein Thema, hier wird das beschrieben.
[Lange Verarbeitungszeit - Hohe CPU Auslastung]

Falls du beim Anpassen der Einstellungen Hilfe brauchst kannst du dich gerne nochmal melden.
Wenn du dir meinen Beitrag durchliest siehst du auch wie lange das bei mir gebraucht hat.

Grüße

Kannst Du den Scanner noch zurückgeben? Wenn ja, würde ich das 1600er Modell nehmen. Bei diesem besteht die Möglichkeit, direkt auf die NAS zu scannen, ohne das der Computer eingeschaltet ist.

Ansonsten hilft nur eine Speicherweiterung auf das maximale mögliche.

Bei der DS220j kann man den Speicher nicht erweitern.
Am Worflow ändert sich auch nicht viel, die Dokumente im Consume Ordner werden durch Paperless bearbeitet, egal wie sie dort hinkommen.

Die 220j kann man prima als Backup nutzen wenn man mit einem NAS arbeitet das mehr Dampf hat. :slightly_smiling_face:

Am Workflow ändert sich nichts. Es ist meiner Meinung aber nicht egal, wie diese dorthin kommen. Man benutzt ein NAS als Datenspeicher innerhalb der eigenen Umgebung, ohne das ich diese in einer öffentlichen Cloud oder ähnliches Speicher. Also scanne ich lieber direkt auf mein NAS, ohne Umwege

Ich habe gerade mal geschaut,
Auslastung der CPU ist bei max. 65 %
Der Arbeitsspeicher hat 1024 MB.

:thinking:

ja danke ich lese mir das mal durch.

Wie ist die Auslastung vom Arbeitsspeicher?

Max. 65%.

Sollte ich dann doch lieber dein Pi4 nehmen?

Gibt es dafür eine Anleitung, Paperless-ngx auf Raspberry für Leihen?

Du kannst die Anleitung bzw. die Config aus der Masterclass 1:1 auf dem Pi 4B verwenden.
Die installation erfordert aber etwas mühseliges eingreifen und Umgang mit der Shell.

Kann dir gerne dabei helfen aber als Basis brauchst du am besten ne Frische Installation mit oder ohne der GUI also 64-Bit Minimal oder Standard und Tastatur und Monitor angeschlossen bzw. via VNC verbunden… oder via SSH von nem anderen PC.

Wie lange dauert es wenn du eine einzelne Seite scannst ?

Ich würde versuchen die Einstellungen in docker-compose.env anzupassen bevor du dir einen Pi holst.

Versuche es mal mit:

#CPU Einstellungen 4 Kern
PAPERLESS_TASK_WORKERS= 2
PAPERLESS_THREADS_PER_WORKER= 2

Wenn das nicht besser wird versuche es mal mit:

#CPU Einstellungen 4 Kern
PAPERLESS_TASK_WORKERS= 1
PAPERLESS_THREADS_PER_WORKER= 4

Bitte gib dann mal Rückmeldung.

Grüße

Ich habe gerade nochmal geschaut, weil ich so verwundert war mit dem Speicher.
Ich hatte den DS220j bestellt. Geliefert wurde allerdings der DS223j.
Das ist mir gar nicht aufgefallen. :laughing:

Habe einen Pi 4 da. Ist nur Pi OS 64 Bit auf der Karte (64GB).
Monitor, Maus, Tastatur vorhanden. Das wäre klasse, wenn du mir dabei helfen könntest. Würde gerne mal den Unterschied zum NAS testen.
Solange ich noch übe und teste…

1 „Gefällt mir“

Das schaue ich mir morgen mal an.

Vielen Dank

Da du dein Debian Pi-OS schon drauf hast einfach folgende Packete installieren.

Docker
Docker-compose
Nano
Mc

Erstelle mit dem MC die Ordnerstruktur docker und scaninput im root Verzeichnis oder wo immer du es haben willst.

Folge dem Tutorial unter https://www.ibm.com/docs/en/z-logdata-analytics/5.1.0?topic=compose-relocating-docker-root-directory

Dort statt vim einfach nano verwenden.

Ich installiere immer Webmin fürs einrichten von SMB und den Shares.

Evtl. Musst du die rechte noch korrigieren…

https://webmin.com/download/

Paperless Struktur erstellen und die Env und yml anpassen auf die uid und guid sowie den Pfad.

Wenn alles korrekt eingerichtet ist solltest du nun paperless installieren und einrichten und es sollte laufen.

Vielen Dank, für die Hilfe.

ich bekomme es nicht hin. Habe einen Knoten im Kopf.
Ich habe Nano und MC installiert.
bei Docker … scheitere ich, da ich nicht weiß wie.
MC Ordnerstruktur ? Ich scheck es leider nicht.
Danke für die Mühe, vllt platzt der Knoten irgendwann

Du musst doch nur die IBM Anleitung befolgen… Der MC machts halt leichter aber is keine Voraussetzung.
Hast die Anleitung 1:1 umgesetzt ?
Wo Scheitert es denn ?

Heute morgen lief es auf einmal. :laughing:
Keine Ahnung warum. Das von IBM habe ich nicht gemacht. Kann ich das im Nachgang noch machen, macht das Sinn?
Ich glaube mein Problem ist das mir die Grundlagen fehlen.
Ich verstehe gerade die Ordnerstruktur nicht. :thinking:
Bekommt man die Daten von der Synology mit Export in den PI?

Mit dem Import hast du alles notwendige.
Die Anleitung bewirkt die Auslagerung von Docker ins Verzeichnis /docker z.b.

Ansonsten musst du immer in erstmal dreii weitere unterordner in /