Neu bei Paperless und einige Fragen zu ausfüllbaren PDFs und zur Ablage

Hallo zusammen,
ich habe Paperless erst seit 3 Tagen, aber bin schon jetzt begeistert. Es scheint genau das zu sein, was ich lange gesucht habe.

Allerdings kamen bei mir einige Fragen auf, bei denen ich jetzt hier um Hilfe bitten möchte.

Ich begleite ehrenamtlich Flüchtlinge und hab daher viel mit PDF-Formularen von Behörden usw. zutun. Die PDF-Formulare sind ausfüllbar. Leider wird die ausfüllbarkeit beim einstellen in Paperless entfernt. Gibt es eine Möglichkeit, dass ich diese Formulare in Paperless importieren kann, aber so, dass sie noch ausfüllbar bleiben. (Nicht innerhalb von Paperless ausfüllbar bleiben, aber die Datei an sich halt)

Mein Endgegner: Verzeichnisstruktur bzw. Speicherpfade…
Ich zerbreche mit seit 3 Tagen den Kopf darüber, was eine gescheite Verzeichnisstruktr wäre. (Ich möchte diese, weil dann die Hölle zufrieren könnte, aber ich hätte die Dateien noch unabhängig in einer Verzeichnisstruktur vorhanden)
Ich bin dann auf diesen Blogeintrag gestoßen: Paperless-ngx, Teil 14: Automatisierte Ablage auf Speicherpfaden – Digital Cleaning
Anscheinend gibt es mehrere Weg nach Rom, aber ehrlich gesagt bin ich nach dem Lesen verwirrte als vorher.
Hat jemand einen Tipp, oder Beispiele, für seine Verzeichnisstruktur bitte?

Danke und LG,

Marcel

Deine Struktur erstellst du dir über die Speicherpfade gekoppelt mit Korrespondenten sowie auch Dokumententyp usw.
Guck dich mal unter ordnerstruktur organisation und workflow um.

Sorry ich mag nicht alle 3 Tage das gleiche in nem neuen Beitrag schreiben obwohl es darüber diverse Diskussionen gab.
Wenn du dann noch Fragen im Detail hast entweder dort in den Beiträgen oder hier.

https://docs.paperless-ngx.com/advanced_usage/#file-name-handling

Dort gehts etwas detaillierter in die Möglichkeiten.

Danke für Deine Antwort.

Auch wenn ich aus Erfahrung nachvollziehen kann, dass immer die gleichen Fragen zu lesen bzw. zu beantworten durchaus nerven kann, find ich es schade, dass man oft so abgespeist wird (wie z.B. hier).

Ich habe, wie im Beitrag erwähnt, viele Artikel gelesen, aber oft ist man danach verwirrter als vorher, da muss meiner Meinung nach die Frage nach einem Tipp/Praxisbeispiel/Best-Practices bzgl. der augenscheinlich vielen Wege die nach Rom führen, um eine gescheite Verzeichnisstruktur anzulegen, erlaubt sein.

Des weiteren werden durch diese „das gab es schon 10x, ich bin müde das zu beantworten, such im Forum-Antworten“, auch oft andere gestellte Fragen komplett ignoriert werden. Das demotiviert ehrlich gesagt ein bisschen.

1 „Gefällt mir“

Es gibt dafür halt keine Universallösung.
Es gibt Lösungswege die jeder individuell für sich erarbeiten muss um auch selbst damit klarzukommen.

87 Millionen Menschen und 87 Millionen Möglichkeiten…

Bin aktuell auch nur Mobil hier und hab nicht die Möglichkeit für Beispiele.

Es bringt aber auch nichts Wege aufzuzeigen die dann nicht verstanden werden.

In meinem älteren Beträge gab es auch Bilder und Beispiele.

Komme frühestens morgen dazu mehr Details zu Posten.

1 „Gefällt mir“

Hallo Marcel,
deine erste Frage kann ich nicht beantworten. Die Dokumente, die ich in paperless-ngx importiere, sind alles pdf-Dateien und keine Formulare.

Zu der zweiten Frage bzgl. der Struktur, experimentiere ich noch. Dabei habe ich mir die Frage gestellt, nach welcher Systematik würde ich ein Dokument suchen. Somit habe ich für wichtige Bereiche Ordner angelegt (z.B. Wohnung, Arbeit, Versicherungen …).
In den Ordner, gibt es noch weitere Ordner (z.B. im Ordner Wohnung gibt es die Ordner: Versorger, Vermieter, …). Ich habe versucht, die Anzahl der Ordner gering zu halten.

Alle anderen Dateien, die nicht in den o.g. Ordnern abgelegt werden, werden nach Jahren abgelegt.

Gruß Michael

1 „Gefällt mir“

So jetzt hab Ich auch mal mehr Zeit am Rechner.
Ich bin zu 95% Sporadisch mit dem Smartphone hier tätig in Leerlaufphasen im Job, deswegen auch meist kurz angebunden und selbstverständlich ist das Handling auf selbigem alles andere als komfortabel in der Chrome-App.

An und für sich ist das immer schon eine ungeschriebene Regel in Fören/Communitys auch mal selbst die SuFu zu bemühen um genau die gleichen wiederkehrenden Themen zu minimieren…
Wenn man dann doch nicht weiter kommt ist das was anderes wenn der Wille da war.

Du kannst jederzeit mit Acrobat Reader auch auf PDF’s nur aus Bilddaten mit dem Werkzeug Texte setzen und Positionieren… Daher braucht man diese „Ausfällbarkeit“ aus den PDF’s Formularen so nicht zwingend.
Denke das könnte vom OCR-Prozess zerstört werden, setzt im Test Voraus das man OCR deaktiviert bei Dokumenten die eh schon digital sind oder OCR-Daten besitzen.

Hierzu testweise mal das hier lesen Link
und „PAPERLESS_OCR_MODE=skip“ setzen in der Config.

Ich hab bei mir in den Speicherpfaden folgendes definiert unter Automatisch

{document_type}/{correspondent}/{created_year}/{document_type}/{created_month_name_short}/{title}

Hierzu den ersten Link im Initialpost gut durchlesen … du kannst hier sehr viel Ordnung rein bringen… aber auch viel Chaos.
Aber das gute ist es werden die Dateien nur immer verschoben bei Änderungen.
Du kannst dort beliebige Ordner setzen wie du es brauchst.
Und noch ganz WICHTIG !!!
Der Media Ordner ist ausschließlich für Paperless und nicht für den USER.
Änderungen dort führen unweigerlich zu inkonsistenten Datensätzen in der Datenbank was einen Export unmöglich macht u.U.

Wenn du damit arbeiten möchtest mach nen Einwege Sync oder ein Backup wo anders hin.

Bei mir dreht sich alles um den Dokumententyp und dann erst um den Korrespondenten … der Grund war das mir anders rum die Ordner zu viele waren.

Meine oberste Schicht ist diese hier.
Darunter kommen alle Korrespondenten ( Behörden, Banken usw. )

@DiskStation:/volume2/docker/paperless-ngx/media/documents$ ls archive/
Bescheinigung      Kreditkartenabrechnung  none      Versicherung
Gehaltsabrechnung  Mietsachen              Rechnung  Vertrag
Kontoauszug        Mitteilung              Urkunden

Wie du jetzt um die Flüchtlinge deine Struktur aufbaust musst du selbst rausfinden.
Wenn du es wie unten machst, dann hast du im Notfall einen Ordner je Flüchtling/Familie.

So z.B.

Nachname_Vorname/{document_type}/{correspondent}/{created_year}/{document_type}/{created_month_name_short}/{title}
1 „Gefällt mir“

Danke für die ausführliche Antwort.
Zu meinem Problem, dass Paperless die ausfüllbaren PDFs irgendwie nicht mehr aufüllbar macht habe ich leider noch keine Lösung. (Außer, die PDFs nicht mehr in Paperless zu speichern, sondern außerhalb, damit sie immer ausfüllbar bleiben).
Dein Link und der Tipp bzgl. „skip“ war ein guter Einsatz, aber „skip“ ist die Default-Einstellung (The default is skip, which only performs OCR when necessary and always creates archived documents.)
Sprich es muss wahrscheinlich irgendwie an der Art der Speicherung liegen, dass die PDFs nach dem import in Paperless nicht mehr ausfüllbar sind.
Gibt es vielleicht eine Möglichkeit Paperless zu sagen, dass es mit einer PDF absolut gar nichts macht, außer das vorhandensein in die DB einzutragen? Das könnte helfen.

Danke für die Tipps und Hinweise bzgl. der Verzeichnisstruktur. Mir ist bewusst, dass händisch auf /archive nur lesend zugegriffen werden sollte.
Ich denke ich werde es ähnlich wie Du machen, derzeit glaube ich, dass ich einfach nur „{document_type}/{correspondent}/{created_year}/{title}“ benutzen werde. Meine Titel werde ich händisch vergeben in dem Format: „YY-MM-DD_documenttyp_correspondent_vielleichtnochetwas“. Das, so denke ich, sollte eine halbwegs brauchbare Struktur ergeben, welche nicht zu verschachtelt ist.

LG

Die zwei Ordner haben einen Sinn.
archived sind die unveränderten und im anderen sind die veränderten Sinne von OCR oder so.
PDF/a sind glaub ich diese Archived Documents die das nicht unterstützen.

Wie wäre es wenn du die Formulare als Blanko Extern speicherst und nur die ausgefüllten konsumierst ?

Diese PDF Formulare machen auch übrigens immer schon Probleme nach dem Speichern und erneutem bearbeiten.
Liegt vielleicht auch daran wie diese erstellt wurden.

@Stefan hast du da eine Idee wegen seinen Dokumenten ?

Den Dokumentennamen kannst du auch automatisieren auf Basis der Metadaten die vorhanden oder hinzugefügt werden ändern.

Du kannst dir immer auch das Original herunterladen, das dann auch bearbeitbar ist, wenn es das vorher war.

Beim Download einfach auf das kleine Dreieck drücken, dann kommt die Option.

1 „Gefällt mir“

Danke Stefan, das ist eine gute Notlösung!
Schöner wäre es, wenn ich ihm irgendwie sagen könnte, dass er manche PDFs hal gar nicht selbst abspeichern, sondern nur in die Datenbank eintragen soll, aber ok, mit deinem Workaround komm ich erstmal klar :stuck_out_tongue:

Danke Michael, ich glaube genau so mache ich es. Ich habe jetzt einige Tage darüber nachgedacht, und eine Verzeichnisstruktur die mit Korrespondent und/oder Dokumenttyp auf der obersten Ebene beginnt, wird später irgendwann unübersichtlich oder, so man mal mehrere unterschiedliche Dokumenttypen aus der Verzeichnisstruktur ziehen muss, kann es aufwendig werden.
Daher werde ich ähnlich wie du nach Themenbereichen sortieren (z.B. Versorger, Wohnung, Arbeit, Finanzen, Projekte usw.)

Danke nochmal für deinen Beitrag!