Speicherpfade abhängig vom Dokumenteninhalt (hier: Jahr des Dokumentenerstellungsdatums)

Hallo,

erstmal vielen Dank für die tollen Erfahrungen mit diesem Forum!

Ich werde demnächst meinen Papierbestand mit paperless-ngx digitalisieren. Dabei hätte ich gerne eine Ordnerstruktur über die Speicherpfade abgebildet, die das Entstehungsdatum des Dokuments, genauer das Jahr des Dokumentendatums beinhalten. Der Korrespondent soll zuvor sein in der Struktur, also in etwa so:

/{correspondent}/{creation_date_of_real_document}/{title}

Den Korrespondenten kann ich ja anlegen, das sollte nicht das Problem sein. Und den Titel bekomme ich auch über paperless. Aber wie bekomme ich das Jahr aus dem Dokument? Meine Hypothese: das Datum steht entweder auf der ersten oder auf der letzten Seite eines Dokuments. Wenn es auf der ersten Seite steht, dann ist es meistens im oberen, rechten Quadranten. Außerdem können verschiedene Daten darauf stehen. Nehmen wir mal ein Rechnungsdokument: hier könnte das Bestelldatum und das Rechnungsdatum darauf sein. Relevant wäre dann das Rechnungsdatum. Da ich nun nicht den ganzen Bestand der letzten 20 Jahre digitalisieren möchte, wäre auch noch ein Date-Check sinnvoll. Das soll heißen, dass wenn ein Jahr im letzten Jahrhundert bzw. ein eben unplausibles Datum erkannt wurde, dass das dann mit eine „date_check“-Tag versehen werden soll, um es später noch zu überprüfen.

Muss ich das nun über RegEx machen und mittels des Postprocessors von Paperless? Oder gibt es eine andere Möglichkeit? In jedem Fall wäre eine genaue Einlassung wichtig, also wie muss bspw. das Skript und die zugehörigen RegExpressions aussehen und wo genau muss das Skript dann hin? Bitte also DAU-safe :sweat_smile: Falls es eine andere Lösung gibt, wäre ebenso eine genaue Anleitung, was zu tun ist, sehr willkommen. Oder habe ich ein Verständnisproblem und {created_year} macht genau das, was ich möchte? Ich habe es mal gerade probehalber mit einem Dokument probiert…

Falls ja, wäre aber immer noch der Date_Check sinnvoll. Vor allem nachher für den laufenden Betrieb, da ich ja dann vielleicht keine Dokumente digitalisiere, die älter als bspw. 90 Tage sind. Zumindest habe ich das dann immer sehr zeitnah bzw. wöchentlich/täglich vor und dann sollte das Erstellungsdatum nicht so weit vom Digitalisierungsdatum entfernt liegen.

Vielen Dank im Voraus für die Hilfe hier, ist ein tolles Forum!

Guten Morgen,

zum Thema Speicherpfade und Datum gab es mittlerweile genug Posts und Beiträge und dein zweiter Post bezieht sich ja auch irgendwie wiederum genau darauf.

https://forum.digitalisierung-mit-kopf.de/search?q=Speicherpfad

Lies dich gerne mal ein, aber ich denke nicht das das so funktioniert wie du dir das vorstellst.

Das Datum musst du im Endeffekt selbst eintragen wenns die KI nicht richtig erkannt hat… Wenn Rechnungsdatum, Bestelldatum und vielleicht noch ein Liefertermin auf dem Papier stehen wird es schwierig ohne Training der KI.

Ansonsten gibts dort noch viel Mehr Stoff zu lesen.
https://docs.paperless-ngx.com/

Manchmal lernt man einfach nur aus bloßem tun…
Zieh dir Dokument-Kopien in Paperless und fang damit an zu „spielen“ und zu verstehen wie der Hase läuft.

Solltest du dann immer noch offene fragen haben nachdem du die SuFu genutzt hast und sich dir die Fragen vielleicht selbst beantwortet hast kannst du gerne nochmal nachfragen.

P.S: dein Syntax ist leicht falsch als Speicherpfad
https://docs.paperless-ngx.com/advanced_usage/#file-name-handling

@Stefan wie stehts denn ums Thema „Schlagwörter“ hinzufügen ?