Dokumentenbenamung - Z.B. Bankkontonummer in Namen einbauen

Hallo,

ich bin mit meinen Tests ein gutes Stück weiter gekommen.
Ein Thema an dem ich gerade noch hänge ist, dass ich in einigen Dokumentennamen beim umbenennen eine Nummer wie Vertragsnummer, Kontonummer, … einbauen möchte.

Aktuell ist mein Ansatz so, dass ich unterschiedliche Speicherpfade angelegt habe.
Hier als Beispiel für das Thema Banken:
Der Speicherpfad sieht aktuell so aus:

Banken/{correspondent}/{created}_{correspondent}_{document_type}

Ich habe unterschiedliche Konten bei unterschiedlichen Banken. Ich habe aber auch bei einer Bank mehrere Konten. Wenn ich nun von einer Bank, bei der ich zwei Konten habe den monatlichen Kontoauszug bekomme, dann habe ich nach dem Namensmuster zwei gleiche Dateinamen für unterschiedliche Bankkonten.

Daher möchte ich gerne die Kontonummer mit in den Dokumentennamen rein bringen.
Ich könnte für die Kontonummer ein Benutzerdefiniertes Feld „Nummer“ anlegen und den Namen so aufbauen:

Banken/{correspondent}/{created}_{correspondent}_{document_type}_{Nummer}

Allerdings unterstützt Paperless NGX (so weit ich es heraus gefunden habe) keine Benutzerdefinierten Felder in der Namensgebung.

Eine wohl funktionierende Möglichkeit wäre es, die Nummer in einen Tag zu packen und dann die Tags in den Namen einzubinden.
Das finde ich aber auch nicht Ideal, da es zum Beispiel auch Tags wie Steuer_2023, … gibt. Die Dateinamen würden dann häftig aufgebläht.

Dritter Gedanke, der mein Können dann übersteigt und ich mir nicht sicher bin ob ich das richtig verstanden habe: Es gibt die Möglichkeit in Paperless NGX Automatisch andere Prozesse anzustoßen, die erledigt werden, bevor der eigentliche Ablauf von Paperless NGX startet.
Hier wäre der Gedanke, einen anderen OCR-Prozess anzustoßen, der überprüft, ob eine entsprechende Nummer in dem Dokument drin ist und dann die Datei nach dieser Nummer umbenennt.
In dem Fall könnte ich an meine Namensdefinition {title} anhängen.

Zusammengefasst:
Mit den Bankkonten war das jetzt ein Beispiel. Ein anderes, wo ich die Nummer gerne im Namen hätte, wären Vertragsnummern bei Versicherungen.

  1. Sieht jemand eine Möglichkeit, doch ein benutzerdefiniertes Feld automatisch in den Namen zu bringen?
  2. Möglichkeit 2 würde gehen, finde ich aber nicht sehr toll
  3. Sieht jemand eine Möglichkeit, soetwas zu implementiere?
    Ich könnte mir Vorstellen, dass eine automatisierte Umbenennung separat mit Tools wie Hazel auf dem Mac funktioniert. Dann ist es aber nicht richtig in den Workflow integriert und würde z.B. nicht funktionieren, wenn ein Dokument aus einer EMail konsumiert wird.
  4. Was sind eure Vorschläge / Euer vorgehen z.B. im konkreten Fall der Bankkonten? (Ich denke, das Thema haben mehrere)

Danke für Euer Feedback

Wenn ich mich richtig erinnere kannst du auch normalen Text mit rein schreiben… Das macht’s dann einfacher :wink:

Hallo Mrob,
ich habe gestern abend an dem gleichen Thema experimentiert.
Bei mir habe ich mehrere benutzerdefinierte Felder angelegt, wie etwa Projekt, aktuell (ja/nein), Gewerk.
Leider habe ich festgestellt, dass man

  1. nicht gezielt in diesen Feldern suchen kann
  2. Diese nicht in die Speicherpfade „eingebaut“ werden können
    Für mich ist das aktuell der Grund, warum ich mit Paperless nur „spiele“ und es noch nicht für unsere Firma nutzen kann.

Ich warte sehnsüchtig auf diese Funktionen und freue mich, wenn jemand Informationen zu dem Thema hat und diese hier postet. (Vielleicht liege ich ja falsch und habe die Möglichkeiten hierzu einfach nicht entdeckt.
Sebastian

Warum erstellt du nicht für jedes Bankkonto/jede Versicherung einen Unterordner und lässt anhand der Nummer die Dokumente entsprechend im Pfad abspeichern? Damit könntest du auch die Nummer im Dokumentnamen platzieren. Oder habe ich jetzt gerade einen Denkfehler? :thinking:

Konten zu trennen ist nicht so einfach da Kontonummern auch in anderen Dokumenten auftauchen…
Ebenso tauchen deine Kundennummern vom TK-Dienstleister ebenfalls in den Auszügen auf.

Ich habe es dann aufgegeben und hab die KI trainiert die das mittlerweile gut macht.

Mann könnte versuchen diese aufgrund des Dateinamen zu sortieren, damit hab ich aber bisher nichts gemacht.

Danke für eure Antworten,

@Illumination : Das hatte ich erst auch überlegt. Ich finde es aber zu Aufwendig, die Dokumente immer in ihre Unterordner einzusortieren.

Ich habe aber eine Lösung gefunden, die denke ich für mich funktioniert. Das muss ich jetzt nur noch weiter testen.

Nachteil bei dem Vorgehen:
Ich muss für jedes Bankkonto, Versicherung, Vertragsnummer, … wo ich die Nummer im Vertrag haben will, einen eigenen Arbeitsablauf anlegen.

Vorgehen:
1.0: Speicherpfad anlegen. Beispiel:
Marco/{correspondent}/{title}/{created_year}-{created_month}-{created_day}_{correspondent}_{document_type}_{title}

Anmerkung:
So werden für Versicherungen, Verträge, … drei Pfade angelegt.
Einer für Unterlagen meiner Partnerin
Einer für Unterlagen von mir
Einer für gemeinsame Unterlagen.
Dann wird es noch weitere Speicherpfaddefinitionen geben, die in den 3 Hauptordnern jeweils Unterlagen nach Dokumententyp ablegen.
Beispiel:
Diana/Rechnungen, …
Marco/Rechnungen, …
DiMa/Rechnungen / DiMa/Dedienungsanleitungen, …

… nun weiter …

2.0: Arbeitsablauf anlegen
2.1: Neuen Auslöser → „Dokument hinzu gefügt“ anlegen.
Hier über das Regelwerk (Name, Inhaltsfilter) sicher stellen, dass es sich um ein entsprechendes Dokument handelt, bei dem es sich um den entsprechenden Vertrag, das Bankkonto, … handelt. Es muss z.B. der Name des Korospondenten und die Vertragsnummer enthalten sein.
2.2: Aktion → Zuordnung erstellen.
2.3: Unter Titel Zuweisen „die Nummer“ - z.B. Bankkonto angeben.
2.4: Unter Corrospondent den Korospondenten eintragen, der ja durch Schritt 2.1 in diesem Ablauf fest definiert ist.
2.5: Unter Speicherpfad zuweisen den vorher entsprechenden Speicherpfad zuweisen.

Wenn ich jetzt ein entsprechendes Dokument importiere, dann wird es unter
Marco/BANKNAME/KONTONUMMER/2024-02-09_BANKNAME_{document_type}_KONTONUMMER
abgelegt.

Was ich jetzt mit der Zeit noch sehen muss:

  • Wird der Dokumententy (z.B. Konoauszug oder Jahresabrechnung, … ) über den Lernalgorythmus mit der Zeit automatisch erkannt und eingetragen?
  • In diesem Beispiel geht es um die Lösung, per Arbeitsablauf die Dokumente konkret zu einem Bankkonto / Vertrag abzufragen.
    Wenn ich aber als Beispiel mit der Bank davon ausgehe, das ich dort zwei konten habe, dann muss ich für Konto A zu Anfang abfragen, ob sich das Dokument auf Konto A und NICHT auf Konto B bezieht.
    Auf der anderen Seite muss ich für Konto B sicher stellen, dass es sich nur um B und NICHT um A handelt.
    Dann bedarf es noch eines dritten Arbeitsablaufes, welcher für allgemeine Schreiben zuständig die sich entwerder auf keines der Konten speziell oder auf beide Konten bezieht.

Bezüglich der ordentlichen abfrage auf Konto A, B oder Allgemein möchte ich mich noch mehr mit den RegExpressions auseinander setzen. In Der Paperless Doku selbst gibt es da ja leider keine Info zu. Habe schon mal versucht, ein paar RegExpr. von Chat GPT ausgeben zu lassen und habe diese bei regex101.com getestet. Das hat auch nicht ganz auf Anhib geklappt, Es gab aber zumindest eine Basis, mit der ich arbeiten konnte :slight_smile:

Dann hätte ich eine schöne Ablagestruktur und Dateibenamung, mit der ich auch dann noch Dokumente wieder finde, wenn ich aus welchem Grund auch immer nicht mehr über Paperless NGX auf die Dokumente zugreifen kann.

Eine Frage an Euch, wenn da schon Erfahrung besteht: Lässt Paperless NGX auch bei über Arbeitsabläufe einsortierte Dokumente seinen Lernalgorythmus laufen, wenn so wie hier erst noch kein Dokumententyp zugeordnet ist?
Und bei Tags dann entsprechend auch?

Wie ist aus der Erfahrung heraus eure Meinung zu dem Vorgehen?

Ich gehe stark davon aus aber habe auch keine Glaskugel.

Bei mir Allgemein musste ich immer wieder Korrigieren und mittlerweile gar nicht mehr.

D.H. wenn du den kleinen künstlichen I-Tüpfelscheißer richtig angelernt hast sollte er das so machen wie du es gerne hättest.
Die KI ordnet dir alles zu, Speicherziele, Dokumententypen, Tags und vermutlich sogar auch User usw.

Einfach ausprobieren und immer wieder mal stück für stück alte KOPIEN ( nicht die Originale ) zum testen und lernen verfüttern und gucken wie weit es klappt.

1 „Gefällt mir“

Jetzt bin ich doch noch mal in ein Thema bei der Dokumentenbenamung und Verschlagwortung rein gelaufen.

Und zwar frage ich in dem Workflow zu Anfang das Dokument auf bestimmte Stichwörter in dem Dokument ab. Wenn die Agfrage passt , weise ich im Workflow folgende Informationen zu:

  • Dokumententitel (Kontonummer)
  • Dokumententy (Kontoauszug)
  • Korrospondent (BankXY)
  • Speicherpfad zu (siehe folgend)

Die Speicherpfaddefinition sieht so aus:
Marco/{correspondent}/{title}/{created_year}-{created_month}-{created_day}_{correspondent}_{document_type}_{title}

Der resultierende Dateiname eines Kontoauszuges sieht dann entsprechend so:
2022-09-01_BankXY_Kontoauszug_08151234567

Nun das Problem, auf das ich gestoßen bin:

Ich wollte den Kontoauszug an sich an dem „Created-Datum“ fest machen, dass ich auch an den Anfang des Dateinamens gehangen habe.
Allerdings ist das Datum nicht immer gleich dem Monat, für den der Kontoauszug ist.
Zum Beispiel, wenn es sich aus welchem Grund auch immer um eine verspätete Ausstellung des Dokumentes handelt, oder um einen Nachtrag / eine Aktualisierung zu einem vorherigen Dokument.
(Dieses Thema habe ich zwischendurch auch bei Gehaltsabrechnungen. Da gibt es manchmal auch Nachträge, so dass ich zu einem Monat 2 Abrechnungen habe.)

Habt ihr eine Idee, wie ich noch den passenden Monat des Kontoauszuges in das Dokument rein bekomme?
Hatte erst überlegt, noch einen Monatstag zu erstellen. Also Jan, Feb, März, … und die dann noch entsprechend den Dokumenten mit zuzuordnen. Allerdings finde ich das keine all zu schamante Lösung.

Das Problem in das du hier hinein läufst hat jeder der Dokumente nachträglich archiviert.
Da bleibt dir nur Manuel größtenteils das Created Date per hand zu setzen oder zu hoffen die KI erkennt das Datum richtig via OCR.

Ich hol alle paar Wochen die aktuellen Rechnungen und Kontoauszüge gesammelt und setze das Datum direkt per Hand.

Du kannst vielleicht noch n Filter laufen lassen und hoffen es filtert wenigstens 50:50 raus.

Hab zumindest im Moment keine Lösung parat.