Manchmal möchte ich für die automatische Klassifizierung komplexere Ausdrücke nutzen.
Vor allem eine Art AND NOT scheint mir zu fehlen.
Wie könnte ich sowas realsieren?
Hallo,
ja das scheint zu fehlen. Habe recht aufwendige Arbeitsabläufe konstruiert um AND und OR zu realisieren (Tag’s und Test auf reguläre Ausdrücke). Bei der Filteung der Filenamen kann man auch nicht z.B. *.png *.bmp angeben. Nur einzelne Angaben möglich.
Einstellen auf GitHub hat bisher noch keine Antwort ergeben.
Gruß Hartmut
Tatsache, dass ist ein Ärgernis, dass mich immer wieder begleitet. Ja, ich möchte komplexe Businessrules aufsetzen. Zumindest ein paar. Zuviel Komplexität ist nie gut aber es gibt einfach Cases, die einem wichtig sind oder echten Mehrwert stiften, die man gern abbilden möchte.
Mein Workaround aktuell:
Ich filtere Emails in 3 Stufen:
- Filter Rules auf Email Provider Ebene mit einer Handvoll spezifischer Ordner
- Filter Rules in Paperless
- Filter Rules in N8N auf Basis von Ordnern auf Ebene des Email Providers oder auf Basis von HTML Mustererkennung in N8N.
Ein Workflow in N8N hilft mir, spezifische Edge-Cases abzufangen, durch die Mustererkennung Dateinamen zu generieren und die Mails bzw. Anhänge erst dann in den Paperless Consume Ordner zu schieben. Das ermöglicht mir, die Anzahl absurder Rules in Paperless zu reduzieren, da ich auf Basis des Dateinamens filtern und sortieren kann.
Es ist jedoch kein vollständiger Ersatz für die fehlende AND/ OR Logik. So praktisch ich den Baustein N8N auch empfinde, ich würde gern ohne ihn fahren können.
Was vollständig fehlt, ist eine brauchbare Filterung als auch BRs auf Basis der Metadaten bzw. OCR Inhaltsdaten. Das wäre sehr, sehr brauchbar.
Selbst wenn man sich dazu hinreißen lässt, verrückt viele BRs in Paperless anzulegen - ich kann nur davon abraten. Es ist schier unmöglich, das sauber zu debuggen. Wenn ein Outcome sonderbare oder nicht zufriedenstellende Ergebnisse liefert und man sich fragt, aus welcher Rule nun zum Teufel schon wieder der falsche Tag stammt - I hear you
Man kann nur empirisch testen und den Scanvorgang so lange wiederholen, bis man einen Ablauf hat, der einem schmeckt. Sehr aufwendig. Ich würde sowas gern vorab als Testcase virtuell durchspielen können. Bei Mustererkennung gilt nämlich: stay concise! Wenn man nach Begriffen filtert, die plötzlich bei anderen Dokumenten unerwartet auftauchen, wird ein Speicherpfad oder Tag fehlerhaft zugeordnet usw. Nur Ärger.
Gute Mustererkennung ist nicht trivial - brauchbare AND/ OR, IF/ ELSE Logiken würden einen schon sehr weit bringen.
Das ist wenig ermutigend.
Ich hatte den Vorschlag auf github schonmal versucht anzubringen (genauso wie andere Ideen) aber keine nennenswerte reaktion.
Daher die Überlegung ob sowas irgendwie anders realisiert wird.
Meine GitHub-Einträge sind bisher auch nicht angesehen worden. Besonders Ärgerlich ist das bei den Tag’s. Hier geht nur OR. Ich habe mich bisher mit mehrstufigen Abfragen über (Hilfs-)Tag’s und Korrespondenten- und Dokumententypenabfragen geholfen. Das führt dann bei einem (a AND b AND (c OR d OR f)) und entsprechenden Verschiebungen zu mehr als 20 Workflows. Die Möglichkeit mehrere Auslöser und mehrere Aktionen in einem Workflow unterzubringen bring auch nur Frust, da die Auslöser auch wieder nur OR’s machen und alle Aktionen bei einem TRUE ausgeführt werden. ZU allem Überflüß wird bei n Auslösern das ganze Procedere n*n Mal ausgeführt. Auf die Frage „Weshalb“ steht die Antwort auch noch offen.
UNd dann muß man noch darauf achten, dass bei den Aktionen erst das Löschen und dann das Zuordnen kommt. Im umgekehrten Fall werden die neu zugeordneten Eigenschaften gleich mit gelöscht. Steht auch schon ein paar Wochen auf GitHub.
Ansonsten trotzdem ein, wie man heute so schön sagte, „Mächtiges Werkzeug“.
Gruß in die Runde
Und was ganz besonders fehlt, ist das (NOT a). In Workflow auch über Hilfstag’s organisiert. Muss man natürlich „Invertieren“ da ja nur ist oder ist nicht möglich ist.
Habe die Windrichtung noch nicht gefunden, wann es geht und wann es falsch läuft.
Hartmut