Ordnerstruktur, Eigentümer und Berechtigung

Hallo Forum,

ich habe auf meinem NAS Freigaben mit den Namen der Familienmitglieder und Gruppenverzeichnisse für Gruppen, wie Eltern, Kinder, usw…

Name1
Name2
Name3
Name4
Name5
Name6

Gruppe1 // Name1 und Name2
Gruppe2 // Name1 und Name3 und Name6
Gruppe3 // Name3 und Name4

Meine Idee war nun, dass ich den OWNER nutze um Verzeichnisse im NAS zu nutzen, sodass die Dokumente beim jeweiligen OWNER = NameX abgelegt werden.

PAPERLESS_FILENAME_FORMAT={owner_username}/{correspondent}/{created_year}/{created_year}{created_month}{created_day}-{correspondent}-{document_type}-{owner_username}-[{tag_list}]

Das funktioniert soweit auch im ersten Schritt :slight_smile:

Name1/Mobilfunkprovider1/2023/Document.pdf
Name1/Mobilfunkprovider1/2024/Document.pdf
Name1/Mobilfunkprovider2/2024/Document.pdf
Name1/Bank1/2024/Document.pdf
Name1/Bank2/2023/Document.pdf
Name1/Bank2/2024/Document.pdf
Name2/Mobilfunkprovider2/2023/Document.pdf
Name2/Mobilfunkprovider2/2024/Document.pdf
Name2/Bank3/2024/Document.pdf

Mit den Gruppen habe ich das Problem, dass es die ja gar nicht als OWNER gibt.
Wie löst ihr so was?

Im Moment stehen diese Dokumente im Verzeichnis dessen, der die Dokumente eingelesen hat (Admin oder ich) oder eine Ebene höher also parallel zu den OWNERN. Beides ist doof.

Gruppe1/DSLprovider/2023/Document.pdf
Gruppe1/DSLprovider/2024/Document.pdf
Gruppe1/Bank4/2023/Document.pdf
Gruppe1/Bank4/2024/Document.pdf

BERECHTIGUNGEN:
Die Berechtigungen mache ich so, dass Dokumente, die jemandem direkt zuzuordnen sind den NameX als Eigentümer setzen.

Bei Gruppendokumenten gehe ich so vor, dass KEIN Eigentümer gesetzt wird, aber als Gruppe unter Anzeige und Bearbeiten jeweils die GruppX.

Ich hatte auch (oder war es die Intelligenz von PLNGX? ) zusätzlich manchmal die den Gruppen zugehörigen Benutzer unter Anzeige und Bearbeiten gesetzt. Hatte aber soweit ich das jetzt beurteilen kann keine andere Auswirkung.

ORDNERSTRUKTUR:
Hier möchte ich, dass zusammengehörige KORRESPONDENTEN wie Banken unter Finanzen, Mobilfunkprovider unter „Telefon und Internet“, Strom- und Gasanbieter unter Energie gesammelt werden.

Das geht ja scheinbar mittels Speicherpfade. Das ist aber eine Baustelle, an die ich mich erst noch ran tasten muss.

Name1/Finanzen/Bank1/2024/Document.pdf
Name1/Finanzen/Bank2/2023/Document.pdf
Name1/Finanzen/Bank2/2024/Document.pdf
Name2/Finanzen/Bank3/2024/Document.pdf
Gruppe1/Telefon und Internet/DSLprovider/2023/Document.pdf
Gruppe1/Telefon und Internet/DSLprovider/2024/Document.pdf
Gruppe1/Telefon und Internet/Mobilfunkprovider5/2024/Document.pdf
Gruppe1/Finanzen/Bank4/2023/Document.pdf
Gruppe1/Finanzen/Bank4/2024/Document.pdf

Viele Grüße!

Moin,

das müssen wir jetzt erstmal sortieren und analysieren, weil teilweise wirr und widersprüchlich, sorry.

Ein Dokument kann nur an einer Stelle stehen. Willst du wirklich dass Dokumente, die dich betreffen, an mehreren Orten im Filesystem stehen? Und wie du selber festgestellt hast, gibt es hier kein weiteres Kriterium, wie du konfigurieren kannst, dass ein Dokument in Name1 landet, ein anderes in Gruippe2. Da sehe ich keine andere Möglichkeit als dies manuell zuzuweisen.

Das referenziere ich mal als (1).

Das ist bereits ein Speicherpfad, und zwar der defaultmäßige, der zutrifft, wenn das Dokument hinzugefügt wird. Da sehe ich schon zwei Probleme: Erstens du verzichtest auf den title, ist das so gewollt? Und durch die tags kann der Dateiname schon sehr lang werden und an die Grenze des Betriebssystems stoßen. Bedenke, dass dies ja unterhalb des PLNGX Folders ist, dessen Pfads kommt ja im physischen Pfad dann noch dazu.

Letzteres referenziere ich mal als (2).

Das entspricht schon mal nicht (1), es sei denn du subsummierst alles andere als Document. und ganz ehrlich, hat jeder seinen eigenen Mobilfunkprovider, Bank und auch DSL Provider? So wie du das aufdröselst hast du letztlich nur noch ein oder zwei Dokumente im Pfad. Ich verstehe den Wunsch, eine Backuplösung zu haben, falls PLNGX mal nicht will. Denke nochmal drüber nach, ob du das wirklich so fein granular haben willst. Insbesonders die Gruppen sorgen dafür, dass zB meine Dokumente dann über zig Ordner verteilt sind.

Gar nicht, weil hab ich so nicht. :slight_smile: Ansonsten sehe ich nur die manuelle Zuweisung zum Speicherpfad.

Berechtigungen in PLNGX sind ja ok, aber diese dann auch in der Ordnerstruktur ablegen? Wie gesagt, ich sehe hier nur eine manuelle Möglichkeit, und Menschen machen Fehler. Du hast jetzt schon jede Menge Aufwand, und je mehr Aufwand und manuelle Pflege du hast, desto mehr Fehler werden sich einschleichen.

Das ist jetzt Speicherpfad (3), aber wenn du sas anwendest, warum machst du dir dann die Arbeit (1) und (2)?

Einen Oberbegriff einzuführen erfordert Arbeitsabläufe und darin Pfadzuweisungen. Damit machst du das, was (1) gemacht hat zunichte.

Das kann man auch automatisch lösen. Dazu konfiguriert man PLNGX so, dass es den consume Ordner rekursiv durchsucht. Legt man dann im consume Ordner Subfolder an (ich nehm nur mal zwei Oberbegriffe) nach dem Motte
./Wohnen
./Finanzen

So kann man den Namen des Subfolders herausgreifen, diesen in den Speicherpfad aufnehmen und automatisch zuweisen. Ist aber entsprechende Wartungsintensiv, denn ein neuer Oberbegriff bedingt dann auch die Anpassung der Speicherpfade und der Arbeitsabläufe. Je nachdem in welchen Subfolder im consume Verzeichnis du das Dokument schickst kannst du den Foldernamen als Oberbegriff in den Pfad einfügen. Gehst du diesen Weg, ist (1) überflüssig.

Bitte mach dir erstmal Gedanken ob du die Gruppen im Dateinamen wirklich haben willst, ob du auf den title wirklich verzichten willst und ob du Oberbegriffe haben willst und wenn ja wie die aussehen. Dann käme (1) nämlich erstmal weg. Zusätzlich bitte drüber nachdenken, ob die Tagliste (und ich hab die Befürchtung du wirst sie sehr intensiv nutzen) Sinn macht.

Das Risiko dass PLNGX (bei dir) die Grätsche macht, ist nicht null. Wenn man dann noch regelmässig backups macht, ist es aber recht klein. und man sollte sich wirklich fragen, ob man alle Metadaten in den Dateinamen aufnimmt. Wenn die nämlich zu lang werden, sind die in jedem Fileabwoser eh ab einer bestimmten Postition nicht mehr sichtbar und man muss dann entweder ein sehr sehr breites Fenster zurechtziehen oder intensiv hin und her scrollen.

Hier einmal ein Beispiel für Subfolder und Arbeitsabläufe

Unterordner des consume-Verzeichnisses nutzen

Vielen Dank für deine Gedanken hierzu!

Zu (1)

Nein, ich möchte meine Dokumente bei mir haben und die, die mehrere betreffen in einem Verzeichnis das eben mehreren gehört.
Wofür sind sonst die Gruppen, wenn nicht um mehrere Nutzer zusammen zu bringen um gemeinsam Dokumente im Zugriff zu haben?

So wie ich den Titel verstanden habe, ist der der Name der ursprünglichen Datei. I.d.R. eines gescannten Dokuments mit einem schrecklichen Namen.
Durch PAPERLESS_FILENAME_FORMAT wird ja erst der korrekte Name (also Titel?) erstellt.

Ja, das sollte ich nochmal überdenken.

Zu (2)

Ja schon:
{owner_username} = Name1
{correspondent} = Mobilfunkprovider1
{created_year} =2023
Document.pdf = {created_year}{created_month}{created_day}-{correspondent}-{document_type}-{owner_username}-[{tag_list}]

Vielleicht ist es hier nicht nötig, {created_year} als Verzeichnis anzulegen… Aber es macht doch Sinn Bank1-Dinge getrennt von Bank2- und Mobilfunkprovider1-Dingen zu speichern. Oder machst du das alles in einem Verzeichnis?

Aber genau das ist doch wichtig, um zb. unterschiedliche Konten bei der gleichen Bank zu trennen. Wir sind alle bei der gleichen Bank. Das bekomme ich gut über die Eigentümer getrennt. Die unterschiedlichen Dokumente sind dem jeweilig korrekten Benutzer zugeordnet und liegen auch in dem korrekten Verzeichnis.
Name1/Bank1
Name2/Bank1
Name3/Bank1

Dass nun aber Name1 und Name2 zusammen Gruppe1 bilden das bekomme ich so nicht hin. Entweder liegen die Dokumente bei Name1 oder Name2, je nachdem, wer als Eigentümer eingetragen ist. Deshalb wäre hier eine Gruppe doch der richtige Weg.
Gruppe1/Bank1

Speicherpfade und Tags im Namen und überhaupt, das bringt einen Knoten im Hirn.
Vielleicht auch vom Denken her, dass nicht unbedingt mit PLNGX gearbeitet wird sondern parallel in den Verzeichnissen, um Dokumente anzuschauen.

Ich schaue mir das mal an, ob es hilft den Knoten im Hirn aufzulösen.

Danke erst mal!

Der title ist beim Scannen natürlich nichtssagend, aber den kannst du doch ändern…

Und ehrlich gesagt ich schau mir dei Dokumente nicht aus dem Verzeichnis an. Dazu kann ich in PLNGX exakt dahingehen filtern. Für mich ist eine gescheite Ornderstruktur im medua Verzeichnis schon wichtig, aber das ist für den Notfall wenn PLNGX aus welchem Grund nicht mehr mag und ist daher eher minimalistisch.

Mir wäre das mit den Gruppen viel zu aufwendig. Ich sehe keine Möglichkeit das zu automatisieren, ergo muss du jedes Dokument das in einen Gruppenfolder gespeichert werden soll, manuell bearbeiten. Wenn sich dann was ändert musst du evtl Dateien in einen anderen Folder umsetzen indem du einen anderen Speicherpfad zuweist. Mit entsprechend vielen Dokumenten, die auf einmal einer nicht mehr oder einer zusätzlich sehen soll wird das schon lästig.

Aber ist dein Setup, nicht meines :slight_smile:

Naja, ich gebe den Dokumenten ja einen Titel. der Erscheint aber nicht in PLNGX :exploding_head:

Ich fidne ein solches Forum halt super und wichtig, auch um solche Denkanstöße zu bekommen

und evtl. das Setup zu überdenken.

Ich weiß halt nicht, ob ich die Anderen dazu bekomme eben auch durchgängig mit PLNGX zu arbeiten, sollte aber das Ziel sein. zumindest interims sollte demnach die bestehende Verzeichnisstruktur weiter bestehen bleiben, weil damit kennst sich jeder her aus.
Aber das werde ich noch mal überdenken und vielleicht doch auf eine flache Struktur umschwenken, für den Fall des Falles…

Danke für den guten Input!

Viele Grüße!

Noch ein kleiner Hinweis: in den media Verzeichnissen sollte man nicht unnötig herumstochern. Wenn doch, sollten die Zugriffsrechte explizit auf nur-lesen gestellt werden. Nicht dass jemand meint, dort Dateien hin- und her schieben zu müssen, weil er meint, das gehört so. Schreibende Zugriffe jeglicher Art zerhauen dir deine Datenbank. Und auch unabsichtlich beim versehentlichen Berühren des Trackpads haben Leute schon Dateien voerschoben.

Und wenn der Titel nicht in PLNGX erscheint, dann ist was faul.

Danke für den Hinweis. Das werde ich so umsetzen, dass nur PLNGX schreiben darf.

Der Titel in PLNGX sieht so aus Untitled_20241013_195338 (split 1) obwohl das durrch PLNGX gespeicherte Dokument diesen Namen hat 20210118-Vodafone-Rechnung--[Eingang,Internet und Telefon].pdf Ja, das mit den Tags ist wahrscheinlich sinnfrei. Bin aber noch am Ausprobieren :wink:

Viele Grüße!

Nein der title ist schon richtig gesetzt. Du hast ein Dokument gespilttet, deswegen setzt PLNGX den title neu um Feilename Duplikate im Zielverzeichnis zu vermeiden.

Wahrscheinlich war das ein doofes Beispiel, wobei ja auch nach dem Split das Dokument im /archive/-Verzeichnis korrekt benannt ist.

Ein anderes Beispiel zeigt auch hier, dass der Titel in PLNGX weiterhin der des gescannten Dokuments ist
grafik

im /archive/-Verzeichnis ist der Name so wie er sein soll

grafik

Viele Grüße!

Hallo @bdream Eine kurze Zwischenfrage. Was machst Du bei diesem Beispiel mit dem Metadatenfeld Titel? Das im Foto gezeigte, ist ja wohl das von Scanner.

Gute Frage. Evtl. „nutze“ ich das Feld falsch …

Ich mache gar nichts damit, wundere mich nur, dass dort der ursprungs-Titel steht und nicht der durch PLNGX generierte.

Viele Grüße!

Welchem Speicherpfad ist diese Datei zugewiesen und wie sieht er aus?

Vermutlich kommt das „Problem“ daher, dass du Titel und Dateiname gleichsetzt.

Der Titel ist das, was dir in paperless-ngx angezeigt wird als… naja, Titel des Dokuments.

Wichtig: Titel ist nicht gleich Dateiname!
Im Gegenteil, der Titel kann sogar als Variable zur Bildung des Dateinamens herangezogen werden.

Wenn du beides gleich lauten haben möchtest, musst du bei den Arbeitsabläufen den Titel genau so setzen lassen wie im Speicherpfad den Dateinamen.

Ich habe den Speicherpfad lediglich mittels PAPERLESS_FILENAME_FORMAT zugewiesen.

Viele Grüße!

Okay, dann muss ich den Titel aus PAPERLESS_FILENAME_FORMAT noch per Arbeitsablauf dem Titel in PLNGX zuweisen, sodass nach der Verarbeitung der Titel wieder dem Dateinamen entspricht? Vor der Verarbeitung nimmt sich PLNGX doch die Datei und macht aus dem Dateinamen einen Titel - der nach der Verarbeitung nicht mehr passt.

Es sei denn man definiert es anders :slight_smile:

File name handling

By default, paperless stores your documents in the media directory and renames them using the identifier which it has assigned to each document. You will end up getting files like 0000123.pdf in your media directory. This isn’t necessarily a bad thing, because you normally don’t have to access these files manually. However, if you wish to name your files differently, you can do that by adjusting the PAPERLESS_FILENAME_FORMAT configuration option or using storage paths (see below). Paperless adds the correct file extension e.g. .pdf, .jpg automatically.

This variable allows you to configure the filename (folders are allowed) using placeholders. For example, configuring this to

PAPERLESS_FILENAME_FORMAT={created_year}/{correspondent}/{title}

will create a directory structure as follows:

2019/
  My bank/
    Statement January.pdf
    Statement February.pdf
2020/
  My bank/
    Statement January.pdf
    Letter.pdf
    Letter_01.pdf
  Shoe store/
    My new shoes.pdf

Der Filename bleibt dann erhalten auch wenn man einen anderen Speicherpfad zuweist, und der titel wird dann auch immer im Dateisystem reflektiert. und ist synchron.

PS Am ende setze ich den title in einem Arbeitsablauf am Ende des verarbeitens um zu YYYY-MM-DD_, was sich dann aich im Dateisystem nierderschlägt. Und natürlich jede Änderung durch mich auch.

Und wer intensiv mit Speicherpfaden arbeitet und die Dokumente dann eh wieder umhängt kann sich die folder im der Umgebungsvariablen sparen.

Da der Titel (Dateiname) von gescannten Dateien nichtssagend ist und ich für den Fall des Falles die Dokumente auch anhand der Bezeichnung identifizieren möchte gehe ich ja den Weg neben dem Pfad auch das Dokument umzubenennen.

Jetzt muss ich wohl noch per Arbeitsablauf diesen neuen Namen in den Titel bringen.

Viele Grüße!

In deinem Fall würde ich hier einfach nicht den Pfad angeben, sondern nur den Dateinamen. Den Pfad überschreibst du später doch sowieso.

PAPERLESS_FILENAME_FORMAT={created_year}{created_month}{created_day}-{correspondent}-{document_type}-{owner_username}-{title}

Und dann den Pfad per Arbeitsablauf zuweisem anhand von Kriterien.

Den existierenden Bestand kann man dann per retagger und renamer anpassen. Gescheiten title kriegt man dann natürlich nicht automatisiert rein.

Ob du den Aufwand treiben willst bleibt natürlich dir überlassen.

Übrigens ist die Überlegung, ob man überhaupt noch PAPERLESS_FILENAME_FORMAT in der .env angeben sollte.

Dieser ist im Gegensatz zu den Speicherpfaden nämlich nicht dynamisch. Bei Änderung der Speicherpfade werden die Dokumente automatisch verschoben, bei Änderung des Filename Formats in der .env nicht (zumindest war das bis vor Kurzem noch so).

Aktuell tendiere ich dazu, es ganz leer zu lassen und lieber Speicherpfade zu definieren.