Indizierung außerhalb vom Docker/bestehendes Filesystem

Hallo zusammen,
ist es möglich, dass die Indizierung auf einem bestehenden Filesystem stattfinden kann und nicht in der Docker Umgebung? Wir würden diese gern auch für Dokumente außerhalb von Paperless NGX verwenden ohne die Ordnerstruktur (das würde mit Paperless NGX innerhalb des Dockers ja passieren) aufzubrechen.

Nein. Paperless ist nkein Mediaserver. Peaperlerss ist so aufgebnraut dass es die Dokumente konsumieret. Wei häufig sollte sonst das gesamte Feilesystem durchforstet werden um neue/geänderte Dateien aufzufinden. Man kann eine gewissen Ordnerstruktur vorgeben über SPeicherpfade, aber mit einem Verzeichnis ausserhalb der PLNGX Konfiguartion kann PLNGX nichts anfangen. Und in dieser vorgegebenen Ordnersturkur sollte man niemals nichjt auch nur schreiobend(änderned eingreifen.

Hallo und danke erstmal für das Feedback. Also beim recherchieren im Internet gibt es da geteilte Meinungen aber da ich mich noch nicht so gut mit der Materie auskenne, kann ich hier selber nicht unterscheiden. Folgendes habe ich aber gefunden:

Externe Ordner einbinden : Anstatt alles in Docker zu verschieben, binden Sie Ihre externen Verzeichnisse mithilfe von Docker-Volume-Mappings in den Paperless-Container ein. Auf diese Weise kann Paperless NGX auf Ihre Dateien zugreifen und sie dabei in ihrer ursprünglichen Struktur beibehalten

Das ist ja im Grunde genau das, was wir vorhaben. Wir möchten Paperless NGX in seiner Ursprungsform laufen lassen und über Speicherpfade (gemountete Volumes), Indizierung der Dateien in diesem Ordner in Paperless NGX durchführen um Dokumente in diesen „besonderen Speicherpfade“ ebenfalls indizieren zu können.
Klar, alles was ich in den Consume Ordner stecke, wird auch in das System gezogen und landet in irgend einer Form im Docker und hier werden wir auch mit Vorsicht vorgehen.

Wo immer das her ist ist es einfach falsch. Der einzige Ordner den PLNGX durchkämmt ist der Consume Ordner. Schreibender Zugriff der nicht von PLNGX stammt macht im besten falls nichts, im schlimmsten Fall ist das System danach im Eimer.

Den Consume Ordner kann man rekursiv dufchforsten lassen, das ist aber zu 90% der im Netz herumfliegenden yaml Datein nicht voreingestellt. Aber auch wird das Dokument konsumiert, sprich bei erfolgreichem scannen gelöscht und in die eigend Ordnerstruktur eingeordnet. Dass man einfaxh so existierende Ordner mit existierenden Dokumenten dazu linkt geht einfach nnicht, alleine schon weil PLNGX das Dokument verändert und das Original nochmals en einem anderen Ordner ablegt.

Hallo Huebi,

vielen Dank für Deine ausführliche Antwort.

Ich möchte nochmals darauf eingehen und detailliert technisch Dich fragen.

  • Es existieren mehrere SMB Freigaben für Dokumente (meist PDFs)
  • Diese Struktur soll weiterhin bestehen bleiben
  • Paperless soll diese Ordner nur lesend scannen und die Dokumente dann zur Verarbeitung im internen Ordner Archiv (die nun eine Textebene) enthalten, gern speichern
  • Das Original in einem internen Ordner nach der Erkennung nochmals zu speichern ist nicht notwendig, auch wenn dies Paperless anscheinend vom Standard her tut.
  • Wir verfolgen diesen speziellen Zweck ausschließlich zur Indizierung und Darstellung in Paperless nur bei bestimmten Ordnerstrukturen
  • Natürlich möchten wir zusätzlich die Standardfunktionalität auch benutzen.
  • Ähnliches habe ich hier heraus interpretiert: https://www.reddit.com/r/selfhosted/comments/10k4lqj/very_basic_question_to_paperless_ngx_consume_is/?tl=de

Vielen Dank für Deine Mühe!

@itservices So ist paperless-ngx leider nicht aufgebaut.

Du hast einen Ordner, den du zur Konsumierung nutzen kannst und was auch noch möglich ist, ist LESEND auf die von paperless verarbeiteten Mediendokumente zuzugreifen.

Sorry aber was genau hast du an meiner Antwort „Es geht nicht“ jetzt nicht verstanden?

Ob du eine Kopie des Originals nicht brauchst intgeressiert nicht, wie Paperless arbeitet. PLNGX ist failsafe, sprich es konsumiert die Daten nicht in irgendeiner Datebank oder in einem proprietären Format. Es legt sie in seiner Umgebung ab und zwar so, dass man evtl im Fall des Falles noch immer das Original hat.

Und : ich habe dich schon im ersten Posting verstanden. Abschliessend: Es geht nicht. Das ist meine Ansicht darüber, evtl liege ich auch falsch. Dann muss aber jemand anders antworten.

Ich danke Dir für die nochmalige Antwort.
Viele Grüße

Vielen Dank für Deine Rückmeldung.