Index geht kaputt, (wenn man neuen Tag einführt?)

Hallo!

Die gespeicherten Suchen gehen öfter mal ins Leere, weil der Index kaputtgegangen ist.

Den Grund für die Zerstörung des Indexes kenne ich nicht.

Ich weiß nur, dass es unter Anderem wiederholt auch im zeitlichen Zusammenhang mit der Einführung neuer Tags passiert ist. Ich werde das mal zu reproduzieren versuchen. Heute habe ich den Tag “Vorname” angelegt. Kurz darauf hat meine gespeicherte Suche

Erweitert: title:Praefix_*

nicht mehr funktioniert.
Nach einem vollständigen Reindex klappt sie dann wieder.
Aber ich mag nicht immer wieder mal einen vollständigen Reindex ausführen müssen, weil der 20 Minuten dauert und unsere Mitarbeiter in der Zeit nicht mit ihren gespeicherten Suchen Arbeiten können.

Neuerdings kommt mit dem Reindex eine weitere Komplikation hinzu - wieder nur ein zeitlicher Zusammenhang, ohne dass ich die genaue Ursache kenne: Das data bzw. data/index-Verzeichnisse gehört plötzlich root, und paperless kann nicht mehr schreiben.

Das ist vor Wochen mal passiert. Da war ich schuld. Ich habe versehentlich einen Docker/Paperless-Befehl in einem sudo-Fenster ausgeführt. Seitdem passe ich auf.
Gestern und heute ist es aber wieder passiert, obwohl ich seit mindestens einer Woche nicht mehr als sudo etwas gemacht habe. In beiden jüngeren Fällen lief unmittelbar vorher ein vollständiger Reindex.

Das mit den Berechtigungen lässt sich jedesmal mit

docker compose exec -u root webserver chown -R 1000:1000 /usr/src/paperless/data/index/

lösen. Besser wäre es natürlich, es würde gar nicht erst wieder auftreten.

Gruß
Andreas

Das klingt für mich wirklich nach einem Serverproblem bei dir.

Ich habe auch deinen letzten Post zum Anlass genommen, ein Testsystem mit über 50.000 Dokumenten aufzusetzen (ca. 2000 Wörter pro Dokument, zufällige Wörter aus dem Lorem Ipsum). Zwar sind die einzelnen Dokumente recht klein, weil es keine Scans sind, aber für die DB ist das relativ egal, da kommt es fast nur auf die erkannten Inhalte an.

Ich lade dich gerne ein, auf das Testsystem (läuft auf einer Testinstanz unserer paperless-cloud.com) zuzugreifen und Performance-Tests durchzuführen (neue Dokumente hinzufügen, suchen, etc.). Bei Interesse sag gerne kurz Bescheid, dann sende ich dir eine Mail mit den Zugangsdaten.

Hallo,

das klingt sehr interessant.

Ja, danke, gern.

Gruß

Andreas

Sehr gerne! Du hast Post (E-Mail). :wink: