Performancegrenzen von paperless-ngx

Hallo Leute,

ich glaube nicht, dass das Thema irgendwann im privaten Umfeld wirklich mal Thema wird, aber mich würde mal interessieren ab welcher Größe (Größe der DB, Anzahl Dokumente, etc) paperless-ngx bzw. postgresql an Grenzen stößt und es weniger performant wird. Da einige paperless anscheinend auch im gewerblichen Umfeld nutzen, lässt sich dazu vielleicht ein bisschen mehr sagen, da hier wohl das gespeicherte Dokumentenvolumen etwas größer ausfallen dürfte.

Hallo!
Ich habe bei der Umstellung meiner PDF-Ablage im Dateiverzeichnis auf paperless-ngx ziemlich ausgemistet, es sind aber immer noch über 9000 Dokumente mit insgesamt 231 Mio. Zeichen. Hier sind neben den üblichen Dokumenten auch diverse Jahrgänge von Fachzeitschriften abgelegt.

Eine Volltextsuche über alle Dokumente benötigt bei mir ca 10 Sekunden, was meiner Meinung nach ok ist.
Eine Auswahl z.B. nach Korrespondent oder Tag wird praktisch sofort angezeigt.

Allerdings habe ich auch einen halbwegs potenten Rechner auf dem das läuft:

  • Mini-PC mit Core i3-1220P (max 4,4GHz) mit 10 Kernen und 16GB RAM
  • Speicherung auf einer Samsung SSD
  • Betriebssystem UNRAID
  • Stromverbrauch: ca 16W (laut USV)

Paperless-ngx läuft hier aber nicht alleine, es laufen insgesamt 19 Docker Container auf dem System.

Ich habe das zuerst auf einem Raspberry Pi 4 mit 8GB ausprobiert, der war allerdings viel zu schwach.

Aufgrund der Vielzahl der Dokumente habe ich aber den stündlichen Trainingslauf in die Mittags und Abendzeit verlegt, da dieser dann den Dokumentenimport jeweils für eine Viertelstunde blockiert hat.

Das kann ich bestätigen. Ich habe aktuell 9000 Dokumente (E-Mail Archiv) auf der Synology DS224+ und es braucht 7-8 Sekunden bei einer Volltextsuche. Für einen privaten Anwender ist das absolut ausreichend.