Proxmox LXC vs. VM für Paperless-ngx

Liebe Leute,

in den letzten Tagen habe ich, veranlasst durch ein Thema nebenan, spielerisch ein wenig getestet, wie man Paperless-ngx auf einem Rechner organisieren kann, der mit Proxmox bestückt ist.

Eine Installation habe ich in einem LXC durchgeführt. Dabei wurde Debian13 genutzt, Docker und darauf Paperless installiert. Für die andere Installation habe ich eine VM angelegt, die ich analog konfiguriert habe.

Eingelesen wurden zum Einen zahlreiche Dokumente, die ich hier ohnehin herumliegen habe. Und der ultimative Test war das Einlesen eines sehr großen Dokuments mit 2409 Seiten, nämlich der Klimareport des IPCC.

Dabei kam ich zu folgenden Ergebnissen:

  • Bei der Arbeitsgeschwindigkeit waren kaum Unterschiede fühlbar.
  • In Sachen CPU gibt es kaum Unterschiede. Wenn gerade nix zu konsumieren und auch sonst nichts zu tun ist, wird die CPU kaum belastet und es bleibt dann genügend Leistung für andere Dinge übrig, die auf diesem Gerät laufen.
  • Bei RAM schneidet der LXC angenehmer ab. Bei Inaktivität wird der zugewiesene RAM vom LXC freigegeben und kann in diesen Situationen von anderen LXCs oder VMs genutzt werden. Eine VM beansprucht den RAM dauerhaft, auch wenn Paperless nix zu tun hat.
  • Die VM ging in der Disziplin “Festplatte” leider k.o.
    Anfangs sind kaum Unterschiede feststellbar. Doch in jedem Haushalt, in jedem Unternehmen kommen immer wieder neue Dokumente, Briefe und Rechnungen neu dazu. Die Daten verbrauchen immer mehr Platz. Irgendwann ist jedes Volume mal voll. Kein Problem! In Proxmox kann ich die “Ressource” aufrufen –> “Volume-Aktion” –> “Größe anpassen” und das Volume um zwei oder drei GB vergrößern. Das reicht dann wieder eine Weile.
    Nun die Unterschiede: In einem LXC wird die Vergrößerung umgehend wirksam. Der Befehl df-h macht die Veränderung sofort sichtbar. Nichtmal ein Neustart ist erforderlich. Ganz anders in einer VM. Das Volume kann zwar vergrößert werden, doch das Linux in der VM bemerkt diese Veränderung nicht. Hier muss erst die Partition vergrößert werden, bevor Paperless die zusätzlichen GB nutzen kann. Da ich keinen Bock auf parted und dieses Geraffel hatte, habe ich meine Spiel-VM einfach gelöscht und großzügig neu angefertigt.
    In einem Unternehmenskontext halte ich diesen Unterschied für sehr relevant.

Tja, auch wenn Stefan im anderen Thema die Nutzung einer VM empfohlen hat, kann ich diese Empfehlung nicht unterstützen. Möglicherweise ergänzt er mal an dieser Stelle, welche Vorteile er für den Einsatz einer VM noch anbringen kann.
In meinem Vergleich ist der LXC der eindeutige Testsieger.

Pfiffikus,
der ganz sicher den einen oder anderen Aspekt übersehen hat

Aus reiner Neugierde…

Wie lange braucht dein Setup für die Verarbeitung des Reports ?

Lasse gerade mal nen Import auf meinen 2 leeren Instanzen zum Performance-Vergleich laufen.

Ugreen 2800 vs nen Debian Setup mit Intel Celeron N5105.
Zeitmessung aufgrund des Protokolls.

Diese Frage scheint mir sehr interessant. Doch ich habe hier noch keine aussagekräftigen Zahlen. Proxmox wurde auf einem solchen Gerät installiert:

grafik

Als der Report verarbeitet wurde, habe ich gleichzeitig noch einige andere Dinge erledigt. Ich habe nebenbei noch andere LXCs erzeugt, verschiedene Installationen getestet und dann wieder gelöscht. Gewiss führte das zu Leistungseinbußen bei der Verarbeitung des Reports, weshalb diese Laufzeit nicht so sehr interessant sein dürfte. Dabei hat es um die vier Stunden gedauert, bis alles verarbeitet war.

In den Dateiaufgaben sehe ich:

“IPCC_AR6_WGI_FullReport.pdf 23.11.25, 13:47 Success.”

Protokoll:

… die Zeilen weiter oben im Protokoll sind nicht mehr zu sehen.

[2025-11-23 17:50:48,857] [INFO] [paperless.consumer] Document 2023-11-01 IPCC_AR6_WGI_FullReport consumption finished

Inzwischen habe ich die automatischen Backup-Jobs anders terminiert, so dass die zu testende VM oder der zu testende LXC die volle Leistung des kleinen Kastens zur Verfügung hat. Jetzt habe ich am Vormittag ein Zeitfenster frei geräumt, in dem ich diesen Test unter einigermaßen vergleichbaren Bedingungen laufen lassen kann. Jetzt werden noch im Portainer die entstandenen Volumes der Docker-Container gelöscht, um vergleichbare Bedingungen für das Wettrennen zwischen LXC und VM zu schaffen.

Pfiffikus
der sich ebenso für die Laufzeiten interessiert

Sehr guter Aspekt und Hinweis.

So, der erster Teil ist vollbracht. Bevor ich mich aus dem Haus bequemte, warf ich dem System die übliche Datei dem Paperless auf der VM zum Fraße vor. Das System war zuvor jungfräulich.

Die Uhrzeit des Beginns lese ich in den Dateiaufgaben ab.

26.11.25, 09:04	Success. New document id 1 created

Die Fertigstellung kann ich in der Logdatei erkennen. (Hoffentlich keine Zeitverschiebung wegen Sommerzeit dazwischen?)

[2025-11-26 13:43:46,216] [INFO] [paperless.parsing.tesseract] pdftotext exited 0

Sofern niemand von Euch noch Nachfragen dazu hat, würde ich diese VM in den kommenden Tagen wieder entsorgen.

Pfiffikus,
der in den kommenden Tagen eine ebensolche Zeitnahme noch einmal mit dem LXC-Paperless durchführen möchte