Wie bereits in diesem Beitrag erwähnt, gibt es ab der Version 2.11 von paperless-ngx offiziell Support für gotenberg 8, einen Service, der es euch ermöglicht, auch Office-Dokumente (Word, PowerPoint, EML-Email, …) zu konsumieren.
Hier möchte ich nun eine kurze und knappe Anleitung geben, wie ihr die Version von gotenberg aktualisieren könnt, sofern ihr es nutzt.
Grundlagen
Zunächst einmal kurz und knapp zusammengefasst, was tika und gotenberg überhaupt machen: Vereinfacht gesagt konvertieren sie eure Office-Dokumente in PDFs, die wiederum von paperless-ngx nativ eingelesen werden können.
Konfiguration und Installation gotenberg 8.7
Damit das funktioniert, müssen tika und gotenberg als zusätzliche Services in eurer docker-compose.yml von paperless-ngx registriert werden. Wie das geht, habe ich bereits vor einiger Zeit hier beschrieben (und natürlich ausführlich in der paperless-ngx Masterclass, wo auch eine fertige docker-compose.yml für tika und gotenberg zum Download bereitsteht).
Diese Konfiguration müssen wir nun so anpassen, dass gotenberg in der aktuellen Version 8.7 angezogen wird.
Dazu wechseln wir zunächst über SSH in das Verzeichnis, in dem paperless-ngx seine docker-compose.yml liegen hat.
Wenn du meinen Anleitungen folgst und das Ganze auf einem Synology-NAS installiert hast, findest du es dort:
# In SSH-Session (Pfad spezifisch für Synology auf Volume 1)
cd /volume1/docker/paperless-ngx/config/
Anschließend fahren wir paperless-ngx und die zugehörigen Services herunter (wichtig, sonst bleibt gotenberg 7 am Laufen!):
sudo docker-compose down
Jetzt ändern wir den Teil der docker-compose.yml ab, der gotenberg registriert:
version: "3.4"
services:
broker:
...
db:
...
webserver:
...
gotenberg:
# Hier statt Version 7.x nun 8.7 eintragen:
image: docker.io/gotenberg/gotenberg:8.7
restart: unless-stopped
# The gotenberg chromium route is used to convert .eml files. We do not
# want to allow external content like tracking pixels or even javascript.
command:
- "gotenberg"
- "--chromium-disable-javascript=true"
- "--chromium-allow-list=file:///tmp/.*"
tika:
image: ghcr.io/paperless-ngx/tika:latest
restart: unless-stopped
volumes:
...
Anschließend die docker-compose.yml speichern und über
sudo docker-compose pull
sudo docker-compose up -d
die neuen Images herunterladen und die Container starten.
Fertig! Jetzt könnt ihr mit der neuesten Version von gotenberg eure Office-Dokumente konsumieren.
Fazit
Ich habe es auf meinen Test-Instanzen getestet und war vor allem von der Geschwindigkeit der Konvertierung sehr beeindruckt. Mittlerweile läuft es auch auf meiner Produktiv-Instanz problemlos.