Gotenberg: Update auf neue Version 8

Wie bereits in diesem Beitrag erwähnt, gibt es ab der Version 2.11 von paperless-ngx offiziell Support für gotenberg 8, einen Service, der es euch ermöglicht, auch Office-Dokumente (Word, PowerPoint, EML-Email, …) zu konsumieren.

Hier möchte ich nun eine kurze und knappe Anleitung geben, wie ihr die Version von gotenberg aktualisieren könnt, sofern ihr es nutzt.

Grundlagen

Zunächst einmal kurz und knapp zusammengefasst, was tika und gotenberg überhaupt machen: Vereinfacht gesagt konvertieren sie eure Office-Dokumente in PDFs, die wiederum von paperless-ngx nativ eingelesen werden können.

Konfiguration und Installation gotenberg 8.7

Damit das funktioniert, müssen tika und gotenberg als zusätzliche Services in eurer docker-compose.yml von paperless-ngx registriert werden. Wie das geht, habe ich bereits vor einiger Zeit hier beschrieben (und natürlich ausführlich in der paperless-ngx Masterclass, wo auch eine fertige docker-compose.yml für tika und gotenberg zum Download bereitsteht).

Diese Konfiguration müssen wir nun so anpassen, dass gotenberg in der aktuellen Version 8.7 angezogen wird.

Dazu wechseln wir zunächst über SSH in das Verzeichnis, in dem paperless-ngx seine docker-compose.yml liegen hat.

Wenn du meinen Anleitungen folgst und das Ganze auf einem Synology-NAS installiert hast, findest du es dort:

# In SSH-Session (Pfad spezifisch für Synology auf Volume 1)
cd /volume1/docker/paperless-ngx/config/

Anschließend fahren wir paperless-ngx und die zugehörigen Services herunter (wichtig, sonst bleibt gotenberg 7 am Laufen!):

sudo docker-compose down

Jetzt ändern wir den Teil der docker-compose.yml ab, der gotenberg registriert:

version: "3.4"
services:
  broker:
   ...

  db:
    ...

  webserver:
   ...

  gotenberg:
    # Hier statt Version 7.x nun 8.7 eintragen:
    image: docker.io/gotenberg/gotenberg:8.7 
    restart: unless-stopped
    
    # The gotenberg chromium route is used to convert .eml files. We do not
    # want to allow external content like tracking pixels or even javascript.
    command:
      - "gotenberg"
      - "--chromium-disable-javascript=true"
      - "--chromium-allow-list=file:///tmp/.*"

  tika:
    image: ghcr.io/paperless-ngx/tika:latest
    restart: unless-stopped


volumes:
 ...

Anschließend die docker-compose.yml speichern und über

sudo docker-compose pull
sudo docker-compose up -d

die neuen Images herunterladen und die Container starten.

Fertig! Jetzt könnt ihr mit der neuesten Version von gotenberg eure Office-Dokumente konsumieren.

Fazit

Ich habe es auf meinen Test-Instanzen getestet und war vor allem von der Geschwindigkeit der Konvertierung sehr beeindruckt. Mittlerweile läuft es auch auf meiner Produktiv-Instanz problemlos.

Hallo Stefan

Auf was muss man bei den Version updates im allgemeinen aufpassen?
Du empfiehlst hier ver. 8.7. Ich hatte bereits den update auf ver. 8.8 durchgeführt und hatte offenbar Glück das es in der paperless version 2.10.2 nicht zu einem Problem geführt hat. Im Gegenteil, das mit der Geschwindigkeit kann ich nur bestätigen.
Nun stellt sich die Frage, ob ich beim Update von paperless auf ver 2.11. mit gotenberg 8.8 ein Problem bekommen könnte.

  1. Frage: Kann man bei einem release „normalerweise“ davon ausgehen, dass diese seine Dienst macht (keine BETA versionen)?
  2. Frage: Kann mann grundsätzlich alte Versionen in yml wieder aktiveren ohne die Datenbank durcheinander zu bringen? Bespiel: paperless version 2.11 wurde installiert und man geht wieder auf paperless ver. 2.10.2… Das gleiche auch mit Gotenberg…

Allgmeine Frage zur den Masterclass Kursen:
Wenn du innerhalb der Kurse updates machst, profitieren die aktuellen Kunden auch von den Updates?
Wenn ja, wo oder an was sieht man das ein Modul einen update erhalten hat? und/oder;
Gibt es entsprechend eine versions Übersicht?

Vielen Dank für die Rückmeldungen und deinen tollen Kursen :pray: :clap:

Naja, das einzige, was passieren könnte ist, dass es nicht mehr geht und du doch auf 8.7 runter musst. Da musst du aber nichts beachten (anders als beim Datenbank-Upgrade).

Ich würde es einfach probieren :wink:

Ja, ich gehe davon aus. Klar gibt es hin und wieder Bugs, aber du kannst es ja z.B. auf meiner immer aktuellen Demo testen.

Bei gotenberg geht das absolut ohne Probleme. Bei paperless-ngx selbst sollte es an sich auch gehen, ein Backup würde ich aber empfehlen. Ist ja auch in der Masterclass beschrieben.
Wenn du das Masterclass-Profil nutzt, kannst du mit dem Backup alles wiederherstellen.

Ja, jeder, der im Kurs eingeschrieben ist, bekommt alle Updates des Kurses kostenlos dazu. Eine Benachrichtigung gibt es derzeit nur manuell, wenn ich einen Newsletter dazu schreibe. Mehr ist in Planung.
Auch eine Versions-Übersicht ist geplant, zurzeit aber in der Prio weiter hinten.

Danke für dein tolles Feedback! Wenn du magst, kannst du den Kurs ja kurz bewerten, das geht unten auf der Produktseite:
paperless-ngx Masterclass

Vielen Dank für die Infos!

Das habe ich jetzt gleich erledigt. +1:

Feedback:
Bei mir klappt es mit der Version Gotenberg 8.8. Ich kann jpeg, docx, xlsx Dateien einlesen und klassifizieren.

Super, danke für dein Feedback und auch die Bewertung :wink: