Gelöst: Tika und Gotenberg-Fehler "Error while converting document to PDF: Server error '503 Service Unavailable' "

Hallo zusammen,

immer wieder gab es in der Vergangenheit Probleme mit der Verarbeitung von Office-Dokumenten in paperless-ngx.
Das Problem lag daran, dass der Gotenberg-Server, der als optionales Plugin genutzt werden kann, nicht erreicht wird bzw. dessen Version nicht zu der von paperless-ngx passt.

Die Lösung ist ganz simpel: Wir passen die Version von Gotenberg an, sodass sie mit paperless-ngx kompatibel ist. Ich würde euch also empfehlen, bei jedem Software-Update von paperless-ngx zu prüfen, ob auch die Version von Gotenberg aktualisiert werden muss.

Derzeit sieht es bei mir so aus (getestet, funktioniert):

Version paperless-ngx Version Gotenberg
2.4.3 7.10
2.4.3 8.0.2
2.5.0 8.0.3

Die Version von Gotenberg könnt ihr ganz einfach in der docker-compose.yml ändern:

 gotenberg:
    image: docker.io/gotenberg/gotenberg:7.10
    restart: unless-stopped
    
    # The gotenberg chromium route is used to convert .eml files. We do not
    # want to allow external content like tracking pixels or even javascript.
    command:
      - "gotenberg"
      - "--chromium-disable-javascript=true"
      - "--chromium-allow-list=file:///tmp/.*"

In diesem Beispiel ist die Version 7.10 (hinter dem Doppelpunkt hinter „gotenberg“).

Wenn ihr das geändert habt, müsst ihr die Container stoppen, einen neuen Pull durchführen und danach wieder starten:

Im Verzeichnis, in dem auch die docker-compose.yml liegt:

sudo docker-compose down
sudo docker-compose pull
sudo docker-compose up -d

Hat das euer Problem gelöst?

2 „Gefällt mir“

Hallo Stefan,

danke, dass du dir das Problem angeguckt hast. Bei mir funktioniert es leider trotzdem nicht. Ich habe immer noch die gleiche Fehlermeldung:

Test.docx: Error occurred while consuming document Test.docx: Error while converting document to PDF: Client error ‚404 Not Found‘ for url ‚http://gotenberg:3000/forms/libreoffice/convert/forms/libreoffice/convert#
For more information check: 404 Not Found - HTTP | MDN

Beste Grüße
Fabian

Hallo,
ich hatte das Problem auch 2x kurz nacheinander und in beiden Fällen hat dann ein Neustart vom NAS geholfen.

1 „Gefällt mir“

Hallo,

ich habe das Problem leider schon seit Wochen und fahre das NAS jede Nacht herunter. Daran scheint es bei mir nicht zu liegen.

Mir scheint es eher am internen DNS zu liegen weil ich gotenberg:3000 auch im Browser nicht auflösen kann.

Firewall aufm NAS deaktiviert?
Das Problem hatten nun schon mehrere.

Wichtig ist auch zu differenzieren, welcher Fehler geworfen wird:

404 ist nicht erreichbar. Darum geht es in diesem Thread nicht.
503 ist ein interner Server-Fehler (z.B. falsche Version, Gotenberg versteht nicht, was paperless von ihm will). Darum geht es in diesem Thread.

1 „Gefällt mir“

Guten Abend zusammen,

bei mir hat sich die „Problematik“ einfach durch ein Update (PULL) der Anwendung gelöst. Aktuell ist Paperless in 2.4.3 installiert und Gotenborg steht auf „latest“ in der docker-compose.yaml. Ich hatte es auch schon aufgegeben, aber nun läuft es wie von Zauberhand.

1 „Gefällt mir“

@michael.schmalzl Das habe ich auch schon ausprobiert. Leider ohne Erfolg. Es bleibt bei dem „404 Not Found“ Fehlercode.

@Stefan Da hast du Recht Stefan. Da habe ich nicht aufgepasst. Ich hatte nur gesehen, dass du diesen Thread unter meinem Thread als Lösung angepinnt hattest: gotenberg error 404

Hallo ich habe dieses Problem beim eilesen con word Dokumenter.

Error while converting document to PDF: Server error ‚503 Service Unavailable‘ for url ‚http://gotenberg:3000/forms/libreoffice/convert‘ For more information check: 503 Service Unavailable - HTTP | MDN

Hallo @Stefan,

ich würde deine Aufstellung gern ergänzen:

Version paperless-ngx Version Gotenberg
2.4.3 7.10
2.4.3 8.0.2
2.5.0 8.0.3

Diese letzten beiden Einstellungen funktionieren bei mir einwandfrei.
Gotenberg steht bei mir auf latest. 2.4.3 funktionierte nicht mit 8.0.3. Mit dem heutigen Update von PNGX auf 2.5.0 war wieder alles paletti.

VG Uwe

1 „Gefällt mir“

Leider habe auch ich wiederkehrend die 503er-Fehlermeldung, unabhängig davon, ob ich die Gotenberg-Aktualisierung auf 7.10, 8.0.2, 8.0.3 oder auf latest setze.

Sehr schade!

Peter

Bei mir leider der gleiche Befund. Ich denke da rennt etwas gegen das timeout. Ich kann es jedoch nicht weiter eingrenzen.
Hat jemand noch Ideen?

VG
Con.Vi

Ich denke, dass es sich um einen Bug handelt. Da wird bestimmt bald ein Update kommen. Ich habe das Problem auch zwischendurch…

Danke, hab ich in meinen ersten Beitrag so übernommen :slight_smile:

Das glaube ich mittlerweile auch. Zum Glück hat es bei mir für die Masterclass geklappt, sonst hätte mir das niemand geglaubt, dass es funktionieren kann :wink:

Ich habe Paperless auch mit Hilfe der Masterclass installiert und es hat sofort funktioniert.
Leider habe ich auch das 503-Problem. Auch nach dem Update auf die Gotenberg Version 8.0.3 (mit Paperless 2.5.3). Das Problem tritt aber nicht immer auf.
Mit der neuen Version von Gotenberg habe ich noch ein anderes Problem. Im PDF steht auf der ersten Seite die Mail im Textformat und erst auf der zweiten Seite im HTML-Format. Im HTML fehlen die Bilder. Es werden nur die Rahmen angezeigt, als ob die Bilder nicht gelesen werden konnten.
Mit der Version 7.1 wurde nur das HTML inklusive der Bilder angezeigt.

Hat noch jemand das Problem und kennt eventuell eine Lösung? Oder ist das ein Bug in Gotenberg?
Kann ich in der yml-Datei einfach wieder die 7.1 eintragen und mit pull die alte Version ziehen? Funktioniert mit Gotenberg auch ein Downgrade?

Paperless 2.5.3,
Gotenberg 8.1.0

Excel und Word Dokumente funktionieren ohne Probleme.
Habs grad getestet, wollte wissen obs funktioniert weil ich meisten mit PDFs arbeite.

1 „Gefällt mir“

Habe auch 2.5.3 mit 8.1.0.
Leider habe ich den Fehler trotzdem ab und zu.

hallo zusammen
leider habe ich auch das Problem das ein zeitweise nicht funktioniert
keine Idee was zeitweise hängt wäre schon cool wenn dies zuverlässiger funktionieren würde

bin ich wirklich alleine mit dem problem…
das schlimme ist das es zeitweise geht und dann wieder nicht was könnte noch eine Ursache sein ?

Hey @Sascha,

Mach doch mal bitte nen Eigenen Beitrag auf und Schildere doch mal den kompletten Fall im Detail mit Auszüge der Paperless.log zu dem Zeitpunkt um das Problem und +/- 10-15 min davor und dannach.
Dann kann man dir auch sicherlich weiterhelfen.