Gelöst: Tika und Gotenberg-Fehler "Error while converting document to PDF: Server error '503 Service Unavailable' "

Hallo zusammen,

ich habe hatte das gleiche Problem und es schon mit verschiedenen Versionen von Gotenberg probiert, alles ohne Erfolg. Meine Testdatei wollte und wollte nicht hochgeladen werden.

Die Fehlermeldung 503 ließ vermuten, dass es an der Gotenberg Version lag. Es stellte sich dann aber heraus, dass an meiner Testdatei lag, aus irgendeinem Grund nicht verarbeitet werden konnte. Außergewöhnlich an der Word-Datei waren nur individuelle Schriftarten sowie gelöste Kommentare.

Möchte das nur mit euch teilen, falls noch jemand auf das gleiche Problem stößt.

VG

Hallo Stefan,

kannst du deine Liste ggf. aktualisieren? Ich bekomme mit paperless ngx Version 2.8.5 Gotenberg nicht zuverlässig zum laufen und habe nun schon verschiedene Versionen durchprobiert. Der Großteil der Dokumente (.docx, .eml) wird nicht erkannt.

Getestete Gotenberg Versionen
7.10
7.10.2
7.8
8.0.3
8.2.0
8.5.0

Hier meine docker-compose.yml:

version: "3.4"
services:
  broker:
    image: docker.io/library/redis:7.2.4
    restart: unless-stopped
    volumes:
      - redisdata:/data

  db:
    image: docker.io/library/postgres:15
    restart: unless-stopped
    volumes:
      - ../pgdata:/var/lib/postgresql/data
    environment:
      POSTGRES_DB: paperless
      POSTGRES_USER: paperless
      POSTGRES_PASSWORD: paperless

  webserver:
    image: ghcr.io/paperless-ngx/paperless-ngx:latest
    restart: unless-stopped
    depends_on:
      - db
      - broker
    ports:
      - 8000:8000
    healthcheck:
      test: ["CMD", "curl", "-fs", "-S", "--max-time", "2", "http://localhost:8000"]
      interval: 30s
      timeout: 10s
      retries: 5
    volumes:
      - ../data:/usr/src/paperless/data
      - ../media:/usr/src/paperless/media
      - ../export:/usr/src/paperless/export
      - /volume1/scaninput:/usr/src/paperless/consume
    env_file: docker-compose.env
    environment:
      PAPERLESS_REDIS: redis://broker:6379
      PAPERLESS_DBHOST: db
      PAPERLESS_TIKA_ENABLED: 1
      PAPERLESS_TIKA_GOTENBERG_ENDPOINT: http://gotenberg:3000
      PAPERLESS_TIKA_ENDPOINT: http://tika:9998

  gotenberg:
    image: docker.io/gotenberg/gotenberg:8.2.0
    restart: unless-stopped

    # The gotenberg chromium route is used to convert .eml files. We do not
    # want to allow external content like tracking pixels or even javascript.
    command:
      - "gotenberg"
      - "--chromium-disable-javascript=true"
      - "--chromium-allow-list=file:///tmp/.*"

  tika:
    image: ghcr.io/paperless-ngx/tika:latest
    restart: unless-stopped


volumes:
  redisdata:

Hi,

hab leider selbiges Problem. Wird immer Error503 ausgegeben.
Steht bei mir alles auf latest. Paperless Version 2.8.6 und Gotenberg auf Version 8.5.1

Hat das jemand in der Kombination am laufen?

Eml macht immer Probleme, bitte via Mailfunktion einlesen lassen.
Zu den funktionierenden Versionen gabs nen eigenen Beitrag von Stefan.

@anon58924890 den Post von Stefan hab ich gelesen aber da wird als letztes die Paperless Version 2.5.0 in Kombination mit Gotenberg 8.0.3 erwähnt.

Aktuell ist jedoch Pngx 2.8.6 und Gotenberg 8.5.1
Vielleicht hat ja jemand eine Version am laufen die neuer als Kombination Pngx 2.5.0 und Gotenberg 8.0.3 ist oder @Stefan hat vllt noch eine Idee.

Wie gesagt das Problem mit *.eml ist bekannt und nicht via scaninput importierbar.
Mail einrichten und mail weiterleiten oder Anhang seperat importieren.

So zumindest der letzte Stand von vor einigen Wochen…

@anon58924890 es geht mir nicht um .eml Dateien. Test lief bei mir mit einer .docx

1 „Gefällt mir“

Kurzes Update

Bei Pngx 2.8.6 mit Gotenberg 8.6.0 funktioniert die Verarbeitung von Office Dokumenten!

1 „Gefällt mir“

PNGX 2.10.2 funktioniert mit keiner Gotenberg Version!

Wie kommst du zu der Aussage und was heißt bei Dir funktioniert ?
Ich denke eher das Problem ist ein anderes.
Bitte eigenständigen Post dazu verfassen wenn du hilfe benötigst.

Moin,
mal ein ganz anderer Ansatz:
ich habe zuerst mit der neuen Umgebung auf der Synology versucht das ganze im Container Manager einzurichten. Lief ganz gut … aber nicht mit Tika und Gotenberg.
Deshalb bin ich hier. Aber: was ich bei der ersten Installation gemerkt habe ist, dass er den Port vom Tika nicht mochte. (9998)
Wenn ich hier im Skript daraus die 9888 mache … geht‘s.
Bitte verifizieren.
Mit dieser Umstellung und
redis 7.0
postgres 13
paperless-ngx latest
gotenberg 8.7
tika latest
nimmt er odt, eml … :slight_smile:

Hier im Forum geht’s aber nicht um irgendwelche Stacks oder Container IMAGES von Paperless sondern um Stefans Lösung ( normale Config aus dem Shop oder die Masterclass ) die ohne Probleme funktioniert.
Für alles andere an Support wird hier nicht garantiert. ( Und findet hier nur freiwillig statt )
Demnach macht es auch Sinn weitere Infos anzugeben zum verwendeten System und Installation… vorallem um das zu verifizieren.

Generell sollten Updates nicht wie Bonbons verwendet werden sondern um neue Features oder Bugfixes zu implementieren. ( Damit sind speziell die Sub-Images Tika, Redis, Gotenberg und co gemeint. )

Das stimmt so nicht. Das Forum hier ist eine Plattform, auf der sich jeder austauschen kann und auch jeder willkommen ist. Ob Kunde von meinem Unternehmen oder nicht, ist ganz egal.

Wer als Käufer von Kursen verifiziert ist, bekommt natürlich priorisiert Hilfe (zumindest von mir), aber ich möchte hier niemanden ausschließen, der sich den Kurs vielleicht nicht leisten kann oder auch will.

Natürlich kann man die Hilfe nicht erwarten, wenn man kein Kunde ist, aber ich denke, das ist jedem klar.

Bei mir klappt die Verarbeitung von Office Dokumenten mit Pngx 2.10.2 und Gotenberg 8.7.0 absolut problemlos.
Welche Fehler werden dir bei der Verarbeitung angezeigt?

Kleines update: nachdem auch ich den Fehler code 503 hatte, habe ich meine Gotenberg v7.8 (aus dem Masterclass Kurs) auf die v8.8 aufdatiert. Seither habe ich bei drag and drop einer Word Datei keinen Fehlercode mehr. Alles tut seinen Dienst. Ich war subjektiv über die Geschwindigkeit des einlesens der Datei positiv überrascht. :+1:
Aktuell habe ich Paperless-ngx v2.10.2 mit Gotenberg v8.8 und postgres v15. Bisher ohne Fehler. :sweat_smile:

Übrigens wird auf der Github Seite geschrieben, dass die Gotenberg v7 ab Paperless v2.10.2 nicht mehr unterstützt wird…

1 „Gefällt mir“

Danke für das Update!

Wobei es mich wundert, denn in dem Announcement steht, dass paperless-ngx v2.20 die letzte Version ist, die Gotenberg 7 unterstützt und 8 explizit noch nicht.

Wer es nachlesen möchte:

Du hast recht. Intressanterweise hatte ich unter Gotenberg 7 immer einen 503 Fehler. Nach dem update auf Gotenberg v8.8 (die ist ziemlich Neu) konnte ich die Word- und Excel Dateien ohne Probleme importieren. Auch das Tempo des Imports ist cool.

Gemäss dem Artikel würde ich ein running System mit Gotenberg 7 noch nicht verändern. Bei Fehlermeldungen ist es ein Versuch wert :wink:
Im Moment sieht es bei mir gut aus :upside_down_face:

Hallo in die Runde,
ich habe Paperless-ngx nach dem Videokurs Masterclass auf einem Synology DS224+ installiert. Ich habe auch das Problem, dass bei Word-Dokumenten der Fehler 503 kommt.

> Error while converting document to PDF: Server error ‚503 Service Unavailable‘ for url ‚http://gotenberg:3000/forms/libreoffice/convert

Meine installierten Versionen:

perless-ngx 2.11.0

Postgress 15 (Nach Anleitung auf https://www.digitalisierung-mit-kopf.de/blogs/anleitungen/datenbank-von-paperless-ngx-so-gelingt-das-update-z-b-postgres-13-zu-postgres-15)

gotenberg:7.10

tika:latest

Gibt es eine Lösung, welche gotenberg-Version mit Paperless-ngx 2.11.0 funktioniert?

Versuch mal das Gotenberg update durchzufühen. Siehe link
https://forum.digitalisierung-mit-kopf.de/t/gotenberg-update-auf-neue-version-8/1058?u=marca

Habe ich gemacht. Leider bleibt der Fehler:

Konnte ODT Test.odt nicht hinzufügen: ODT Test.odt: Error occurred while consuming document ODT Test.odt: Error while converting document to PDF: Server error ‚503 Service Unavailable‘ for url ‚http://gotenberg:3000/forms/libreoffice/convert‘ For more information check: 503 Service Unavailable - HTTP | MDN