Gelöst: Tika und Gotenberg-Fehler "Error while converting document to PDF: Server error '503 Service Unavailable' "

Hallo zusammen,

ich habe hatte das gleiche Problem und es schon mit verschiedenen Versionen von Gotenberg probiert, alles ohne Erfolg. Meine Testdatei wollte und wollte nicht hochgeladen werden.

Die Fehlermeldung 503 ließ vermuten, dass es an der Gotenberg Version lag. Es stellte sich dann aber heraus, dass an meiner Testdatei lag, aus irgendeinem Grund nicht verarbeitet werden konnte. Außergewöhnlich an der Word-Datei waren nur individuelle Schriftarten sowie gelöste Kommentare.

Möchte das nur mit euch teilen, falls noch jemand auf das gleiche Problem stößt.

VG

Hallo Stefan,

kannst du deine Liste ggf. aktualisieren? Ich bekomme mit paperless ngx Version 2.8.5 Gotenberg nicht zuverlässig zum laufen und habe nun schon verschiedene Versionen durchprobiert. Der Großteil der Dokumente (.docx, .eml) wird nicht erkannt.

Getestete Gotenberg Versionen
7.10
7.10.2
7.8
8.0.3
8.2.0
8.5.0

Hier meine docker-compose.yml:

version: "3.4"
services:
  broker:
    image: docker.io/library/redis:7.2.4
    restart: unless-stopped
    volumes:
      - redisdata:/data

  db:
    image: docker.io/library/postgres:15
    restart: unless-stopped
    volumes:
      - ../pgdata:/var/lib/postgresql/data
    environment:
      POSTGRES_DB: paperless
      POSTGRES_USER: paperless
      POSTGRES_PASSWORD: paperless

  webserver:
    image: ghcr.io/paperless-ngx/paperless-ngx:latest
    restart: unless-stopped
    depends_on:
      - db
      - broker
    ports:
      - 8000:8000
    healthcheck:
      test: ["CMD", "curl", "-fs", "-S", "--max-time", "2", "http://localhost:8000"]
      interval: 30s
      timeout: 10s
      retries: 5
    volumes:
      - ../data:/usr/src/paperless/data
      - ../media:/usr/src/paperless/media
      - ../export:/usr/src/paperless/export
      - /volume1/scaninput:/usr/src/paperless/consume
    env_file: docker-compose.env
    environment:
      PAPERLESS_REDIS: redis://broker:6379
      PAPERLESS_DBHOST: db
      PAPERLESS_TIKA_ENABLED: 1
      PAPERLESS_TIKA_GOTENBERG_ENDPOINT: http://gotenberg:3000
      PAPERLESS_TIKA_ENDPOINT: http://tika:9998

  gotenberg:
    image: docker.io/gotenberg/gotenberg:8.2.0
    restart: unless-stopped

    # The gotenberg chromium route is used to convert .eml files. We do not
    # want to allow external content like tracking pixels or even javascript.
    command:
      - "gotenberg"
      - "--chromium-disable-javascript=true"
      - "--chromium-allow-list=file:///tmp/.*"

  tika:
    image: ghcr.io/paperless-ngx/tika:latest
    restart: unless-stopped


volumes:
  redisdata:

Hi,

hab leider selbiges Problem. Wird immer Error503 ausgegeben.
Steht bei mir alles auf latest. Paperless Version 2.8.6 und Gotenberg auf Version 8.5.1

Hat das jemand in der Kombination am laufen?

Eml macht immer Probleme, bitte via Mailfunktion einlesen lassen.
Zu den funktionierenden Versionen gabs nen eigenen Beitrag von Stefan.

@michael.schmalzl den Post von Stefan hab ich gelesen aber da wird als letztes die Paperless Version 2.5.0 in Kombination mit Gotenberg 8.0.3 erwähnt.

Aktuell ist jedoch Pngx 2.8.6 und Gotenberg 8.5.1
Vielleicht hat ja jemand eine Version am laufen die neuer als Kombination Pngx 2.5.0 und Gotenberg 8.0.3 ist oder @Stefan hat vllt noch eine Idee.

Wie gesagt das Problem mit *.eml ist bekannt und nicht via scaninput importierbar.
Mail einrichten und mail weiterleiten oder Anhang seperat importieren.

So zumindest der letzte Stand von vor einigen Wochen…

@michael.schmalzl es geht mir nicht um .eml Dateien. Test lief bei mir mit einer .docx

1 „Gefällt mir“