Gelöst: Tika und Gotenberg-Fehler "Error while converting document to PDF: Server error '503 Service Unavailable' "

Hi,
ich wollte einmal meine Stolpersteine beim Import von 10 Jahren Auftragseingang
mit dem Fehler 503 mit euch teilen:

Verwendet habe ich eine leicht modifizierte Version von

um den Nachrichtentext mit den Anhängen der Emails zu einem PDF im Paperless zu kombinieren.

Um IMAP Probleme auszuschließen, hole ich die Mails per Python Script und exchangelib direkt aus dem Öffentlichen Exchange Ordner ab, entferne Dubletten anhand der Message ID, packe das FROM Feld in die erste Zeile der EML (wegen der MIME Erkennung im Consumer) und importiere diese mittels API.

Bislang konnte ich die folgenden Fehlerbilder mit 503 identifizieren:

a) Einzelne Mails wurden 100x hin und hergeschickt → Email Body’s sind ultra groß (>100kB) und führen zu Timeouts. Gelöst durch den hier schon erwähnten „–api-timeout=180s“

b) Mails mit sehr langen PDF Anhängen → ebenfalls „–api-timeout=180s“

c) Mails, die versuchen externe Grafiken nachzuladen. Beantwortet der ursprüngliche Server diese Anfragen
nicht mehr, geht der Chromium im Gotenberg in einen Timeout. Dieser scheint aber nicht die üblichen 20s zu verwenden und dann die Seite weiter aufzubauen, sondern verwendet anscheinend den Wert aus dem api-timeout. Das führt dazu, dass eine solche Umwandlung immer crasht.
Ich habe mir jetzt dadurch beholfen, dass ich dem gotenberg container den DNS Server mittels

dns:
    0.0.0.0

entziehe. Das führt natürlich leider auch dazu, dass bei Mails mit erreichbaren Quellen die Grafiken fehlen.
Theoretisch müsste dieser Workaround auch über –chromium-allow-list bzw. –chromium-deny-list abzubilden sein, ich hoffe allerdings darauf, dass die Gutenberg Entwickler hier noch eine bessere Idee haben.

Gruß

Stefan

1 „Gefällt mir“

Hallo zusammen,

ich hatte mit auf meiner Synology auch lange dieses Problem und konnte es jetzt mit der Konfiguration für Gotenberg aus diesem Github issue lösen: Synology: LibreOffice struggles to start (Paperless-ngx 2.20.3 + Gotenberg 8.25.1 + PostgreSQL 17 or 18) · Issue #763 · gotenberg/gotenberg · GitHub Nur falls sonst auch noch jemand mit dem Problem kämpft.

Gruß Montgomery