Hi,
ich wollte einmal meine Stolpersteine beim Import von 10 Jahren Auftragseingang
mit dem Fehler 503 mit euch teilen:
Verwendet habe ich eine leicht modifizierte Version von
um den Nachrichtentext mit den Anhängen der Emails zu einem PDF im Paperless zu kombinieren.
Um IMAP Probleme auszuschließen, hole ich die Mails per Python Script und exchangelib direkt aus dem Öffentlichen Exchange Ordner ab, entferne Dubletten anhand der Message ID, packe das FROM Feld in die erste Zeile der EML (wegen der MIME Erkennung im Consumer) und importiere diese mittels API.
Bislang konnte ich die folgenden Fehlerbilder mit 503 identifizieren:
a) Einzelne Mails wurden 100x hin und hergeschickt → Email Body’s sind ultra groß (>100kB) und führen zu Timeouts. Gelöst durch den hier schon erwähnten „–api-timeout=180s“
b) Mails mit sehr langen PDF Anhängen → ebenfalls „–api-timeout=180s“
c) Mails, die versuchen externe Grafiken nachzuladen. Beantwortet der ursprüngliche Server diese Anfragen
nicht mehr, geht der Chromium im Gotenberg in einen Timeout. Dieser scheint aber nicht die üblichen 20s zu verwenden und dann die Seite weiter aufzubauen, sondern verwendet anscheinend den Wert aus dem api-timeout. Das führt dazu, dass eine solche Umwandlung immer crasht.
Ich habe mir jetzt dadurch beholfen, dass ich dem gotenberg container den DNS Server mittels
dns:
0.0.0.0
entziehe. Das führt natürlich leider auch dazu, dass bei Mails mit erreichbaren Quellen die Grafiken fehlen.
Theoretisch müsste dieser Workaround auch über –chromium-allow-list bzw. –chromium-deny-list abzubilden sein, ich hoffe allerdings darauf, dass die Gutenberg Entwickler hier noch eine bessere Idee haben.
Gruß
Stefan