Übereinandergeschobene Zeichen bei Import Mail als EML

Hallo zusammen,
ich importiere DHL-Einlieferungsbelege als Mail. In den paperless-Einstellungen für den Import habe ich angegeben:

  • Dateianhangstyp: nur Anhänge verarbeiten (bei „alle DAteien verarbeiten“ ist es genauso)
  • Verarbeitungsumfang: Nachricht als .eml verarbeiten

Grundsätzlich funktioniert das, aber in der archivierten Datei sind Zeichen überlagernd abgebildet. Leider finde ich hier keine Option, um einen Screenshot anzuhängen. Man kann sich das so vorstellen, dass der selben Text zweimal vorhanden ist und einmal um 2mm nach links verschoben den gleichen Text überdeckt.
Das passiert aber nur mit dem Datum und der Postfiliale, der ganze restliche Text wird ordentlich wiedergegeben.
Ich vermute dass es en Problem mit TIKA oder Gotenberg ist, kenne mich aber damit zu wenig aus, um das beheben zu können.
Die Einstellungen dazu (da ich als neuer user höchsten 2 Links einfügen darf, habe ich im Post die // aus den Links durch || ersetzt - aber nur im Post):
environment:
PAPERLESS_REDIS: redis:||broker:6379
PAPERLESS_DBHOST: db
USERMAP_UID: 1000
USERMAP_GID: 100
PAPERLESS_OCR_LANGUAGES: deu eng
PAPERLESS_TIME_ZONE: Europe/Berlin
PAPERLESS_OCR_LANGUAGE: deu
PAPERLESS_FILENAME_FORMAT: „{correspondent}/{created} {title}“
PAPERLESS_TIKA_ENABLED: 1
PAPERLESS_TIKA_GOTENBERG_ENDPOINT: http:||gotenberg:3000
PAPERLESS_TIKA_ENDPOINT: http:/||tika:9998

gotenberg:
container_name: paperless-gotenberg
image: docker.io/gotenberg/gotenberg:7.8
restart: unless-stopped
environment:
CHROMIUM_DISABLE_ROUTES: 1
networks:
- paperless-net

tika:
container_name: paperless-tika
image: Package tika · GitHub
restart: unless-stopped
networks:
- paperless-net

Hat jemand einen Tip, wie ich einen solchen Einlieferungsbeleg korrekt verarbeiten kann? Kann man TIKA/Gotenberg per Parameter entsprechend beeinflussen?

Viele Grüße,
Siegbert

Versteh ich das richtig das du die Belege via Datei im Format EML importierst ?
Wenn ich mich nicht irre funktioniert das nicht wirklich und der einzige Workaround ist die Mails einfach weiterzuleiten an ne Mailadresse die Paperless-NGX direkt abrufen kann zum Konsumieren.

Update mal Tika, Gotenberg und Redis entweder auf „:latest“ oder wie ich auf folgendes:

services:
  broker:
    image: docker.io/library/redis:7.2.4
tika:
    image: ghcr.io/paperless-ngx/tika:latest
gotenberg:
    image: docker.io/gotenberg/gotenberg:8.2.0

Hi,
ich importiere per Zugriff auf das Mail-Postfach.
Das Update versuche ich am Wochenende, bin vorher beruflich unterwegs. Kann ja durchaus sein, dass eine aktuellere Version die Zeichen nicht dupliziert und übereinanderlegt.

Erst mal danke und ich melde mich danach it einem Ergebnis

VG
Siegbert

1 „Gefällt mir“