TIKA und Gotenberg Installation

Nachdem ich die TIKA und Gotenberg Erweiterungen installiert habe, kommt die folgende Fehlermeldung:
paperless-gotenberg-1 exited with code 2
paperless-db-1 | 2025-09-02 10:51:36.783 UTC [333] WARNING: database „template1“ has a collation version mismatch
paperless-db-1 | 2025-09-02 10:51:36.783 UTC [333] DETAIL: The database was created using collation version 2.36, but the operating system provides version 2.41.
paperless-db-1 | 2025-09-02 10:51:36.783 UTC [333] HINT: Rebuild all objects in this database that use the default collation and run ALTER DATABASE template1 REFRESH COLLATION VERSION, or build PostgreSQL with the right library version.
paperless-db-1 | 2025-09-02 10:51:56.789 UTC [334] WARNING: database „postgres“ has a collation version mismatch
paperless-db-1 | 2025-09-02 10:51:56.789 UTC [334] DETAIL: The database was created using collation version 2.36, but the operating system provides version 2.41.
paperless-db-1 | 2025-09-02 10:51:56.789 UTC [334] HINT: Rebuild all objects in this database that use the default collation and run ALTER DATABASE postgres REFRESH COLLATION VERSION, or build PostgreSQL with the right library version.
paperless-db-1 | 2025-09-02 10:52:16.801 UTC [335] WARNING: database „paperless“ has a collation version mismatch
paperless-db-1 | 2025-09-02 10:52:16.801 UTC [335] DETAIL: The database was created using collation version 2.36, but the operating system provides version 2.41.
paperless-db-1 | 2025-09-02 10:52:16.801 UTC [335] HINT: Rebuild all objects in this database that use the default collation and run ALTER DATABASE paperless REFRESH COLLATION VERSION, or build PostgreSQL with the right library version.
Wie löse ich das ?
Cosmas

Hi,

Schau dir mal folgendes Thema an, das steht wir man das reparieren kann.
Hat was mit Update 2.18

ich ahbe erst das update von paperless gemacht. dann wollte ich die Tika und gotenberg Ergänzungen installieren. Bein ersten Versuch ahtte ich in der yml Datei einen Zahelendreher bei der gotenberg Version ( 7.8 statt 8.7. ) Nach dem 2. Pull kam diese Fehlermedlung. Kannst Du mal einen Blick auf die docker-compose.yml werfen?
version: „3.4“
services:
broker:
image: Docker Hub Container Image Library | App Containerization
restart: unless-stopped
volumes:
- redisdata:/data

db:
image: Docker Hub Container Image Library | App Containerization
restart: unless-stopped
volumes:
- ../pgdata:/var/lib/postgresql/data
environment:
POSTGRES_DB: paperless
POSTGRES_USER: paperless
POSTGRES_PASSWORD: paperless

webserver:
image: Package paperless-ngx · GitHub
restart: unless-stopped
depends_on:
- db
- broker
ports:
- 8000:8000
healthcheck:
test: [„CMD“, „curl“, „-fs“, „-S“, „–max-time“, „2“, „http://localhost:8000“]
interval: 30s
timeout: 10s
retries: 5
volumes:
- ../data:/usr/src/paperless/data
- ../media:/usr/src/paperless/media
- ../export:/usr/src/paperless/export
- /volume1/scaninput:/usr/src/paperless/consume
env_file: docker-compose.env
environment:
PAPERLESS_REDIS: redis://broker:6379
PAPERLESS_DBHOST: db
PAPERLESS_TIKA_ENABLE: 1
PAPERLESS_TIKA_GOTENBERG_ENDPOINT: http://gotenberg:3000
PAPERLESS_TIKA_ENDPOINT: http://tika:9998

gotenberg:
image: docker.io/gotenberg/gotenberg:8.7
restart: unless-stopped

The gotenerbg chromium route is used to convert . eml files. We do not

want to allow external content like tracking pixels or even javascript.

command:
- „gotenberg“
- „–chromiun-disable-javascript=true“
- „–chromium-allow-list=file:///tmp.*“

tika:
image: Package tika · GitHub
restart: unless-stopped

volumes:
redisdata:

VBiele Grüße
cosmas

Hallo Jake, ich weiß nicht genug. Habe probiertden folgenden Befehl auszuführen:~$ sudo docker exec -it (paperless-db-1) psql -U (paperless) -d postgres -c
-sh: syntax error near unexpected token ( und: $ sudo docker exec -it (paperless-db-1) psql -U (paperless) -d postgres -c „REINDEX DATABASE template1;“ -sh: syntax error near unexpected token (’

Hi,

Hat nach dem Update auf Postgres17 überhaupt alles funktioniert?
Der Import ist sauber durchgelaufen ohne Probleme? Paperles hat ebenfalls funktioniert? Alle Dokumente waren vorhanden?

Mit diesen Befehlen von gio hat bei mir der reindex funktioniert, den Link dazu hast du ja schon.

Ja, ich hatte alles neu aufgesetzt …und alle Dokumente über den Scaninput aufnehmen lassen.

User und Datenbanknahme darf natürlich nicht in Klammern stehen…ich Blödmann…welchen Containernamen muss ich eingeben. Im Containermanager stehen die folgenden:
paperless-webserver-1
paperless-tika-1
paperless-broker-1
paperless-gotenberg-1 ( läuft nicht )
paperless-db-1

Nächster Versuch:
~$ sudo docker exec -it paperless-db-1 psql -U paperless -d postgres -c „REINDEX DATABASE template1;“
psql: warning: extra command-line argument „DATABASE“ ignored
psql: warning: extra command-line argument „template1“ ignored
WARNING: database „postgres“ has a collation version mismatch
DETAIL: The database was created using collation version 2.36, but the operating system provides version 2.41.
HINT: Rebuild all objects in this database that use the default collation and run ALTER DATABASE postgres REFRESH COLLATION VERSION, or build PostgreSQL with the right library version.
ERROR: syntax error at or near „„REINDEX“
LINE 1: „REINDEX
^
-sh: “: command not found

1 = Container name, nicht Ordnername deiner Datenbank

Schau in deine docker-compose wie DEIN Container heisst!!!

image

Das sind Namen aus MEINER Konfiguration bzw docker-compose, je nach Vorlage können sich Container Name oder Datenbank Name unterscheiden, die muss man anpassen.

2 = Name der Datenbank die im LOG steht

In der docker-compose.yml ist kein Eintrag container_name:
version: „3.4“
services:
broker:
image: Docker Hub Container Image Library | App Containerization
restart: unless-stopped
volumes:
- redisdata:/data

db:
image: Docker Hub Container Image Library | App Containerization
restart: unless-stopped
volumes:
- ../pgdata:/var/lib/postgresql/data
environment:
POSTGRES_DB: paperless
POSTGRES_USER: paperless
POSTGRES_PASSWORD: paperless

webserver:
image: Package paperless-ngx · GitHub
restart: unless-stopped
depends_on:
- db
- broker
ports:
- 8000:8000
healthcheck:
test: [„CMD“, „curl“, „-fs“, „-S“, „–max-time“, „2“, „http://localhost:8000“]
interval: 30s
timeout: 10s
retries: 5
volumes:
- ../data:/usr/src/paperless/data
- ../media:/usr/src/paperless/media
- ../export:/usr/src/paperless/export
- /volume1/scaninput:/usr/src/paperless/consume
env_file: docker-compose.env
environment:
PAPERLESS_REDIS: redis://broker:6379
PAPERLESS_DBHOST: db
PAPERLESS_TIKA_ENABLE: 1
PAPERLESS_TIKA_GOTENBERG_ENDPOINT: http://gotenberg:3000
PAPERLESS_TIKA_ENDPOINT: http://tika:9998

gotenberg:
image: docker.io/gotenberg/gotenberg:8.7
restart: unless-stopped

The gotenerbg chromium route is used to convert . eml files. We do not

want to allow external content like tracking pixels or even javascript.

command:
- „gotenberg“
- „–chromiun-disable-javascript=true“
- „–chromium-allow-list=file:///tmp.*“

tika:
image: Package tika · GitHub
restart: unless-stopped

volumes:
redisdata:

Hast die Antwort selber geschrieben

Wenn du die Befehle hier drunter 1:1 nutzt und du die Masterclass nutzt sollte es funktionieren.

Mach es genau so, wie @Jake und @IhDuepfe vorgeschlagen haben. Trage dort wo paperless-pgsql steht, dein DB-Name ein und führe die Befehle chronologisch wie aufgeführt aus.

CIh glaube ich habs geschafft:

~$ sudo docker exec -it paperless-db-1 psql -U paperless -d postgres -c „SELECT datname, datcollversion FROM pg_database;“
datname | datcollversion
-----------±---------------
template0 |
paperless | 2.41
postgres | 2.41
template1 | 2.41
(4 rows)
Jetzt haben alle die gleiche Version…
..aber:
paperless-gotenberg-1 exited with code 2
paperless-webserver-1 | /usr/local/lib/python3.12/site-packages/django/core/handlers/asgi.py:332: Warning: StreamingHttpResponse must consume synchronous iterators in order to serve them asynchronously. Use an asynchronous iterator instead.
paperless-webserver-1 | async for part in content:
paperless-gotenberg-1 exited with code 2
paperless-gotenberg-1 exited with code 2
paperless-webserver-1 | [2025-09-03 20:24:58,344] [WARNING] [django.request] Bad Request: /api/documents/post_document/
paperless-gotenberg-1 exited with code 2
paperless-db-1 | 2025-09-03 18:25:02.905 UTC [27] LOG: checkpoint starting: time
paperless-broker-1 | 1:M 03 Sep 2025 18:25:03.046 * 100 changes in 300 seconds. Saving…
paperless-broker-1 | 1:M 03 Sep 2025 18:25:03.046 * Background saving started by pid 20
paperless-broker-1 | 20:C 03 Sep 2025 18:25:03.168 * DB saved on disk
paperless-broker-1 | 20:C 03 Sep 2025 18:25:03.169 * Fork CoW for RDB: current 0 MB, peak 0 MB, average 0 MB
paperless-broker-1 | 1:M 03 Sep 2025 18:25:03.247 * Background saving terminated with success
paperless-db-1 | 2025-09-03 18:25:23.132 UTC [27] LOG: checkpoint complete: wrote 199 buffers (1.2%); 0 WAL file(s) added, 0 removed, 0 recycled; write=20.053 s, sync=0.073 s, total=20.228 s; sync files=36, longest=0.053 s, average=0.003 s; distance=1322 kB, estimate=1322 kB; lsn=0/17BB4498, redo lsn=0/17BA2648
paperless-gotenberg-1 exited with code 2
paperless-webserver-1 | [2025-09-03 20:26:35,361] [WARNING] [django.request] Bad Request: /api/documents/post_document/
paperless-gotenberg-1 exited with code 2
paperless-webserver-1 | /usr/local/lib/python3.12/site-packages/django/core/handlers/asgi.py:332: Warning: StreamingHttpResponse must consume synchronous iterators in order to serve them asynchronously. Use an asynchronous iterator instead.
paperless-webserver-1 | async for part in content:
paperless-gotenberg-1 exited with code 2
paperless-gotenberg-1 exited with code 2
gotenberg läuft nicht..
Mist

Ist alles durch gelaufen. Gotenberg startet trotzdem nicht.
Noch eine Idee? Ansonsten läuft ja alles…nur eben nicht diese Integration der Office Dateien.

Also bei mir schaut Gotenberg und Tika in der docker-compose so aus:

  gotenberg:
    image: gotenberg/gotenberg:latest
    container_name: PaperlessNGX-GOTENBERG
    hostname: gotenberg
    ports:
      - 3010:3000
    security_opt:
      - no-new-privileges:true
    user: 1026:100
    command:
      - "gotenberg"
      - "--chromium-disable-javascript=true"
      - "--chromium-allow-list=file:///tmp/.*"
    restart: always

  tika:
    image: ghcr.io/paperless-ngx/tika:latest
    container_name: PaperlessNGX-TIKA
    hostname: tika
    security_opt:
      - no-new-privileges:true
    user: 1026:100
    restart: on-failure:5

Was nicht heißt dass du das jetzt 1:1 abtippen sollst und dann funktioniert alles!

Bei mir fehlen überall die Container & Host Namen umd gotenberg holt sich nicht die letzten versionen.Die secdurity einstellungen sin bestimmt von Dir…:
gotenberg:
image: docker.io/gotenberg/gotenberg:8.7
restart: unless-stopped

The gotenerbg chromium route is used to convert . eml files. We do not

want to allow external content like tracking pixels or even javascript.

command:
- „gotenberg“
- „–chromiun-disable-javascript=true“
- „–chromium-allow-list=file:///tmp.*“

tika:
image: Package tika · GitHub
restart: unless-stopped

Ich werde mich morgen mal dran setzen…wenn meine Datensicherung gelaufen ist.
Vielen Dank erst mal

.

Hallo Jake. Gotenberg läuft jetzt.
paperless-gotenberg-1 |
paperless-gotenberg-1 | _____ __ __
paperless-gotenberg-1 | / / / /___ ___ / / ___ _______ _
paperless-gotenberg-1 | / (_ / _ / / -) _ / _ / -) / _ '/
paperless-gotenberg-1 | _
/_
/_/_////.__/_// _, /
paperless-gotenberg-1 | /
__/
paperless-gotenberg-1 |
paperless-gotenberg-1 | A containerized API for seamless PDF conversion.
paperless-gotenberg-1 | Version: 8.23.0
paperless-gotenberg-1 | -------------------------------------------------------
paperless-gotenberg-1 | [SYSTEM] modules: api chromium exiftool libreoffice lib reoffice-api libreoffice-pdfengine logging pdfcpu pdfengines pdftk prometheus qp df webhook
paperless-gotenberg-1 |
paperless-gotenberg-1 | [SYSTEM] chromium: Chromium ready to start
paperless-gotenberg-1 | [SYSTEM] libreoffice-api: LibreOffice ready to start
paperless-gotenberg-1 | [SYSTEM] prometheus: collecting metrics
paperless-gotenberg-1 | [SYSTEM] pdfengines: merge engines - qpdf pdfcpu pdftk
paperless-gotenberg-1 | [SYSTEM] pdfengines: split engines - pdfcpu qpdf pdftk
paperless-gotenberg-1 | [SYSTEM] pdfengines: flatten engines - qpdf
paperless-gotenberg-1 | [SYSTEM] pdfengines: convert engines - libreoffice-pdfe ngine
paperless-gotenberg-1 | [SYSTEM] pdfengines: read metadata engines - exiftool
paperless-gotenberg-1 | [SYSTEM] pdfengines: write metadata engines - exiftool
paperless-gotenberg-1 | [SYSTEM] api: server started on [::]:3000

Aber die office Dokumente werden nicht verarbeitet. Fehlermedlung:

Konnte … nicht hinzufügen. Dateityp Text/rtf nicht unterstützt.

Gotenberg war schon immer ein wenig tricky wenn es um die richtige Version geht.
Hab auch schon Dateien verarbeitet wo dann Fehlermeldung kamen,
War dann trotzdem als PDF und Date in Paperless vorhanden.

Wirklich brauchen tu ich Gotenberg nicht, ich mach lieber ein PDF und sichere mir die Office Datei woanders.

Alles klar. Vielen Dank für Deine Hilfe!

Dieses Thema wurde automatisch 2 Tage nach der letzten Antwort geschlossen. Es sind keine neuen Antworten mehr erlaubt.