Tika funktioniert nicht

hier die Fehlermeldung:
Wohnzimmer.pptx: Error occurred while consuming document Wohnzimmer.pptx: Could not parse /tmp/paperless/paperless-ngxq2wtpnkj/Wohnzimmer.pptx with tika server at http://192.168.1.30:9998: [Errno 111] Connection refused

ich nehme ja an, dass das ein berechtigungsproblem ist. Aber leider kann ich es nicht lösen. Wer mag mir helfen??

Gruß, Gero

Funktioniert das Einlesen mit pdf-Dateien?

Hallo Gero,

Hast du dir den Beitrag schon durchgelesen ?
Was ist deine Basis auf der du die Installation durchgeführt hast ?
Solltest du Stefans Configs verwendet haben und du die Anleitung 1:1 befolgt hast sollte alles funktionieren.

Poste doch bitte mal in die Codebox deine docker-compose.yml

Moin,
pdf und png sind kein Problem. es geht nur um office dokumente.

Hello Michael,

danke für Deine Fragen. Ich bin bei dem Thema ganz neu. Ich habe paperlessngx auf meiner Syno-NAS 918+ mit portainer installiert. und der Code sieht wiefolgt aus:

version: "3.6"

networks:
    internal:
        external: false

services:
    broker:
        container_name: paperless-redis
        image: redis:6.2
        # Wenn man lieber 6.0 nutzen möchte
        # image: redis:6.0
        networks:
            - internal
        volumes:
            # Hier den richtigen Pfad eintragen
            - /volume1/paperless/redis:/redis
        #  - /volume2/paperless/redis:/redis
        restart: unless-stopped

    db:
        container_name: paperless-db
        image: postgres:14
        # Wenn man lieber die 13 Version von PostgreSQL möchte
        # image: postgres:13
        # Nicht einfach up- oder downgraden, die Datenbank wird dann nicht mehr laden.
        networks:
            - internal
        restart: unless-stopped
        volumes:
            # Hier den richtigen Pfad eintragen
            - /volume1/paperless/db:/var/lib/postgresql/data
        #  - /volume2/paperless/db:/var/lib/postgresql/data
        environment:
            POSTGRES_DB: paperless
            POSTGRES_USER: paperless
            # Hier ein anderes Passwort verwenden
            POSTGRES_PASSWORD: xxxxx

    webserver:
        container_name: paperless
        image: ghcr.io/paperless-ngx/paperless-ngx:latest
        networks:
            # Wenn sich der Proxy Manager auf der Synology befindet, sollte hier zusätzlich das Netzwerk davon eingetragen werden, statt einen Port freizugeben.
            - internal
        restart: unless-stopped
        depends_on:
            - db
            - broker
        ports:
            # Diesen Teil löschen, wenn der Proxy Manager auf der Synology ist.
            # Ansonsten hier einen Port auswählen, der frei ist.
            - 8810:8000
        # - 8011:8000
        # - 8012:8000
        healthcheck:
            test: ["CMD", "curl", "-f", "http://localhost:8000"]
            interval: 30s
            timeout: 10s
            retries: 5
        volumes:
            # Hier die richtigen Pfade eintragen
            - /volume1/paperless/data:/usr/src/paperless/data
            - /volume1/paperless/media:/usr/src/paperless/media
            - /volume1/paperless/export:/usr/src/paperless/export
            - /volume1/Tausch/Paperless-Inbox:/usr/src/paperless/consume
        environment:
            PAPERLESS_REDIS: redis://broker:6379
            PAPERLESS_DBHOST: db
            PAPERLESS_DBPASS: xxxxx # Das ist das Passwort von oben
            USERMAP_UID: 1024 # UserID für den docker Benutzer
            USERMAP_GID: 100 # GruppenID für den docker Benutzer
            PAPERLESS_OCR_LANGUAGES: eng deu
            # Hier einen zufälligen Key eintragen, wenn man Paperless von Außen erreichbar machen möchte.
            PAPERLESS_SECRET_KEY: C3Q2dLkVPqZWDKTXgkHwWhJ6jk8XqAbeDmDZjCxvb3c2jXl6pTGQXqJFqEkS9umFmXrk4WmzT8rlwjqWan6A2G54Q5IgraBv96CS
            # Hier die eigene Domain hinter localhost eintragen, wenn man einen Proxy Host benutzt, ansonsten diese Umgebungsvariable löschen.
            #PAPERLESS_ALLOWED_HOSTS: "localhost"
            PAPERLESS_TIME_ZONE: Europe/Berlin
            PAPERLESS_OCR_LANGUAGE: deu+eng
            # Hier anpassen, wenn man eine andere Ordnerstruktur haben möchte
            PAPERLESS_FILENAME_FORMAT: "{created_year}/{correspondent}/{title}"
            # Die nächsten drei Zeilen weglassen, wenn man Tika/Gotenberg nicht einsetzen möchte.
            PAPERLESS_TIKA_ENABLED: 1
            PAPERLESS_TIKA_GOTENBERG_ENDPOINT: http://192.168.1.30:3000/forms/libreoffice/convert#
            PAPERLESS_TIKA_ENDPOINT: http://paperless-tika:9998
            # Die nächste Zeile setzen, wenn man einen Proxy Server benutzt.
            #PAPERLESS_URL: "https://paperless.domain.de"

    db-backup:
        container_name: paperless-db-backup
        # Das Image ggf. an das obere anpassen
        image: postgres:14
        volumes:
            # Hier den richtigen Pfad eintragen
            - /volume1/paperless/db-backup:/dump
            - /etc/localtime:/etc/localtime:ro
        environment:
            PGHOST: db
            PGDATABASE: paperless
            PGUSER: paperless
            PGPASSWORD: xxxxx # Das ist das Passwort von oben
            BACKUP_NUM_KEEP: 10
            BACKUP_FREQUENCY: 7d # Alle 7 Tage, kann man anpassen
        entrypoint: |
            bash -c 'bash -s <<EOF
            trap "break;exit" SIGHUP SIGINT SIGTERM
            sleep 2m
            while /bin/true; do
              pg_dump -Fc > /dump/dump_\`date +%d-%m-%Y"_"%H_%M_%S\`.psql
              (ls -t /dump/dump*.psql|head -n $$BACKUP_NUM_KEEP;ls /dump/dump*.psql)|sort|uniq -u|xargs rm -- {}
              sleep $$BACKUP_FREQUENCY
            done
            EOF'
        networks:
            - internal

    # Diesen Part weglassen, wenn man keine Umwandlung von Office-Dokumenten, Mails haben möchte.
    gotenberg:
        container_name: paperless-gotenberg
        image: gotenberg/gotenberg:7.4
        restart: unless-stopped
        environment:
            CHROMIUM_DISABLE_ROUTES: 1
        command:
            - "gotenberg"
            - "--chromium-disable-javascript=true"
            - "--chromium-allow-list=file:///tmp/.*"
        networks:
            - internal

    tika:
        container_name: paperless-tika
        image: apache/tika:2.3.0
        restart: unless-stopped
        networks:
            - internal

hilft das?? Es wäre so toll, wenn ich das Ding zum lauden bekomme. Das würde meiner Frau und mir die Verwaltung von Docs deutlich erleichtern :slight_smile:

Vielen Dank.

Bei Portainer bin ich raus… Hab damit nix out of the box zum laufen gebracht… Und bin davon wieder komplett weg.

Hier im Forum geht es zwar um Paperless… Jedoch um Stefans Basis primär.

Die Config ist ziemlich auf ne. Alten Stand.
Redis is bei mir 7 uvm.

Wenn du dich nicht länger ärgern willst und erstmal das Ding ans laufen zu bringen nutz die kostenlose config von Stefan samt Anleitung.
Den rest kannst du gerne ja wieder anpassen.
Musst du auch solange Portainer läuft.
Und Portainer bin ich bisher immer nur über die Shell losgeworden.

Keine Ahnung wieso man n backup und so in die Configs integriert wenns auch einfacher geht.

Kann zu deiner config leider wenig sagen da unsere total anders aussieht.

Vielleicht kann dir Stefan helfen, dann wäre aber auch das Paperlesslog Protokoll wichtig ab dem Zeitpunkt an dem die Datei im Consume Ordner gelandet ist.

Gibt auch Stacks für Portainer die out of the Box ohne Probleme funktionieren.
Der verwendete Stack ist, wie erwähnt, schon recht alt wenn man postgres 14 installiert.

Die Ablehnung gegen Portainer kann ich nicht nachvollziehen… ist eigentlich auch nur ein Docker-Container mit dem man alle installierten Container verwalten, updaten, und nicht mehr verwendete Images oder Volumes komfortabel löschen kann.
Ob man die Anpassungen in einem Stack oder in der Docker Compose macht ist auch Jacke wie Hose, ist ja im Prinzip das gleiche.

Ich denke es ist nicht gewünscht dass man Links zu Stacks postet die funktionieren, somit kannst du den Vorschlag von Michael annehmen oder wenn du weiter mit Portainer arbeiten willst nach einen aktuellen Stack googeln.

Backup würde ich mit Synology Hyperbackup machen, Sicherung einspielen klappt damit prima, auch auf ein komplett neues Volume.

Um einem möglichen Missverständnis vorzubeugen:

Ich habe überhaupt kein Problem damit, wenn sich hier gegenseitig geholfen wird, auch wenn das bedeutet, dass man meinen Produkten im Shop „Konkurrenz“ macht.

Die Konfigurationen von mir haben deshalb ein Preisschild, weil mit der Erstellung und Pflege der Anleitungen, der Webseite und natürlich auch des Forums ein Aufwand verbunden ist. Wenn also jemand einen guten Portainer-Stack hat, kann er den gerne hier posten, das stört mich nicht :wink: Ich betreibe den gesamten Auftritt rund um YouTube, den Shop, das Forum, die Kursplattform, etc. komplett alleine und ohne Mitarbeiter, daher kann ich nur eines nicht leisten: Support zu allen möglichen Konfigurationen, die nicht von mir stammen.

Zu Portainer: Genau, es ist einfach ein Verwaltungs-Tool. Praktisch, wenn man es nutzen möchte aber eben völlig Geschmacksache.

1 „Gefällt mir“

Portainer benötige ich nicht mehr, hab die Harte Schule zwangsweise gelernt via docker xyz xyz commands, auch weil es bei Stefan Teil des Kurses war und ich Portainer nicht weiter nutzen wollte wenn es anders schneller geht wenn man eh mit SSH arbeitet :wink:
Bin sehr zu Frieden mit @Stefan s Produkt und die Masterclass hat sich jedenfalls gelohnt und angespornt.

@Stefan: danke für Deinen Post. Habe volles Verständnis dafür. Es war halt ein Versuch von mir, weil ich stecken geblieben bin.

Gruß, Gero