Ich habe bei mir mittlerweile auch Paperless-AI installiert, nachdem die Basisinstallation von Paperless-NGX ziemlich gut läuft (mit Backups usw.).
Das Killer-Feature in meinen Augen von Paperless-AI ist der Chat, mit dem ich aus allen Dokumenten wichtige Infos ziehen kann. Z.B. recht einfach meine Steuernummer oder sowas wie: Auf welches Konto muss ich die Kosten für die letzte Reiseimpfung bezahlen?
Dabei ist mir aber ein ziemlich großes Problem aufgefallen, dass mir so gar nicht bewusst war. Die OCR-Qualität von Paperless-NGX ist ziemlich schlecht, die IBAN hat einfach gar nicht gestimmt, obwohl die AI das richtige Dokument gefunden hat.
Meine Stichprobenkontrollen der Texterkennung waren immer zufriedenstellend, vermutlich klappen Wörter dank Wörterbuch auch ziemlich gut. Aber vor allem interessante Zahlen sind unzuverlässig.
Habt ihr Strategien ob die OCR Qualität zu verbessern? Kann man an den Settings von Paperless noch optimieren, vielleicht im Gegenzug mit Rechenleistung?
Habt ihr vielleicht OCR ganz ausgeschaltet und lasst eine andere Software schon vorm Import des Dokuments die Texterkennung machen?
Oder nutzt ihr Lösungen wie Paperless-GPT oder gar irgendwelche KI-Clouds?
Hi,
Ich habe Ähnliches festgestellt und bin damit auch unglücklich.
Bin leider noch nicht weit in der Analyse, aber auch Überschriften die win wenig „breiter“ dargestellt werden erscheinen oft mit blanks in der OCR.
G E B Ü H R E N B E S C H E I D um ein unerfreuliches Beispiel zu nennen
Wäre auch an Tipps interessiert, hochwertiger zu OCRen
Ne, hab Paperless-GPT noch nicht installiert. Hab insgesamt relativ wenig Infos dazu gefunden, z.B. auch kein einziges Youtube-Video.
Und da ich irgendwo gelesen habe, dass Paperless-AI, welches bei mir ja schon läuft auch bald ein OCR Feature bekommen soll, warte ich da noch mal etwas ab. Außer natürlich, es gibt noch andere Optionen, die ohne teure LLMs auskommen.
Es soll z.B. noch easyOCR geben, aber da weiß ich nicht wirklich, wie ich das in Paperless-NGX einbinden soll.
AI nutze ich lokal bei mir Ollama und ich probiere aktuell aus, wie teuer mich Privatenode AI zu stehen kommt. Habe sicherlich nicht alles verstanden, was die schreiben, soll aber ein deutscher Anbieter sein, der die KI-Anfragen End-zu-End verschlüsselt.