Hast du dich schon gefragt, ob eine lokale KI-OCR besser ist als die in paperless-ngx eingebaute (tesseract)? In diesem Video zeige ich dir einen Prototypen, der Paperless‑ngx mit einer eigenen, lokal laufenden KI verbindet und die Unterschiede anhand verschiedener Testbeispiele aufzeigt. Du siehst, wie Handschrift, Tabellen und Bildbeschreibungen präziser erkannt werden – und bekommst einen ersten Einblick in die nächsten Entwicklungsphasen.
Finde das Video Cool aber sehe da den Mehrwert eher in Professionellen Lösungen wie z.b. Online Tools für Unternehmen zur Spesenabrechnung ( und nicht nur das ) statt der Privatperson die seine Unterlagen kennt und nicht lange suchen muss.
Das Problem mit den Buchstaben kenn ich tatsächlich genau da wenn Parkbelege und Co. Erfasst werden und dann auch mit falschen Buchstaben oder Sonderzeichen als Beleg übernommen werden.
Für den 0815 User seh ich da weniger Nutzen wenn ich ehrlich bin… denn die meisten Belege/Rechnungen sind eh schon digitalisiert und kommen per Mail oder sind zum runterladen.
HR-Works hatte das bitter nötig als Potentieller Kunde denn deren OCR isr grottenschlecht.
Vielleicht kannst du das dann dort final ja anbieten und adaptieren.
Ich habe noch nicht final entschieden, was wir mit dem OCR-Tool genau machen wollen in Puncto Veröffentlichen. Es gibt mehrere mögliche Szenarien, die ich gerade vergleiche. Ganz klar ist aber auf jeden Fall: Ich möchte, dass das Tool für möglichst viele Leute nutzbar wird und auch eine Pflege (Updates, etc.) dauerhaft sichergestellt werden.
Hallo @Stefan gibt es Neuigkeiten von dir zur Freigabe von Details deiner demonstrierten Lösung, die ja imposante Ergebnisse liefert?
Ich bin/war selbst am Suchen das OCR zu verbessern, jetzt gerade gescheitert an Surya wegen PyTorch und AVX2-Pflicht, was mit meiner DS1618+ nicht funktioniert. Vorherige Versuche brachten auch nur minimale Verbesserungen (derzeit ocrmypdf, tesseract).
Ich könnte ja auch meinen lokalen LLM Server nutzen, aber da fehlen mir noch die Erfahrungen mit den unterschiedlichen Möglichkeiten.
Würde mich wirklich sehr freuen, wenn du deine Lösung in irgendeiner Form veröffentlichen würdest.
Danke für deine Arbeit und die lohnenswerten Kurse/Masterclasses.