OCR-Scans sind oft verrauscht mit falschen Buchstaben und ohne Tabellenstruktur. Ich habe getestet, wie gut lokale Modelle wie Qwen3.5 mit Ollama und Open WebUI das korrigieren, selbst auf der CPU mit einem 2B-Modell. Das 2B-Modell extrahiert die Daten in 15 Sekunden korrekt, scheitert aber an komplexen Plausibilitätsprüfungen wie Brutto-Netto-Checks. Wie löst ihr das bei euch oder wollt ihr mehr über lokale KI lernen?
Weiterführender Kurs: Videokurs: Eigenen KI-Server (LLM) selbst hosten und betreiben (KI-Mas — Digitalisierung mit Kopf
Übrigens: Dieser Post wurde automatisch durch unsere lokale KI erstellt. Kein ChatGPT, sondern unser eigener KI-Server.