Vorstellung: Paperless-AI | KI für Paperless-NGX

Hallo zusammen,

Ich hatte mal Anfang Dezember letzten Jahres mein Projekt hier vorgestellt namens Paperless-AI.

Zu dem Zeitpunkt war das Projekt zwei Tage alt und noch in den Kinderschuhen. Nun nach einiger Zeit ist das System gereift und verbessert worden. Mittlerweile wurde die WebApp auf Cashysblog, in diversen Podcasts und Blogs gefeatured und mit fast 70.000 Downloads in 2 Monaten auf Herz und Nieren getestet.
Ich glaube das hier einige Gefallen an der Webapp finden und diese Wertschöpfend einsetzten werden.

Nochmal zu der Funktion und was Paperless-AI kann:

Ein automatischer Dokumentenanalysator für Paperless-ngx, der OpenAI API, Ollama und alle OpenAI API-kompatiblen Services nutzt, um Ihre Dokumente automatisch zu analysieren und zu kennzeichnen.
Es bietet: Automodus, Manueller Modus, Ollama und OpenAI, eine Chat-Funktion zur Abfrage Ihrer Dokumente mit AI, ein modernes und intuitives Webinterface.

Folgende Services und OpenAI API kompatible Services wurden erfolgreich getestet:

Ollama
OpenAI
DeepSeek.ai
OpenRouter.ai
Perplexity.ai
Together.ai
VLLM
LiteLLM
Fastchat
Gemini (Google)
… und es gibt möglicherweise noch viele mehr

Funktionen

  • Automatisches Scannen: Identifiziert und verarbeitet neue Dokumente in Paperless-ngx.
  • KI-gestützte Analyse: Nutzt OpenAI API, Ollama oder andere Dienste für eine präzise Dokumentenanalyse.
  • Metadaten-Zuordnung: Automatische Zuweisung von Titeln, Tags, document_type, Korrespondent und Custom Fields.
  • Vordefinierte Verarbeitungsregeln: Legen Sie fest, welche Dokumente auf der Grundlage vorhandener Tags verarbeitet werden sollen. (Optional) :new:.
  • Selektive Tag-Zuweisung: Nur ausgewählte Tags für die Verarbeitung verwenden. (Deaktiviert den Abfragedialog) :new:
  • Benutzerdefinierte Markierung: Weisen Sie den mit AI verarbeiteten Dokumenten zur leichteren Identifizierung ein bestimmtes Tag (Ihrer Wahl) zu. :new:
  • Manueller Modus: Manuelle Analyse von Dokumenten mit KI-Unterstützung in einer modernen Weboberfläche. (Erreichbar über den Endpunkt /manual) :new:
  • Interaktiver Chat: Stellen Sie Fragen zu Ihren Dokumenten und erhalten Sie präzise, KI-generierte Antworten. :new:

Alle weiteren Infos unter:
https://clusterzx.github.io/paperless-ai/

Beste Grüße in die Runde

2 „Gefällt mir“

Mal eine ganz „dumme“ Frage. Isz dies ein Addon on oder eine komplett eigne Paperless Version?

es ist eine erweiterung :slight_smile: einfach zu installieren, nur die KI-Modele sind etwas komplexer und je nach NAS brauchen sie ordentlich RAM

OK.

Was ist den ab RAM anzusetzen?

Würde das mit einer Test Instanz mal testen wollen.

Bei meinen 6gb RAM war ich bei 90% auslastung und konnte es nicht einrichten :slight_smile:

Hab das Tool schon vor ein paar Tagen oder Wochen gefunden.
Ich tu mich noch schwer damit was es mir wirklich bringen soll.

Mit einem schönen Video wäre wohl vielen potenziellen Usern geholfen! :slightly_smiling_face:

2 „Gefällt mir“

OK. Ich habe in meiner Synology 10 GB könnte theoretisch auf 20 GB gehen, die Frage ist ob die CPU Power dann reicht.

Werde es trotzdem mal versuchen. Scheint dann wohl eher was für richtige Server zu sein mit mehr Power.

Blöde Frage, arbeitet das mit der „einfachen Version“ mit der man auch seine Daten verkauft oder mit den Bezahl-Lösungen?

1 „Gefällt mir“

OK. Gibt es eine bezahl Version?

Wie gesagt bin auch noch recht Neu. Von welcher Software soll es eine „bezahl“-Version geben?

https://chatopenai.de/faq/

Hi!
Ich finde das Tool hört sich sehr vielversprechend an! Da ich aber insbesondere meine Datenablage nicht dem Weltwissen von ChatGPT zur Verfügung stellen möchte, kommt nur eine lokales AI Modell in Frage. Dazu ist vermutlich ziemlich potente Hardware erforderlich, oder? Kann jemand Erfahrungsberichte teilen?
Viele Grüße, HennD

Ich hab es mit Ollama versucht , verschiedene Versionen aber meine Nas mit 6Gb ram schafft das nicht :slight_smile:

Sobald ich alle Dokumente von EcoDMS in mein Paperless gezogen habe und dann eine Sicherung erstellt habe, werde ich es mal versuchen.

Mal sehen was die 10 GB sagen. Aber erstmal muss alles rüber, damit ich im Notfall wieder auf den Stand zurück komme den ich brauche.

Ich glaube je nach Model benötigst du mehr RAM.
Ich nutze Ollama mit einem kleineren Model und 8GB RAM erfolgreich. Die CPU ist mein Flaschenhals, aber es tut seinen Dienst. Ich habe Ollama im Docker Container laufen.

Hallo Zusammen!
Was wären denn aus Eurer Erfahrung die Minimalanforderungen, um Papeless AI zu nutzen? Es geht mir nicht so sehr um das Chatten mit den Dokumenten. Vielmehr finde ich die Idee der Entity Extraction und daraus abgeleitet die automatische Vergabe von Tag, Doku-Typ und Korrespondent interessant. Aktuell steht mir nur ein Mini PC als Heimserver zur Verfügung (AMD R7 5825U/ 16GB DDR4 512GB SSD Radeon RX Vega 8). Darauf läuft Proxmox. Paperless steckt in einem LXC Container. Daneben läuft noch ein VM mit Home Assistant (und darin das Frigate Modul, für das eine Coral USB Dongle genutzt wird).
Aufgrund des kleinen RAM kommt dann ja auch nur das kleinste LLAMA Modell in Fragen, oder? Und liefert das schon ausreichend gute Ergebnisse?
VG

Also ich sehe hier keine Notwendigkeit noch eine zusätzliche KI zu installieren. Der eingebaute Automatismus reicht mir vollkommen aus, und wo diese daneben liegt kann ich die Zuordnung schnell ändern. Ich nutze es allerdings nur privat, mit entsprechend wenigen Dokumenten

Vielen Dank für das Projekt! Ich finde es auch sehr cool :slight_smile:

Ich habe meinen alten Gaming-PC in meinem Server-Raum abgestellt und Ollama installiert. Mit OpenWebUI habe ich jetzt eine Ki, die tatsächlich nicht so langsam ist (Ryzen 7 1700, NVIDIA 1080, 32 GB DDR4 RAM).

Für Paperless-AI musste ich den Port freigeben, damit ich auch von außerhalb (lokal) Zugriff habe.

Jetzt habe ich jedoch noch eine Frage: Die Tags von Paperless-AI werden in Englisch gesetzt. Kann ich diese auch auf Deutsch setzen? Gibt es die Möglichkeit, einen System-Prombt zu setzen?

Liebe Grüße