QR-Code Format für automatische Tag- und Dokumenttyp-Erkennung in Paperless-ngx

Krabtus · 6. November 2024 um 08:56

Hallo zusammen,

ich möchte gerne QR-Codes nutzen, um automatisch Dokumenttypen und Tags zuzuweisen. Mein Ziel ist, dass Paperless-ngx beim Scannen eines Dokuments die Informationen aus dem QR-Code liest und automatisch den Dokumenttyp und die Tags zuordnet.

Leider konnte ich bisher keine genaue Beschreibung finden, wie das Format des QR-Codes aussehen muss, damit Paperless-ngx die Inhalte korrekt erkennt und entsprechend kategorisiert.

Meine Fragen sind:

Gibt es eine spezifische Textstruktur, die im QR-Code enthalten sein muss, damit Paperless-ngx die Informationen richtig zuweist?
Muss der QR-Code einen bestimmten Schlüssel (z. B. type: oder tags:) enthalten, oder reicht es, die Begriffe einfach in einer Liste anzugeben?
Falls jemand bereits erfolgreich QR-Codes für die automatische Tag-Zuweisung genutzt hat, wäre ich für ein Beispiel sehr dankbar!

Ich habe es mal wie folgt versucht, leider ohne Erfolg:

type: Rechnung
tags: Steuer

Vielen Dank im Voraus für eure Hilfe!

huebi · 6. November 2024 um 09:43

Derzeit gibt es nur die ASN Codes und die Trennseiten.

Für den Rest ist eher der Classifier zuständig, der nach einem Training recht zuverlässig arbeitet.

Krabtus · 6. November 2024 um 10:11

Ach so, danke für die Info! Ich hatte tatsächlich angenommen, dass es über einen QR-Code möglich wäre, Dokumententypen und Tags automatisch und sicher zuzuweisen.

Nun werde ich mich wohl mit den Trennseiten auseinandersetzen müssen. Wie kann ich am einfachsten über einen Dokumentenscanner Dokumente hinzufügen, die den Dokumententyp „Rechnung“ und den Tag „Steuer“ enthalten sollen? Gibt es dazu einen unkomplizierten Weg für den Benutzer?

Oder wäre es auch möglich, im Docker-Verzeichnis einen Ordner anzulegen, den Paperless automatisch auf neue Dokumente prüft und entsprechend behandelt?

huebi · 6. November 2024 um 10:15

Du kannst im consume Folder Unterverzeichnisse anlegen, diese Mit einem tag versehen lassen aus welchem Unterverzeichnis sie stammen und darauf dann in deinem Arbeitabluaf darauf reagieren.

Aber was passt die am Classifier nicht, sprich der automatischen Zuordnung durch PLNGX? Bei mir ist die Fehlerrate sehr gering.

Krabtus · 6. November 2024 um 10:38

Aber die Fehlerrate wäre durch ein Unterverzeichnis im „consume“-Ordner praktisch null. So könnte man ohne Deckblatt oder QR-Code arbeiten und einfach direkt über das Touch-Display des Dokumentenscanners den Ordner für steuerrelevante Rechnungen auswählen. Paperless würde dann automatisch den Dokumententyp „Rechnung“ und den Tag „Steuer“ zuweisen.

Krabtus · 6. November 2024 um 12:03

Wie gehe ich dabei genau vor? Ich habe im Ordner „consume“ das Unterverzeichnis „steuern“ angelegt. Wie richte ich nun in paperless-ngx einen Arbeitsablauf ein, der dieses Unterverzeichnis regelmäßig auf neue Dokumente überprüft und, falls vorhanden, die Dokumente automatisch abruft, dem Dokumententyp „Rechnung“ zuweist und mit dem Tag „Steuern“ versieht?

Krabtus · 6. November 2024 um 12:34

Ich bin auf eine schöne Erklärung gestoßen.
Wer sucht der findet.

Paperless-ngx, Teil 17: Unterordner des consume-Verzeichnisses nutzen – Digital Cleaning

huebi · 6. November 2024 um 13:03

Das ganze wird hier ganz gut erläutert. Es fehlt aber letzte Schritt, das Tag am Ende wieder zu entfernen.

PS zu langsam.

Krabtus · 6. November 2024 um 14:03

Was meinst Du damit? Warum sollte man den Tag entfernen, es ist doch der Sinn darin die Dokumente mit einem Tag zu versehen.

huebi · 6. November 2024 um 14:11

Du reagierst auf die Herkunft und setzt bestimmte Attribute. Wenn die dann gesetzt sind, welchen Sinn hat dann noch die Herkunft?

nck23 · 15. November 2024 um 08:11

Beschäftige mich gerade mit der selben Frage und bin während dem Lesen auf die Idee gekommen eine x-beliebige einmalige Phrase auf das Dokument zu stempeln und dann durch die OCR Erkennung ein entsprechendes Tag setzen zu lassen.

Spricht da etwas dagegen?

Mein Scanner hat leider noch kein Touchdisplay (ScanSnap iX500) weshalb ich die Ordnerlösung so nicht komfortabel umsetzen kann.

Stefan · 15. November 2024 um 08:22

Man kann Tags auch einfach automatisch über QR-Codes setzen lassen. Schau gerne einmal in der Dokumentation nach. Falls du es nicht findest, melde dich gerne, dann suche ich.

huebi · 15. November 2024 um 08:35

https://docs.paperless-ngx.com/advanced_usage/#tag-assignment

Dann den beiden Links in dem Abschnitt folgen.

Und bevor fragen kommen: nein geht nicht für andere Attribute. Ich denke mal das sind Überbleibsel aus der Zeit vor dem matching/classifier/auto Zuweisung.

Bassman · 18. Oktober 2025 um 13:40

Ich habe mir die Avery L4731-Etiketten gekauft und dazu gibt es ja auch die kostenlose Software, die auch QR-erstellen kann. Hat jemand eine Lösung gefunden wie ich dort unter dem QR-Code auch eine laufende Nr. als Text für die Ablage mit einbauen kann? Bei den Barcodes klappt das, aber die ASN kann ich doch nur mit QR-Codes erzeugen, oder?

Jake · 18. Oktober 2025 um 13:52

Schau mal hier gibt es einen Generator für die QR codes.

Alternativ dazu kannst du auch fertige Bogen vom Stefan beziehen

Bassman · 18. Oktober 2025 um 17:38

Danke Dir Jake, die Labels von Stefan kenne ich, hatte aber günstig die Avery-Etiketten geschossen und wollte das einfach mal selber hinbekommen. Ich habe einen Epson Eco-Tank-Multifunktionsdrucker, der im Gegensatz zu einem Laserdrucker mehr verzerrt, ich habe es aber jetzt hinbekommen mit Randanpassung einen Bogen nach einigen Fehlläufen passend zu drucken. Ich muss noch die env entsprechend anpassen und testen ob das dann funktioniert. Erfolgt durch den QR-Code im Stapel auch die Dokumententrennung?

Update: In seinem Video zu den QR-Codes spricht er aber auch davon, dass die Dokumententrennung selber durch die QR-Codes erfolgt (die Trennblätter kenne ich). Ich habe den Bogen bedruckt und die QR-Codes sind auch nicht abgeschnitten, durch den Tintenstrahler aber wohl zu ungenau zu lesen und/oder zu klein.

Jake · 18. Oktober 2025 um 18:52

Zur Dokumententrennung gibts ein eigenes Video vom Stefan:

Stefan · 19. Oktober 2025 um 06:19

ASN-Labels trennen die Dokumente auch. Einfach nacheinander in einem Stapel scannen und man braucht keine Trennseiten mehr

Bassman · 19. Oktober 2025 um 11:21

Hi Stefan, leider werden die selbst gedruckten Labels per Paperless-Creator-Tool nicht erkannt.
Wird wohl, wie Du selber meintest am besseren Schriftbild des Laserdruckers liegen. Ich habe mit einem Epson ET gedruckt. Wie kann ich mit dem Debug prüfen, was Paperless erkennt? Danke