Drücke „Enter”, um zum Inhalt zu springen.
Hinweis zu diesem Datenschutz-Blog:
Anscheinend verwenden Sie einen Werbeblocker wie uBlock Origin oder Ghostery, oder einen Browser, der bestimmte Dienste blockiert.
Leider wird dadurch auch der Dienst von VG Wort blockiert. Online-Autoren haben einen gesetzlichen Anspruch auf eine Vergütung, wenn ihre Beiträge oft genug aufgerufen wurden. Um dies zu messen, muss vom Autor ein Dienst der VG Wort eingebunden werden. Ohne diesen Dienst geht der gesetzliche Anspruch für den Autor verloren.

Ich wäre Ihnen sehr verbunden, wenn Sie sich bei der VG Wort darüber beschweren, dass deren Dienst anscheinend so ausgeprägt ist, dass er von manchen als blockierungswürdig eingestuft wird. Dies führt ggf. dazu, dass ich Beiträge kostenpflichtig gestalten muss.

Durch Klick auf folgenden Button wird eine Mailvorlage geladen, die Sie inhaltlich gerne anpassen und an die VG Wort abschicken können.

Nachricht an VG WortMailtext anzeigen

Betreff: Datenschutzprobleme mit dem VG Wort Dienst(METIS)
Guten Tag,

als Besucher des Datenschutz-Blogs Dr. DSGVO ist mir aufgefallen, dass der VG Wort Dienst durch datenschutzfreundliche Browser (Brave, Mullvad...) sowie Werbeblocker (uBlock, Ghostery...) blockiert wird.
Damit gehen dem Autor der Online-Texte Einnahmen verloren, die ihm aber gesetzlich zustehen.

Bitte beheben Sie dieses Problem!

Diese Nachricht wurde von mir persönlich abgeschickt und lediglich aus einer Vorlage generiert.
Wenn der Klick auf den Button keine Mail öffnet, schreiben Sie bitte eine Mail an info@vgwort.de und weisen darauf hin, dass der VG Wort Dienst von datenschutzfreundlichen Browser blockiert wird und dass Online Autoren daher die gesetzlich garantierten Einnahmen verloren gehen.
Vielen Dank,

Ihr Klaus Meffert - Dr. DSGVO Datenschutz-Blog.

PS: Wenn Sie meine Beiträge oder meinen Online Website-Check gut finden, freue ich mich auch über Ihre Spende.
Ausprobieren Online Webseiten-Check sofort DSGVO-Probleme finden
Externe Links sind mit dem Symbol Externer Link Symbol gekennzeichnet. Datenschutzinfo

Kassenbons automatisch auswerten: Wie KI und OCR zusammenarbeiten

0
Dr. DSGVO Newsletter erkannt: Erweiterte Funktionen verfügbar
Artikel als PDF · Mehr Inhalte & kompakte Kernaussagen · Webseiten-Checks · Offline-KI Live
Standardansicht: Dr. DSGVO Newsletter nicht erkannt. Erweiterte Funktionen nur für Abonnenten:
Artikel als PDF · Mehr Inhalte & kompakte Kernaussagen · Webseiten-Checks · Offline-KI Live

Wer kennt es nicht: Ein Stapel Kassenbons, der irgendwo auf dem Schreibtisch liegt und händisch in eine Tabelle übertragen werden muss – ob für die Buchhaltung, die Spesenabrechnung oder die Warenwirtschaft. Was früher Stunden dauerte, lässt sich heute in Sekunden erledigen. Möglich macht das die Kombination aus klassischer Texterkennung (OCR) und moderner KI. Doch was steckt dahinter – technisch, strategisch und praktisch?

Was ist OCR – und was kann KI besser?

OCR steht für Optical Character Recognition, also optische Zeichenerkennung. Das Prinzip ist seit Jahrzehnten bekannt: Ein Algorithmus analysiert ein Bild und wandelt erkannte Zeichenmuster in maschinenlesbaren Text um. Klassische OCR-Systeme arbeiten regelbasiert und sind auf saubere, einheitliche Druckschriften optimiert. Bei Kassenbons stoßen sie jedoch schnell an ihre Grenzen.

Kassenbonpapier ist thermisch bedruckt, verblasst mit der Zeit, knickt leicht, und das Schriftbild variiert von Kassenmodell zu Kassenmodell erheblich. Hinzu kommen Handnotizen, zerrissene Ränder oder schlecht eingescannte PDFs.

Optimale Ergebnisse bei maximaler Datensicherheit – dank optimierter eigener KI.

Moderne KI-gestützte OCR-Modelle gehen einen anderen Weg: Statt fixer Mustererkennung wurden sie auf Millionen von Dokumenten trainiert und lernen kontextabhängig. Sie erkennen nicht nur einzelne Zeichen, sondern verstehen strukturelle Zusammenhänge – etwa, dass nach einem Artikelnamen eine Menge, ein Einzelpreis und eine Zeilensumme folgen. Das ermöglicht eine deutlich robustere Erkennung auch bei schlechter Druckqualität, schiefer Ausrichtung oder fragmentierten Zeilen.

Warum lokale KI der strategisch klügere Weg ist

Ein zentraler Punkt, der bei der Planung solcher Systeme oft unterschätzt wird: der Betriebsort der KI.

Cloud-Dienste wie Azure AI, Google Vision oder ChatGPT-basierte APIs sind schnell integriert – aber sie bringen strukturelle Nachteile mit sich:

Kosten skalieren mit dem Volumen. Wer tausende Bons monatlich verarbeitet, zahlt entsprechend. Lokale Modelle hingegen laufen nach einmaliger Einrichtung ohne laufende API-Kosten.

Einige Features der Kassenbon-Lösung "John Bon" im Kassenbon-Format.

Datenschutz und Datensicherheit sind bei Kassenbons besonders relevant. Belege können personenbezogene Daten, Geschäftszahlen oder Einkaufsmuster enthalten – Daten, die niemals unkontrolliert externe Server verlassen sollten. Lokal bedeutet: Die Daten bleiben im Haus.

Strategie und Unabhängigkeit: Wer auf einen Cloud-Dienst aufbaut, ist abhängig von dessen Verfügbarkeit, Preisgestaltung und API-Änderungen. Ein lokal betriebenes Modell gehört dem Betreiber vollständig.

Qualität und Kontrolle: Lokale Modelle lassen sich auf spezifische Anwendungsfälle konfigurieren und feinabstimmen – ohne Kompromisse durch generische Cloud-Dienste.

Das bedeutet nicht, dass lokale KI schwächer ist. Aktuelle Open-Source-Modelle und spezialisierte OCR-Engines erreichen in definierten Domänen Erkennungsgenauigkeiten, die kommerziellen Cloud-Diensten ebenbürtig oder überlegen sind.

Mehr als nur Texterkennung: Das Zusammenspiel von KI und klassischer Logik

Ein häufiger Denkfehler: KI übernimmt alles. In der Praxis ist ein solides Auswertungssystem ein Zusammenspiel aus KI-gestützter Erkennung und klassischer, regelbasierter Prüflogik – zwei Komponenten, die einander verstärken.

Die KI erkennt und strukturiert den Text. Sie liefert Rohdaten: Artikel, Mengen, Preise, Gesamtsummen, Steuerausweise. Was mit diesen Daten passiert, ist klassische Programmlogik – und dort ist sie unschlagbar präzise.

OCR mit Vorstufe. ANwendbar auf zahlreiche Probleme der Objekterkennung!

Was heißt das konkret? Eine zuverlässige Kassenbon-Auswertung prüft nach der Texterkennung unter anderem:

  • Stimmt Menge × Einzelpreis mit der ausgewiesenen Zeilensumme überein?
  • Ergibt die Summe aller Positionen zuzüglich Rabatte und Pfand die Gesamtsumme?
  • Ist der ausgewiesene Mehrwertsteuerbetrag korrekt berechnet?
  • Stimmt das ausgewiesene Rückgeld mit der Differenz aus Gegeben und Gesamtbetrag überein?
  • Entspricht die angegebene Artikelanzahl der Zahl erkannter Positionen?
  • Tauchen identische Artikel doppelt auf – OCR-Fehler oder tatsächlicher Doppelkauf?

Solche Querprüfungen sind ohne KI implementierbar und bilden die zweite Sicherheitsebene hinter der Erkennung. Sie machen den Unterschied zwischen einem System, das Text extrahiert, und einem, das tatsächlich versteht, ob ein Bon korrekt ist.

Ergebnisse können dabei nach Schweregrad klassifiziert werden – etwa als kritischer Fehler, Hinweis oder reine Information – und lassen sich strukturiert exportieren, weiterverarbeiten oder über eine REST-API in bestehende Systeme einbinden.

Leistungsfähigkeit moderner KI-OCR: Was wirklich möglich ist

Wer erstmals mit KI-gestützter Texterkennung arbeitet, unterschätzt oft, wie weit die Fähigkeiten moderner Modelle über das hinausgehen, was klassische Lösungen leisten konnten. Drei Bereiche stechen dabei besonders hervor.

Mehrere Dokumente auf einem einzigen Bild. In der Praxis landen Kassenbons selten perfekt einzeln und gerade ausgerichtet auf dem Scanner. Häufig werden mehrere Bons zusammen fotografiert oder eingescannt – nebeneinander, leicht überlappend, gegeneinander gedreht. Ein leistungsfähiges System erkennt jeden einzelnen Bon als eigenständiges Objekt, segmentiert ihn sauber aus dem Gesamtbild und wertet ihn separat aus – ohne manuelle Vorsortierung. Das spart erheblichen Aufwand bei der Erfassung im Alltag.

REWE Markt GmbH Kassiererin: Anna Vollmilch 1,09 Butter 1,69 Brot 2,49 Eier 10St. 2,29 ——– Gesamt: 7,56 Bar: 10,00 Rückgeld: 2,44 MwSt 7%: 0,49 Beleg-Nr: 00471
EDEKA Nord 23.05.25 09:14 Joghurt 0,89 Müsli 2,19 Orangensaft 1,49 Schinken 3,29 Käse 2,85 ——— Summe: 10,71 Gegeben: 15,00 Zurück: 4,29 Art. 5
Penny Markt Filiale 0082 Nudeln 0,79 Tomatens. 0,55 Hackfl. 3,49 Zwiebeln 0,39 Knoblauch 0,29 —— Total: 5,51 Karte: 5,51 Belegnr: 2291 Dankeschön!
Netto Marken-Discount Waschmittel 4,99 Spülmittel 1,29 Klopapier 3,79 Zahnbürste 1,19 ———- GESAMT: 11,26 BAR: 20,00 RÜCKGELD: 8,74 USt 19%: 1,80 Kd-Nr: 00039182
Lidl Filiale Bananen 0,49 Äpfel 1kg 1,99 Joghurt 0,79 Quark 0,69 Milch 0,99 —— Gesamt: 4,95 EC-Karte: 4,95 PAN: ****7731 Genehmigt
Bon #1 · 99,8 %
Bon #2 · 99,2 %
Bon #3 · 99,5 %
Bon #4 · 98,7 %
Bon #5 · 99,1 %
0 Bons erkannt
Erkennungszeit
Ø Konfidenz
Überlappungen
Scan starten, um Bounding-Box-Erkennung zu demonstrieren

Bounding-Box-Erkennung nahezu in Echtzeit. Noch bevor die eigentliche Texterkennung einsetzt, kann das System die genauen Umrisse jedes erkannten Objekts im Bild als sogenannte Bounding Boxes bestimmen – also die exakten rechteckigen Rahmen, die jedes Dokument oder Objekt einschließen. Das geschieht nahezu in Echtzeit und ist weit mehr als ein Nebenprodukt: Diese Fähigkeit zur präzisen Objektlokalisierung ist dieselbe Technologie, die beispielsweise Pakete auf einem Förderband erkennt und vermisst, Produkte im Regal klassifiziert oder industrielle Bauteile in Bewegung identifiziert. Der Kassenbon ist gewissermaßen der einfachste Testfall für eine Technologie mit erheblich breiterem Einsatzpotenzial.

OCR-Qualität, die das menschliche Auge übertriffft. Thermopapier ist das Nemesis klassischer Texterkennung: Es verblasst mit Wärme, Licht und Zeit – manchmal so stark, dass selbst ein geübtes Auge einzelne Zeichen kaum noch entziffern kann. Moderne KI-Modelle wurden auf genau solchen Grenzfällen trainiert. Sie nutzen Kontextinformationen, Zeichenwahrscheinlichkeiten und gelernte Schriftmuster, um auch stark ausgeblichene Passagen mit hoher Zuverlässigkeit zu rekonstruieren. In definierten Testszenarien übertreffen sie dabei die menschliche Erkennungsgenauigkeit – nicht weil KI grundsätzlich schärfer sieht, sondern weil sie Muster dort ergänzt, wo visuelle Information bereits verloren gegangen ist.

Diese drei Eigenschaften zusammen – Mehrfachobjekterkennung, Echtzeit-Lokalisierung und übermenschliche Zeichenrekonstruktion – definieren, was eine professionelle KI-OCR-Lösung von einem einfachen Scan-to-Text-Tool unterscheidet.

Von der Idee zur Lösung: John Bon

Genau diesen Ansatz verfolgt John Bon, eine lokal betreibbare Auswertungsplattform für Kassenbons und Belege. Das System kombiniert KI-gestützte OCR mit einer mehrstufigen Querprüfung und liefert strukturierte Ergebnisse im JSON- oder Textformat – direkt exportierbar, in die Zwischenablage kopierbar oder per API abrufbar.

Der Ablauf ist bewusst einfach gehalten:

  1. Bild oder PDF hochladen – per Drag & Drop oder Klick, bei PDFs mit wählbarem Seitenbereich
  2. Automatische Texterkennung, Strukturierung und Verifikation – in unter einer Sekunde
  3. Ergebnis exportieren, weiterverarbeiten oder archivieren

Jede Seite wird dabei einzeln ausgewertet und mit Vorschaubild sowie Vollansicht dargestellt – so behält man immer den Überblick zwischen Original und Analyse.

Das System ist darauf ausgelegt, auch bei schlechter Druckqualität, verblasstem Thermopapier oder handschriftlichen Ergänzungen zuverlässig zu arbeiten.

Was noch möglich ist: Eine Technologie, viele Anwendungen

Das Interessante an einer solchen OCR-KI-Infrastruktur: Sie ist nicht auf Kassenbons beschränkt. Der technische Kern – Bilderkennung, Textextraktion, strukturierte Ausgabe, regelbasierte Prüflogik – ist domänenunabhängig. Ein neuer Anwendungsfall erfordert in der Regel keine neue Infrastruktur, sondern lediglich eine neue Konfiguration.

Anwendungsdomänen für OCR-Erkennung und Bounding Box- (oder Bounding Polygon-) Erkennung.

Das erschließt eine bemerkenswerte Bandbreite wirtschaftlich relevanter Szenarien:

Dokumente und Belege (Rechnungen, Lieferscheine, Quittungen) sind der natürliche Verwandte des Kassenbons – gleiche Logik, andere Struktur.

Schilder und Beschriftungen lassen sich automatisch erkennen und klassifizieren – relevant für Logistik, Retail oder Qualitätssicherung.

Industrieetiketten und Barcodes mit Chargennummern, Gewichts- und Materialangaben können ohne manuelle Eingabe erfasst werden.

Formulare – gedruckt wie handschriftlich – mit Checkboxen, Tabellen und Freitextfeldern können automatisch ausgelesen und strukturiert werden.

Objekte im 3D-Raum: Hier verlässt man die reine Dokumentenwelt. Erkennung, Vermessung und Datenextraktion aus physischen Objekten beliebiger Form und Ausrichtung – ein Gebiet, das in Fertigung, Intralogistik und Qualitätskontrolle zunehmend an Bedeutung gewinnt.

Der gemeinsame Nenner: einmal aufgebaute Infrastruktur, vielfach nutzbar. Das macht solche Systeme nicht nur technisch interessant, sondern wirtschaftlich hochattraktiv.

Massendatenverarbeitung und Skalierbarkeit

Ein weiterer Aspekt, der in der Praxis entscheidend ist: Skalierung. Wer nicht nur einzelne Bons prüft, sondern tausende pro Tag – etwa im Einzelhandel, in der Buchhaltung oder im Außendienst – benötigt Batch-Verarbeitung.

Leistungsfähige Systeme verarbeiten große Mengen von Bildern oder PDFs in einem Durchlauf, vollautomatisch, ohne manuelle Einzelbearbeitung. Die Anbindung per REST-API ermöglicht die Integration in bestehende Softwarelandschaften – von der Warenwirtschaft bis zum ERP-System.

Fazit

Die automatische Auswertung von Kassenbons ist ein hervorragendes Beispiel dafür, wie KI und klassische Programmlogik gemeinsam mehr leisten als jede Technologie für sich allein. KI bringt Robustheit bei unstrukturierten, variablen Eingaben. Regelbasierte Logik bringt Präzision und Nachvollziehbarkeit bei der Prüfung.

🔒 Lokal · datenschutzkonform · keine Cloud

Kassenbons in Sekunden automatisch auswerten

KI-gestützte Texterkennung mit 12-facher Querprüfung — Rechenfehler, MwSt., Rückgeld und Duplikate auf einen Blick. Export als JSON, Text oder per REST-API.

Bilder & PDFs Unter 1 Sekunde Batch & API Kein Cloud-Zwang
99,7 % Erkennungsrate
12× Querprüfung
< 1 s Pro Bon
John Bon entdecken →

Entscheidend für eine professionelle, skalierbare und datenschutzkonforme Lösung ist dabei der lokale Betrieb – unabhängig von Cloud-Diensten, vollständig kontrollierbar, kosteneffizient im laufenden Betrieb.

Wer diese Infrastruktur einmal aufgebaut hat, hält einen technologischen Baustein in der Hand, der weit über den ursprünglichen Anwendungsfall hinausreicht.

KI-Beratung, KI-Lösungen

Umfassende Beratung (fachlich, rechtlich, technisch):

Leistungsangebot:

  • Erstberatung inkl. Machbarkeitsaussagen
  • Schulungen und Workshops für Führungskräfte, Berufsgeheimnisträger, Angestellte, Entwickler
  • KI-Lösungen mit und ohne ChatGPT/Azure. Cloud oder eigener KI-Server

Ihre Anfrage

Oder Mail an ki@dr-dsgvo.de

Wer schreibt hier?
Mein Name ist Klaus Meffert. Ich bin promovierter Informatiker und beschäftige mich seit über 30 Jahren professionell und praxisbezogen mit Informationstechnologie. In IT & Datenschutz bin ich auch als Sachverständiger tätig. Ich stehe für pragmatische Lösungen mit Mehrwert. Meine Firma, die IT Logic GmbH, berät Kunden und bietet Webseiten-Checks sowie optimierte & sichere Lösungen an (mit und ohne KI).
Bitte nutzen Sie bei Verwendung meiner Ergebnisse die Quellenangabe oder verlinken Sie gut wahrnehmbar auf diesen Artikel:
Einen Kurzlink oder eine Bestätigung für Ihre Quellenangabe erhalten Sie kurzfristig auf Anfrage. Ein Teilen oder Verteilen dieses Beitrags ist natürlich ohne weiteres möglich und gewünscht.

Schreiben Sie einen Kommentar

Ihre Mail-Adresse wird nicht veröffentlicht.

KI in der Qualitätskontrolle: Defekte in Bauteilen automatisch erkennen