Drücke „Enter”, um zum Inhalt zu springen.
Hinweis zu diesem Datenschutz-Blog:
Anscheinend verwenden Sie einen Werbeblocker wie uBlock Origin oder Ghostery, oder einen Browser, der bestimmte Dienste blockiert.
Leider wird dadurch auch der Dienst von VG Wort blockiert. Online-Autoren haben einen gesetzlichen Anspruch auf eine Vergütung, wenn ihre Beiträge oft genug aufgerufen wurden. Um dies zu messen, muss vom Autor ein Dienst der VG Wort eingebunden werden. Ohne diesen Dienst geht der gesetzliche Anspruch für den Autor verloren.

Ich wäre Ihnen sehr verbunden, wenn Sie sich bei der VG Wort darüber beschweren, dass deren Dienst anscheinend so ausgeprägt ist, dass er von manchen als blockierungswürdig eingestuft wird. Dies führt ggf. dazu, dass ich Beiträge kostenpflichtig gestalten muss.

Durch Klick auf folgenden Button wird eine Mailvorlage geladen, die Sie inhaltlich gerne anpassen und an die VG Wort abschicken können.

Nachricht an VG WortMailtext anzeigen

Betreff: Datenschutzprobleme mit dem VG Wort Dienst(METIS)
Guten Tag,

als Besucher des Datenschutz-Blogs Dr. DSGVO ist mir aufgefallen, dass der VG Wort Dienst durch datenschutzfreundliche Browser (Brave, Mullvad...) sowie Werbeblocker (uBlock, Ghostery...) blockiert wird.
Damit gehen dem Autor der Online-Texte Einnahmen verloren, die ihm aber gesetzlich zustehen.

Bitte beheben Sie dieses Problem!

Diese Nachricht wurde von mir persönlich abgeschickt und lediglich aus einer Vorlage generiert.
Wenn der Klick auf den Button keine Mail öffnet, schreiben Sie bitte eine Mail an info@vgwort.de und weisen darauf hin, dass der VG Wort Dienst von datenschutzfreundlichen Browser blockiert wird und dass Online Autoren daher die gesetzlich garantierten Einnahmen verloren gehen.
Vielen Dank,

Ihr Klaus Meffert - Dr. DSGVO Datenschutz-Blog.

PS: Wenn Sie meine Beiträge oder meinen Online Website-Check gut finden, freue ich mich auch über Ihre Spende.
Ausprobieren Online Webseiten-Check sofort das Ergebnis sehen
Externe Links sind mit dem Symbol Externer Link Symbol gekennzeichnet. Datenschutzinfo

Offline-KI Showcase: Digitalisierung von Dokumenten

Deutsche Version (Original)
0
Dr. DSGVO Newsletter erkannt: Erweiterte Funktionen verfügbar
Artikel als PDF · Mehr Inhalte & kompakte Kernaussagen · Webseiten-Checks · Offline-KI Live
Standardansicht: Dr. DSGVO Newsletter nicht erkannt. Erweiterte Funktionen nur für Abonnenten:
Artikel als PDF · Mehr Inhalte & kompakte Kernaussagen · Webseiten-Checks · Offline-KI Live
📄 Artikel als PDF (nur für Newsletter-Abonnenten)
🔒 Premium-Funktion
Der aktuelle Beitrag kann in PDF-Form angesehen und heruntergeladen werden

📊 Download freischalten
Der Download ist nur für Abonnenten des Dr. DSGVO-Newsletters möglich

Die Digitalisierung von Dokumenten funktioniert mit Offline-KI beliebig gut. Offline-KI ist eine lokal laufende KI, die oft besser als ChatGPT, datenfreundlich und günstig ist. Dazu gehört das Erkennen von Texten und Bildern sowie die semantische Suche in diesen extrahierten Informationen. Der Showcase zeigt konkrete Details.

Was ist Offline-KI?

Manche verstehen vielleicht "Offline-GPT" besser. Offline-KI hat allerdings nichts mit OpenAI und anderen Drittanbietern zu tun.

Eine Offline-KI läuft auf einem eigenen Computer. Das kann entweder eine gekaufte Hardware oder eine Miet-Hardware sein. Offline bedeutet, dass die KI keine Daten an Dritten sendet. Die Offline-KI kann bei Bedarf auf das Internet zugreifen oder mit anderen IT-Systemen kommunizieren.

Offline-KI kann für viele Anwendungsfälle, wie beispielsweise für die Digitalisierung von Dokumenten, erheblich bessere Ergebnisse als mit ChatGPT und andere Cloud-Dienste produzieren. In Unternehmen geht es oft um tausende von Dokumenten. Die Kosten bei Cloud-Diensten sind oft unberechenbar und zudem bei vielen Anfragen teuer. Offline-KI bietet eine günstige Kosten-Flatrate. Die volle Datenkontrolle ist für viele ebenfalls ein Grund, ChatGPT oder Microsoft Azure nicht zu nutzen.

Offline-KI kann oft mehr als ChatGPT, ist günstiger und bietet volle Datenkontrolle sowie Online-Zugriffsmöglichkeiten.

Was bedeutet Digitalisierung von Dokumenten?

Digitalisierung bedeutet das Umwandeln von analogen in digitale Informationen. Oft handelt es sich dabei um das Konvertieren von Papierdokumenten in digitale Abbilder (Dateien). Dazu wird das Papierdokument eingescannt oder fotografiert. Danach wird das daraus entstandene Bild ausgewertet (auch bei einem Scan entsteht ein Bild!).

Am Beispiel eines Dokuments des Europäischen Datenschutzausschusses (EDSA) wird gezeigt, wie Offline-KI bei der Digitalisierung von Dokumenten helfen kann.

Ein PDF-Dokument des Europäischen Datenschussausschusses (EDSA) als Beispiel.

Die oben gezeigten Bilder stellen die Seiten eines PDF-Dokuments dar. Diese Bilder entstehen entweder durch Einscannen oder durch Umwandeln eines PDF-Dokuments in Einzelseiten.

Nachdem das Dokument eingescannt (oder fotografiert wurde), wird es mit Offline-KI ausgewertet. Dabei wird der enthaltene Dokumententext ermittelt. Weitergehende Verfahren erkennen auch Bilder und deren Inhalte.

Mit Offline-KI können sogar Bilder beschrieben werden. Hier ein Screenshot einer Folie zum Thema Offline-KI.

Beispielbild für Erkennung von Bildinhalten durch eine Offline-KI. Einer Präsentation zum Thema "Offline-KI" entnommen.

Die Offline-KI hatte nun die Aufgabe, zu beschreiben, was das Bild darstellt. Hier das Ergebnis:

a black and white drawing of a man with horns, ikea manual, as a d & d monster, a an ai generated image

Die deutsche Übersetzung liefert die Offline-KI auf Wunsch ebenfalls:

Eine schwarze und weiße Zeichnung eines Mannes mit Hörnern, IKEA-Manual, als D&D-Monster, eine AI-generierte Abbildung

Wer die ukrainische, türkische, spanische, italienische oder polnische Version benötigt, dem kann mit Offline-KI ebenfalls geholfen werden:

  • Ukrainisch: Чорно-біле малювання чоловіка з рогами, посібник IKEA, як монстр D&D, а також зображення, згенероване AI
  • Türkisch: bir adamın kulakları olan siyah ve beyaz bir çizim, ikea kılavuzu, d&d canavarı olarak, bir ai oluşturulmuş görüntü
  • Spanisch: Un dibujo en blanco y negro de un hombre con cuernos, manual de IKEA, como un monstruo de D&D, una imagen generada por inteligencia artificial
  • Italienisch: disegno a matita nero e bianco di un uomo con corna, manuale Ikea, come mostro D&D, immagine generata da AI
  • Polnisch: rysunek czarno-biały mężczyzny z rogami, instrukcja IKEA, jako potwór D&D, obraz generowany przez AI

Die Übersetzungen wurden mit dem bisherigen Goldstandard, DEEPL, verifiziert und unverändert hier wiedergegeben.

Der nächste Schritt könnte das Erkennen von Abschnitten/Blöcken sein.

Abschnitte, die von der KI im PDF erkannt wurden.

Die in der Abbildung gezeigten Blöcke wurden automatisch erkannt und markiert. Sie dienen als Vorstufe für eine leistungsfähige Erkennung von Text- und Bildinformationen.

Wie viele Informationen in solchen Blöcken stecken können, zeigt folgende Abbildung.

Mit KI automatisch erkannte Blöcke auf diversen Seiten eines PDF-Dokuments (Auszug).

Die gezeigten Textabschnitte wurden vollautomatisch erkannt. Dem Anwender stehen nun mehrere Möglichkeiten zur Verfügung. Informationen können ebenso im Fließtext gefunden werden als auch mit strenger Suche. Die strenge Suche ermittelt nur Treffer für Abschnitte, die jeweils den gesamten Suchbegriff enthalten. Statt eines Suchbegriffs können auch Fragen an das Dokument gestellt werden. Der Anwender sieht am Ende aus Komfortgründen nur seine Suchmaske (Eingabefeld) sowie die Ergebnisse. Die oben gezeigten Abbildungen sieht er nur auf Wunsch.

Eigene Dokumente befragen: Mit Offline-KI nicht nur besser möglich als mit ChatGPT, sondern auch günstiger und mit voller Datenkontrolle.

Darüber hinaus ist es beispielsweise auch möglich, zu einer vorgegebenen Dokumentenseite die semantisch ähnlichen Seiten zu finden.

Im Beispiel hier wurden die Seiten gefunden, die zu einer Vorgabeseite (1. Seite links oben) optisch ähnlich sind. Optische Ähnlichkeit liegt in diesem Beispiel vor, wenn der grau hinterlegte Kasten in anderen Seiten auch vorkommt. Dies ist in den Seiten 3 bis 8 (von links nach rechts, von oben nach unten) der Fall. Als Gegenbeispiel wurde die Seite 2 als optisch unähnliche Textseite mit angezeigt.

Es können aber auch semantische Suchen nach Text ausgeführt werden. Die Suche nach Dokumenten und deren Seiten kann so leistungsfähig mit Offline-KI durchgeführt werden. Beispielsweise wurde im o.g. digitalisierten PDF-Dokument nach „personenbezogene Daten“ gesucht.

Einige der Treffer sind hier zu sehen:

Gefundene Dokumente für Suche nach "personenbezogene Daten".

Selbstverständlich kann die Offline-KI die Treffer direkt als Text anzeigen. Lediglich für das Beispiel wurden hier die Treffer in Form der Seiten-Screenshots dargestellt.

Ein Detailtreffer zu dieser Suchanfrage ist hier gezeigt:

Ein Treffer im Detail: Die semantische Suche hat Unschärfen kompensiert und zeigt eine Trefferwahrscheinlichkeit mitsamt Markierung im Text (Original ist ein Bild!).

Ohne weiteren Aufwand wurden auch Treffer gefunden, die das Gleiche meinen, aber eine andere Ausdrucksweise verwenden. Die Unschärfe zwischen „personenbezogene“ und „personenbezogener“ wurde automatisch durch die KI ausgeglichen. Dieses sehr einfache Beispiel kann nahezu beliebig leistungsfähig ausfallen.

Ein leistungsfähiges Beispiel für semantische Suche ist zum Frage-Antwort-Assistenten für den Dr. DSGVO Blog beschrieben.

Ähnlichkeitssuche

Wie wäre es, wenn man zu einem Bild die semantisch ähnlichsten Bilder finden könnte? Ein Bär ist ein Bär, eine Katze eine Katze. Egal, ob das jeweilige Tier (oder Objekt, falls andere Bilder) groß oder klein ist, links oder oben im Bild ist oder ob nur der Kopf oder eine Vollaufnahme zu sehen ist.

Für Dokumenten-Seiten ist das Ergebnis ähnlich beeindruckend:

Rückwärtssuche: Zu einem Bild (hier: einer Dokumentenseite) werden die optisch am ähnlichsten Exemplare gefunden.

Rechts im Bild die Seite aus einem PDF-Dokument, für die ähnliche Seiten gefunden werden sollen. Links im Bild die Seiten, die eine optische Ähnlichkeit aufweisen. Die Ähnlichkeit besteht hier aus dem Textfluss, aber vor allem aus dem grau hinterlegten Block. Wären Bilder im Ausgangsbild zu sehen, würden diese berücksichtigt. Stattdessen hätte man auch nach dem Text, der im Bild zu sehen ist, ähnliche Dokumente finden können. Die Möglichkeiten sind endlos.

Zum Abschluss noch ein kurzes Beispiel, dass Informationen auch in anspruchsvolleren Bildern erkannt werden können.

Das Eingabebild ist Folgendes. Es wurde mit einem alten Handy, in niedriger Auflösung und unter schlechten Lichtverhältnissen angefertigt:

Bild eines Teils eines Reifens, in dem Text erkannt werden soll.

Die untrainierte Offline-KI hat in einer Dreivierteilsekunde auf einem Laptop folgende Angaben erkannt, markiert und extrahiert:

Erkannte Angaben auf einem Reifen, automatisch eingefügte Bounding Boxes.

Die Kernangaben wurden erkannt und deren Position zurückgegeben. So konnte die Seriennummer 49865 korrekt und die Nummer A055247 fast korrekt erkannt werden (das „A“ wurde als „4“ erkannt, was auch einem Menschen kaum erkennbar ist).

Wie zu sehen ist, sind ein paar Angaben unerkannt. Hierfür gibt es mehrere Lösungen:

  • Bild automatisch drehen und Erkennung erneut durchführen
  • Semantischer Vergleich der Buchstaben und Ziffern mit Offline-KI und einmal trainiertem KI-Modell
  • KI-Modell mit Beispielen von Reifen-Fotos trainierten
  • Falls zu wenige Beispiele für Training vorhanden sind: Synthetisch beliebig viele Beispiele mit Offline-KI + herkömmlichen Methoden (Rauschen, Bilddrehung, Qualitätsreduzierung, …) generieren

Es ist also nicht nur möglich, Textdokumente (die auch Abbildungen enthalten können) mit Offline-KI zu digitalisieren. Es ist auch möglich, Fotos automatisch auszuwerten

Ganzen Artikel jetzt über kostenfreien Dr. DSGVO Newsletter lesen.
Weitere Extras für Abonnenten:
Viele Artikel in PDF-Form · Kompakte Kernaussagen für Beiträge · Offline-KI · Freikontingent+ für Website-Checks
Schon Abonnent? Link im Newsletter anklicken & diese Seite auffrischen.
Newsletter abonnieren

KI-Beratung, KI-Lösungen

Umfassende Beratung (fachlich, rechtlich, technisch):

Leistungsangebot:

  • Erstberatung inkl. Machbarkeitsaussagen
  • Schulungen und Workshops für Führungskräfte, Berufsgeheimnisträger, Angestellte, Entwickler
  • KI-Lösungen mit und ohne ChatGPT/Azure. Cloud oder eigener KI-Server

Ihre Anfrage

Oder Mail an ki@dr-dsgvo.de

Wer schreibt hier?
Mein Name ist Klaus Meffert. Ich bin promovierter Informatiker und beschäftige mich seit über 30 Jahren professionell und praxisbezogen mit Informationstechnologie. In IT & Datenschutz bin ich auch als Sachverständiger tätig. Ich stehe für pragmatische Lösungen mit Mehrwert. Meine Firma, die IT Logic GmbH, berät Kunden und bietet Webseiten-Checks sowie optimierte & sichere KI-Lösungen an.
Bitte nutzen Sie bei Verwendung meiner Ergebnisse die Quellenangabe oder verlinken Sie gut wahrnehmbar auf diesen Artikel:
Einen Kurzlink oder eine Bestätigung für Ihre Quellenangabe erhalten Sie kurzfristig auf Anfrage. Ein Teilen oder Verteilen dieses Beitrags ist natürlich ohne weiteres möglich und gewünscht.

Schreiben Sie einen Kommentar

Ihre Mail-Adresse wird nicht veröffentlicht.

Kellergespräch: Revolutionäre Offline-KI, unbesiegbar & sicher