Offline-KI ist eine lokal laufende KI, die ohne Internetverbindung arbeitet und oft datenfreundlicher und kostengünstiger ist als Cloud-basierte Lösungen wie ChatGPT. Sie ermöglicht die Analyse von Dokumenten und Bildern, einschließlich der Texterkennung und semantischen Suche.

Wozu dient die Digitalisierung von Dokumenten mit Offline-KI?

Offline-KI kann analoge Dokumente, wie zum Beispiel PDF-Dateien, in digitale Formate umwandeln. Dabei werden Text und Bilder extrahiert, was für die spätere Analyse und Nutzung von Vorteil ist. Die KI kann auch Bilder beschreiben und semantische Suchen durchführen.

Kann die Offline-KI auch Bilder analysieren, die in niedriger Qualität oder unter schlechten Lichtverhältnissen aufgenommen wurden?

Ja, die Offline-KI kann auch Bilder mit geringer Auflösung oder schlechten Lichtverhältnissen analysieren und Informationen extrahieren, wie beispielsweise die Seriennummer eines Reifens. Sie kann auch synthetische Trainingsdaten generieren, um die Genauigkeit zu verbessern.

Welche Möglichkeiten gibt es, wenn die KI nicht alle Informationen korrekt erkennt?

Es gibt verschiedene Lösungen, um die Erkennungsgenauigkeit zu erhöhen. Dazu gehören das automatische Drehen der Bilder, ein semantischer Vergleich der Buchstaben und Ziffern oder die Generierung künstlicher Trainingsdaten durch die Offline-KI selbst.

Wie kann die Offline-KI bei der Suche in Dokumenten helfen?

Die Offline-KI ermöglicht nicht nur die Suche nach spezifischen Wörtern, sondern auch nach semantisch ähnlichen Inhalten innerhalb eines Dokuments. Dies ermöglicht eine effizientere Informationssuche und das Auffinden relevanter Informationen, auch wenn diese nicht exakt mit Suchbegriffen übereinstimmen.

Was ist die Hauptfunktion der Offline-KI bei PDF-Dokumenten?

Offline-KI ermöglicht die Extraktion von Text aus Bildern und die Erkennung von Text auf Objekten, wie z.B. Seriennummern, ohne dass eine Online-Verbindung erforderlich ist.

Welche Art von Informationen kann die Offline-KI erkennen?

Die KI kann sowohl Text aus Bildern als auch Informationen auf physischen Objekten innerhalb von Dokumenten, wie z.B. Seriennummern, identifizieren und extrahieren.

Benötigt die Offline-KI eine Internetverbindung?

Nein, die Offline-KI arbeitet ohne Internetverbindung und ermöglicht so den Zugriff auf Dokumentinformationen auch ohne Netzwerkzugang.

Offline-KI Showcase: Digitalisierung von Dokumenten

Kategorien: Datenschutz und Künstliche Intelligenz

Die Digitalisierung von Dokumenten funktioniert mit Offline-KI beliebig gut. Offline-KI ist eine lokal laufende KI, die oft besser als ChatGPT, datenfreundlich und günstig ist. Dazu gehört das Erkennen von Texten und Bildern sowie die semantische Suche in diesen extrahierten Informationen. Der Showcase zeigt konkrete Details.

Was ist Offline-KI?

Manche verstehen vielleicht "Offline-GPT" besser. Offline-KI hat allerdings nichts mit OpenAI und anderen Drittanbietern zu tun.

Eine Offline-KI läuft auf einem eigenen Computer. Das kann entweder eine gekaufte Hardware oder eine Miet-Hardware sein. Offline bedeutet, dass die KI keine Daten an Dritten sendet. Die Offline-KI kann bei Bedarf auf das Internet zugreifen oder mit anderen IT-Systemen kommunizieren.

Offline-KI live ausprobieren

Offline-KI kann für viele Anwendungsfälle, wie beispielsweise für die Digitalisierung von Dokumenten, erheblich bessere Ergebnisse als mit ChatGPT und andere Cloud-Dienste produzieren. In Unternehmen geht es oft um tausende von Dokumenten. Die Kosten bei Cloud-Diensten sind oft unberechenbar und zudem bei vielen Anfragen teuer. Offline-KI bietet eine günstige Kosten-Flatrate. Die volle Datenkontrolle ist für viele ebenfalls ein Grund, ChatGPT oder Microsoft Azure nicht zu nutzen.

Offline-KI kann oft mehr als ChatGPT, ist günstiger und bietet volle Datenkontrolle sowie Online-Zugriffsmöglichkeiten.

Was bedeutet Digitalisierung von Dokumenten?

Digitalisierung bedeutet das Umwandeln von analogen in digitale Informationen. Oft handelt es sich dabei um das Konvertieren von Papierdokumenten in digitale Abbilder (Dateien). Dazu wird das Papierdokument eingescannt oder fotografiert. Danach wird das daraus entstandene Bild ausgewertet (auch bei einem Scan entsteht ein Bild!).

Am Beispiel eines Dokuments des Europäischen Datenschutzausschusses (EDSA) wird gezeigt, wie Offline-KI bei der Digitalisierung von Dokumenten helfen kann.

Ein PDF-Dokument des Europäischen Datenschussausschusses (EDSA) als Beispiel.

Die oben gezeigten Bilder stellen die Seiten eines PDF-Dokuments dar. Diese Bilder entstehen entweder durch Einscannen oder durch Umwandeln eines PDF-Dokuments in Einzelseiten.

Nachdem das Dokument eingescannt (oder fotografiert wurde), wird es mit Offline-KI ausgewertet. Dabei wird der enthaltene Dokumententext ermittelt. Weitergehende Verfahren erkennen auch Bilder und deren Inhalte.

Mit Offline-KI können sogar Bilder beschrieben werden. Hier ein Screenshot einer Folie zum Thema Offline-KI.

Beispielbild für Erkennung von Bildinhalten durch eine Offline-KI. Einer Präsentation zum Thema "Offline-KI" entnommen.

Die Offline-KI hatte nun die Aufgabe, zu beschreiben, was das Bild darstellt. Hier das Ergebnis:

a black and white drawing of a man with horns, ikea manual, as a d & d monster, a an ai generated image

Die deutsche Übersetzung liefert die Offline-KI auf Wunsch ebenfalls:

Eine schwarze und weiße Zeichnung eines Mannes mit Hörnern, IKEA-Manual, als D&D-Monster, eine AI-generierte Abbildung

Wer die ukrainische, türkische, spanische, italienische oder polnische Version benötigt, dem kann mit Offline-KI ebenfalls geholfen werden:

Ukrainisch: Чорно-біле малювання чоловіка з рогами, посібник IKEA, як монстр D&D, а також зображення, згенероване AI
Türkisch: bir adamın kulakları olan siyah ve beyaz bir çizim, ikea kılavuzu, d&d canavarı olarak, bir ai oluşturulmuş görüntü
Spanisch: Un dibujo en blanco y negro de un hombre con cuernos, manual de IKEA, como un monstruo de D&D, una imagen generada por inteligencia artificial
Italienisch: disegno a matita nero e bianco di un uomo con corna, manuale Ikea, come mostro D&D, immagine generata da AI
Polnisch: rysunek czarno-biały mężczyzny z rogami, instrukcja IKEA, jako potwór D&D, obraz generowany przez AI

Die Übersetzungen wurden mit dem bisherigen Goldstandard, DEEPL, verifiziert und unverändert hier wiedergegeben.

Der nächste Schritt könnte das Erkennen von Abschnitten/Blöcken sein.

Abschnitte, die von der KI im PDF erkannt wurden.

Die in der Abbildung gezeigten Blöcke wurden automatisch erkannt und markiert. Sie dienen als Vorstufe für eine leistungsfähige Erkennung von Text- und Bildinformationen.

Wie viele Informationen in solchen Blöcken stecken können, zeigt folgende Abbildung.

Mit KI automatisch erkannte Blöcke auf diversen Seiten eines PDF-Dokuments (Auszug).

Die gezeigten Textabschnitte wurden vollautomatisch erkannt. Dem Anwender stehen nun mehrere Möglichkeiten zur Verfügung. Informationen können ebenso im Fließtext gefunden werden als auch mit strenger Suche. Die strenge Suche ermittelt nur Treffer für Abschnitte, die jeweils den gesamten Suchbegriff enthalten. Statt eines Suchbegriffs können auch Fragen an das Dokument gestellt werden. Der Anwender sieht am Ende aus Komfortgründen nur seine Suchmaske (Eingabefeld) sowie die Ergebnisse. Die oben gezeigten Abbildungen sieht er nur auf Wunsch.

Eigene Dokumente befragen: Mit Offline-KI nicht nur besser möglich als mit ChatGPT, sondern auch günstiger und mit voller Datenkontrolle.

Darüber hinaus ist es beispielsweise auch möglich, zu einer vorgegebenen Dokumentenseite die semantisch ähnlichen Seiten zu finden.

Im Beispiel hier wurden die Seiten gefunden, die zu einer Vorgabeseite (1. Seite links oben) optisch ähnlich sind. Optische Ähnlichkeit liegt in diesem Beispiel vor, wenn der grau hinterlegte Kasten in anderen Seiten auch vorkommt. Dies ist in den Seiten 3 bis 8 (von links nach rechts, von oben nach unten) der Fall. Als Gegenbeispiel wurde die Seite 2 als optisch unähnliche Textseite mit angezeigt.

Es können aber auch semantische Suchen nach Text ausgeführt werden. Die Suche nach Dokumenten und deren Seiten kann so leistungsfähig mit Offline-KI durchgeführt werden. Beispielsweise wurde im o.g. digitalisierten PDF-Dokument nach „personenbezogene Daten“ gesucht.

Einige der Treffer sind hier zu sehen:

Gefundene Dokumente für Suche nach "personenbezogene Daten".

Selbstverständlich kann die Offline-KI die Treffer direkt als Text anzeigen. Lediglich für das Beispiel wurden hier die Treffer in Form der Seiten-Screenshots dargestellt.

Ein Detailtreffer zu dieser Suchanfrage ist hier gezeigt:

Ein Treffer im Detail: Die semantische Suche hat Unschärfen kompensiert und zeigt eine Trefferwahrscheinlichkeit mitsamt Markierung im Text (Original ist ein Bild!).

Ohne weiteren Aufwand wurden auch Treffer gefunden, die das Gleiche meinen, aber eine andere Ausdrucksweise verwenden. Die Unschärfe zwischen „personenbezogene“ und „personenbezogener“ wurde automatisch durch die KI ausgeglichen. Dieses sehr einfache Beispiel kann nahezu beliebig leistungsfähig ausfallen.

Ein leistungsfähiges Beispiel für semantische Suche ist zum Frage-Antwort-Assistenten für den Dr. DSGVO Blog beschrieben.

Ähnlichkeitssuche

Wie wäre es, wenn man zu einem Bild die semantisch ähnlichsten Bilder finden könnte? Ein Bär ist ein Bär, eine Katze eine Katze. Egal, ob das jeweilige Tier (oder Objekt, falls andere Bilder) groß oder klein ist, links oder oben im Bild ist oder ob nur der Kopf oder eine Vollaufnahme zu sehen ist.

Für Dokumenten-Seiten ist das Ergebnis ähnlich beeindruckend:

Rückwärtssuche: Zu einem Bild (hier: einer Dokumentenseite) werden die optisch am ähnlichsten Exemplare gefunden.

Rechts im Bild die Seite aus einem PDF-Dokument, für die ähnliche Seiten gefunden werden sollen. Links im Bild die Seiten, die eine optische Ähnlichkeit aufweisen. Die Ähnlichkeit besteht hier aus dem Textfluss, aber vor allem aus dem grau hinterlegten Block. Wären Bilder im Ausgangsbild zu sehen, würden diese berücksichtigt. Stattdessen hätte man auch nach dem Text, der im Bild zu sehen ist, ähnliche Dokumente finden können. Die Möglichkeiten sind endlos.

Zum Abschluss noch ein kurzes Beispiel, dass Informationen auch in anspruchsvolleren Bildern erkannt werden können.

Das Eingabebild ist Folgendes. Es wurde mit einem alten Handy, in niedriger Auflösung und unter schlechten Lichtverhältnissen angefertigt:

Bild eines Teils eines Reifens, in dem Text erkannt werden soll.

Die untrainierte Offline-KI hat in einer Dreivierteilsekunde auf einem Laptop folgende Angaben erkannt, markiert und extrahiert:

Erkannte Angaben auf einem Reifen, automatisch eingefügte Bounding Boxes.

Die Kernangaben wurden erkannt und deren Position zurückgegeben. So konnte die Seriennummer 49865 korrekt und die Nummer A055247 fast korrekt erkannt werden (das „A“ wurde als „4“ erkannt, was auch einem Menschen kaum erkennbar ist).

Wie zu sehen ist, sind ein paar Angaben unerkannt. Hierfür gibt es mehrere Lösungen:

Bild automatisch drehen und Erkennung erneut durchführen
Semantischer Vergleich der Buchstaben und Ziffern mit Offline-KI und einmal trainiertem KI-Modell
KI-Modell mit Beispielen von Reifen-Fotos trainierten
Falls zu wenige Beispiele für Training vorhanden sind: Synthetisch beliebig viele Beispiele mit Offline-KI + herkömmlichen Methoden (Rauschen, Bilddrehung, Qualitätsreduzierung, …) generieren

Es ist also nicht nur möglich, Textdokumente (die auch Abbildungen enthalten können) mit Offline-KI zu digitalisieren. Es ist auch möglich, Fotos automatisch auszuwerten. Insbesondere für Versicherungen dürfte dies interessant sein. Die bis dato gesammelten, oft hunderttausende Beispiele aus der Praxis, können als vertrauliche Trainingsdaten für ein Offline-KI-System genutzt werden. Liegen zu wenige Trainingsdaten vor, besteht die Möglichkeit, künstlich solche Trainingsdaten zu generieren. Auch hierfür kommt die Offline-KI zum Einsatz und freut sich schon darauf, auf Ihrem Server stundenlang zu laufen, während Sie den Feierabend oder das Wochenende genießen.

Fazit

Mit Offline-KI können Dokumente verschiedener Art digitalisiert werden. Die eingescannten oder fotografierten Dokumente werden dazu mit KI analysiert. Die Informationen von Text und Bild werden mit KI extrahiert. Beispielweise können die extrahierten Informationen dann mit KI semantisch durchsucht, zusammengefasst, in leichtere Sprache oder andere Sprachen übersetzt werden.

Auch eine Ähnlichkeitssuche mit Bildern ist möglich: Zu einem Eingabebild werden die ähnlichsten Bilder gefunden. Und zwar aus semantischer Sicht und nicht wie „früher“ durch Vergleiche von Bildpunkten.

Das einzige, was für die Digitalisierung jetzt noch benötigt wird, ist ein guter Scanner oder ein Handy mit einer Kamera, je nach Anwendungsfall.

Offline-KI hält die Daten dort, wo sie hingehören, nämlich in Ihrem Unternehmen. Zusätzlich bietet Offline-KI die Möglichkeit, Daten aus dem Internet zu beschaffen oder mit Ihren anderen IT-Systemen zu kommunizieren.

Die Ergebnisse sind für viele Anwendungsfälle deutlich besser als es ChatGPT jemals sein kann. Auch Mehrsprachigkeit ist kein Problem, sogar mit unternehmenseigenen Wörterbüchern. Fachbegriffe aus dem Versicherungswesen, der Medizin oder den Rechtswissenschaften können so adäquat berücksichtigt werden.

Kernaussagen dieses Beitrags

Offline-KI kann Dokumente digitalisieren, Bilder analysieren und Informationen extrahieren, um sie zu durchsuchen, zusammenzufassen oder übersetzen.

Eine optimierte Offline-KI kann Dokumente digitalisieren, ohne dass Daten an Dritte gesendet werden müssen. Sie erkennt Text und Bilder aus Papierdokumenten und macht diese für digitale Systeme zugänglich.

Eine künstliche Intelligenz kann Textabschnitte in PDF-Dokumenten automatisch erkennen und markieren, um Informationen zu extrahieren.

Mit dieser Technologie können Nutzer ihre Dokumente befragen, ob sie nach spezifischen Worten suchen oder nach semantisch ähnlichen Inhalten auf anderen Seiten des Dokuments suchen möchten.

Dies ermöglicht eine effiziente und schnelle Ermittlung relevanter Informationen innerhalb von PDF-Dokumenten ohne die Notwendigkeit einer Online-Verbindung.

Offline-KI kann Text aus Bildern extrahieren. Sie erkennt Text auf Objekten wie Reifen und liefert Informationen wie Seriennummern.

Über diese Kernaussagen

KI-Beratung, KI-Lösungen

Umfassende Beratung (fachlich, rechtlich, technisch):

Leistungsangebot:

Erstberatung inkl. Machbarkeitsaussagen
Schulungen und Workshops für Führungskräfte, Berufsgeheimnisträger, Angestellte, Entwickler
KI-Lösungen mit und ohne ChatGPT/Azure. Cloud oder eigener KI-Server

Ihre Anfrage

Oder Mail an ki@dr-dsgvo.de