Sensible Daten gehören nicht in fremde oder amerikanische Hände, wie etwa ChatGPT, die Clouds von Microsoft, Google oder AWS. Wie gut, dass eigene KI-Systeme möglich und bezahlbar sind. Endlich müssen Geschäftsgeheimnisse nicht mehr in ChatGPT oder irgend eine Cloud reingeladen werden. Ein Experiment für einen Frage-Antwort-Assistenten für diesen Datenschutz-Blog, Dr. DSGVO.
Einleitung
Wem Datenschutz bisher recht egal war, der legt vielleicht doch Wert darauf, dass die eigenen Geschäftsgeheimnisse nicht in der Welt verstreut werden. Möglicherweise gibt es für bestimmte Dokumente sogar rechtlich bindende Vertraulichkeitsvereinbarungen. Ob die Vertraulichkeit gewährt bleibt, wenn ein Dokument in die Cloud von ChatGPT oder Google hochgeladen wird, wage ich zu bezweifeln.
Datenfreundlich: Sicher für Daten aller Art, egal ob personenbezogene Daten (Datenschutz), vertrauliche Daten oder Geschäftsgeheimnisse.
Datenfreundlich ist mehr als datenschutzfreundlich.
Aber auch der nicht selten verhasste Datenschutz rückt wieder ins Bewusstsein vieler. Während Suchmaschinen Daten ohne Intervention verarbeiten durften und dürfen, dürfen die gleichen Daten von KI-Systemen nicht ohne Nachfrage von Datenschutzbehörden verarbeitet werden. Komisch. Liegt wohl auch an den Möglichkeiten, die Künstliche Intelligenz bietet, aber sicher ebenso am Herdentrieb (wenn eine Behörde prüft, dann können wir das auch tun, ohne gleich als Spielverderber zu gelten, denken sich wohl manche Amtsträger. Nur so ist es mir erklärlich, warum das untätigste Datenschutzbundesland der Welt (Hessen) auch einen zarten Vorstoß in Form einer Anfrage an ChatGPT verkündete).
Ein häufiger Anwendungsfall für den Einsatz Künstlicher Intelligenz ist die Suche nach Dokumenten. Anspruchsvoller sind Frage-Antwort-Systeme oder Suchmaschinen, die direkt Textzusammenfassungen von Treffer-Dokumenten mitliefern. Mein Plan war, ein Findesystem für den Dr. DSGVO Datenschutz-Blog zu erstellen, und zwar datenfreundlich.
Der Suchassistent für Dr. DSGVO soll auf natürlichsprachige Fragen eine Antwort liefern. Hier ein Beispiel:
„Braucht meine Webseite ein Cookie-Popup?“
Die Antwort der KI ist besser als die der meisten Menschen. Antwort Dr. DSGVO KI: siehe unten.
Wie man an der Fragestellung erahnen kann, sind manche Fragen durchaus anders formuliert als es akademisch korrekt wäre. Viele fragen etwa, ob etwas konform mit dem Datenschutz ist. Gemeint ist meist, ob eine bestimmte Datenverarbeitung gemäß DS-GVO rechtmäßig ist.
Die Antwort soll meine KI in eigenen Worten geben, und zwar auf Basis der bisher auf Dr. DSGVO erschienenen Beiträge. Hierbei sollten Halluzinationen vermieden werden, es geht ja um Fakten und rechtlich relevantes Wissen. Halluzinationen sind dazu erfundene Angaben, die so nicht existieren. Wie Halluzinationen zustande kommen, greife ich konkret in einem zukünftigen Beitrag auf. Man kann diese nämlich fundiert erklären und muss nicht auf Spekulationen zurückgreifen.
Prototyp beweist Machbarkeit
Dass eigene KI-Systeme programmiert und auf eigenen Servern lokal betrieben werden können, habe ich durch einen Prototypen bewiesen. Der einfache Weg wäre eine der folgenden Möglichkeiten gewesen:
- Schnittstelle von ChatGPT nutzen, oder
- viel Geld auf das Problem werfen und die Amerikaner beglücken (Cloud), oder
- noch mehr Geld auf das Problem werfen und teure Hardware kaufen.
Teure Hardware zu kaufen ist durchaus ein gangbarer Weg für größere Unternehmen, nicht aber für viele KMUs. Daher habe ich ein anderes Setup gewählt. Bei der Wahl der Hardware wurde auf die Kosten geachtet. Dazu muss man wissen, dass KI-Berechnungen auf Grafikkarten stattfinden. Die Grafikkarte wird hier nicht zur Ausgabe von Bildern oder Texten verwendet. Vielmehr werden die vielen Tausend Miniprozessoren einer Grafikkarte missbraucht, um die rechenintensive Arbeit einer KI schneller zu erledigen, als es ein einziger Einstein-Prozessor Ihres noch so guten Personal Computers imstande ist zu tun. Leider kosten Grafikkarten mit viel Hauptspeicher sehr viel Geld. Eine Grafikkarte mit 48 GB Hauptspeicher kostete vor ein paar Monaten noch 15.000 Euro. Für gute KI-Modelle werden aber eher 96 GB oder auch mal 400 GB teuerster Hauptspeicher mehrerer Grafikkarten (nicht Festplattenspeicher und nicht billiger RAM eines Computers!) benötigt.
Meine KI-Systeme hingegen laufen auf Minimalhardware, wenn man den Begriff im Kontext von Künstlicher Intelligenz versteht. Ein Beispiel: Die Suche nach (eigenen) Dokumenten aus dem Firmen-Intranet über natürlichsprachige Fragen funktioniert auf einem Miet-Server der Mini-Klasse. Selbstverständlich kann auch ein eigener Firmen-Server verwendet werden. Das gelingt durch Ausnutzen von Optimierungsverfahren, die man sich durch zusätzliche technische Komplexität erkauft. Einmal gelöst, ist das Komplexitätsproblem erledigt.
Leistungsfähige KI-Anwendungen und Sprachmodelle
Für Frage-Antwort-Assistenten wird aber etwas mehr benötigt als für die intelligente Suche nach Dokumenten. Denn es sollen nicht nur Dokumente gefunden werden, sondern auch Inhalte aus diesen Dokumenten extrahiert und als Antwort präsentiert werden. Die einfache Möglichkeit ist eine extraktive Antwort. Das ist ein wortgetreues Zitat aus dem Originaltext. Schwieriger und besser sind abstraktive Antwortsysteme. Sie liefern eine Antwort in eigenen Worten und können sogar das Wissen aus mehreren Dokumenten kombinieren, um eine Antwort in neuen Worten zu liefern. Die Antwort wäre mit einem Dokument alleine nicht leistbar gewesen. Der Mensch hätte zig Dokumente finden, lesen und intellektuell verarbeiten müssen. Die KI nimmt diese unangenehme, zeitraubende und vor allem von vielen Menschen gar nicht erbringbare Leistung ab und löst das Problem.
Meine KI-Systeme haben den Anspruch, datenfreundlich zu sein. Weiterhin sollen sie auf möglichst günstiger Hardware laufen. Beides ist möglich, wie die Praxis zeigt.
Tiefergehend erprobte Anwendungsfälle bisher: Dokumentensuche, Textverstehen, Bilderzeugung, Bildanalyse, Audioanwendungen.
Wenn wir über das Suchen und Zusammenfassen von Dokumenten sprechen, meinen wir üblicherweise Dokumente und Antworten in deutscher Sprache. Um es ganz kurz zu sagen: Deutsch ist leider keine Weltsprache. Deswegen ist es viel schwieriger, deutsche Texte mit einer KI-Anwendung zu verarbeiten, als englische oder chinesische Texte (wobei letzteres mir auch ausgesprochen schwerfallen würde).
Für mein KI-System wird also ein elektronisches Gehirn („Modell“) benötigt, welches Deutsch versteht und „sprechen“ kann. Das erhöht die Anforderungen an eine KI-Architektur deutlich. Aber auch dieses Problem ist lösbar, wie ich herausgefunden habe. Das durch die Deutsch-Anforderung erforderliche KI-Modell hat eine Größe, die auf günstiger Hardware nicht nutzbar wäre.
Für die Nutzung leistungsfähiger KI-Systeme auf Servern, die sowohl bezahlbar als auch in Deutschland verfügbar sind (Datenschutz! Geschäftsgeheimnisse! Vertraulichkeit!), bedarf es einiger Tricks. Beim Erstellen der KI-Lösung kam ich mir wie bei „Jugend forscht!“ vor. Auch für den Informatiker ist diese komplexe Materie eine Herausforderung, die letztendlich gelöst werden konnte.
Moderne Techniken und mathematische Verfahren wie Quantisierung, Parameter-optimierte Modelle und besondere KI-Modell-Architekturen helfen dabei, eine ressourcenschonende Lösung zu realisieren.
Hier ein paar reale Antworten, die aus hunderten Beiträgen von Dr. DSGVO auf die genannten Fragen von meiner KI generiert wurden.
| Frage | Antwort durch KI |
|---|---|
| Was bedeutet Web Tracking? | Web Tracking bezieht sich auf die Überwachung und Analyse von Besucherverhalten auf einer Website oder in einer App. Dies kann durch den Einsatz von Technologien wie Cookies, Server Logs oder Conversion Tracking erfolgen. Ziel ist es, Daten über die Nutzer zu sammeln, um das Verständnis von Besucherverhalten zu erhöhen. |
| Ist Tracking konform mit der DSGVO? | Ja, das Tracking ist konform mit der DSGVO, wenn die Erhebung, Speicherung und Verarbeitung personenbezogener Daten nach den Anforderungen der DSGVO erfolgen. Die Datenschutzerklärung muss den Nutzern eine entsprechende Erklärung zugänglich machen, und die Einwilligung muss gegeben sein. Die Verwendung von Cookies erfordert in der Regel eine Einwilligung. Google Analytics kann nur gerechtfertigt werden, wenn eine Einwilligung vorliegt oder es geeignete Garantien gibt, dass der Empfänger der Daten, also Google, diese Daten nicht für eigene Zwecke verwendet. |
| Wer ist Max Schrems? | Max Schrems ist ein österreichischer Datenschutzaktivist und Mitbegründer der Organisation noyb (None Of Your Business), die sich für eine klare und verständliche Darstellung von Datenschutzrichtlinien in der Praxis einsetzt. Er ist auch der Initiator mehrerer Klagen gegen Facebook und andere US-amerikanische Unternehmen wegen Verletzung des Datenschutzes durch die US-amerikanischen Überwachungsprogramme. |
| Was sind Cookies? | Cookies sind Datensätze, die von einer Webseite genutzt werden. Sie bestehen aus einem Paar von Daten, einem Schlüssel und einem Wert. Ein Cookie wird im Endgerät des Nutzers vom Browser verwaltet und somit dort gespeichert. Cookies werden oft fälschlicherweise als Textdateien bezeichnet, was jedoch nicht zutreffend ist. |
| Was sind IP-Adressen? | IP-Adressen sind eine Zahlenfolge, die jedem Gerät im Internet zugewiesen wird, um es von anderen Geräten im Internet zu unterscheiden. Sie sind eine Art Adresse, die an jedes Gerät im Internet gebunden ist und es ermöglicht, auf andere Geräte im Internet zuzugreifen. IP steht für Internet Protocol. |
| Sind IP-Adressen personenbezogen? | Ja, IP-Adressen sind personenbezogen, da sie direkt oder indirekt auf eine Person hinweisen können. Dies wurde vom EuGH und BGH in ihren Breyer-Entscheidungen im Jahr 2016 und 2017 bestätigt. Cookies, die zusammen mit einer IP-Adresse an eine Webseite übertragen werden, sind ebenfalls personenbezogen, da sie mit der personenbezogenen Netzwerkadresse verbunden sind. |
| Für wen gilt die DSGVO? Ich möchte es genau wissen! | Die DSGVO gilt für alle Unternehmen, die personenbezogene Daten verarbeiten. Dazu gehören sowohl Unternehmen, die in der EU ansässig sind, als auch solche, die außerhalb der EU ansässig sind, aber personenbezogene Daten von EU-Bürgern verarbeiten. |
| Gilt die DSGVO auch für Dr. DSGVO? | Ja, die DSGVO gilt auch für Dr. DSGVO. Dies ist in der Datenschutzerklärung des Unternehmens, das Dr. DSGVO betreibt, klar und deutlich angegeben. Die Datenschutzerklärung kann auf der Website des Unternehmens gefunden werden und enthält alle relevanten Informationen über die Verarbeitung von personenbezogenen Daten durch das Unternehmen. |
| In welchen Fällen gilt die DSGVO? | Die DSGVO gilt, wenn eine betroffene Person ihre Datenschutzrechte verletzt sieht und einen Unterlassungsanspruch geltend macht. |
| Ist Cloudflare böse? | Die Quelldokumente legen nahe, dass Cloudflare nicht datenschutzkonform genutzt werden kann. Es gibt auch Gerüchte über mögliche Manipulationen von Daten durch Cloudflare. |
| Ist Klaus Meffert böse? | Basierend auf den bereitgestellten Quelldokumenten kann ich nicht beurteilen, ob Klaus Meffert böse ist. Es gibt keine Informationen darüber, was böse bedeutet oder ob Klaus Meffert jemals böse war oder ist. |
| Was ist Künstliche Intelligenz? | Künstliche Intelligenz (KI) ist die Entwicklung von Computern und Software, die menschenähnliche Fähigkeiten besitzen, wie z.B. Lernen, Problemlösen, Sprachverständnis und -produktion, Sinneswahrnehmung, Handlungskontrolle und autonome Entscheidungsfindung. |
| Funktioniert IT Security ohne Datenschutz? | IT Security und Datenschutz sind eng miteinander verbunden, wie aus dem vorliegenden Text hervorgeht. IT Security und Datenschutz sind gemäß Definition abhängig voneinander, wie in Artikel 32 DSGVO erwähnt. Die Datensicherheit ist vom Verantwortlichen zu gewährleisten, wie aus ISO 27001 hervorgeht. Die Datenschutzgesetze, insbesondere die DSGVO, regeln den Schutz von Daten, die personenbezogen sind oder in nutzerbezogenen Endgeräten verwaltet werden. IT Security und Datenschutz sind also in der Tat eng miteinander verknüpft. |
| Dürfen normale Menschen jemanden rechtlich beraten? | Ja, normale Menschen dürfen jemanden rechtlich beraten, solange sie keine tief gehende juristische Einzelfallbetrachtung vornehmen. Datenschutzberatung darf auch jemand leisten, der kein Anwalt ist. Das RDG scheint veraltet und überholt. Als Informatiker möchte ich das gleiche Recht wie Anwälte haben, mein Tätigkeitsprofil gegenüber unqualifizierten Dienstleistern zu schützen. |
Diese Antworten wurden nicht mit ChatGPT oder einem anderen Drittsystem generiert. Auch die Dokumentensuche wurde mit einer lokalen Vektorsuchmaschine durchgeführt und nicht etwa mit Pinecone (Datenschutz usw.).
Die Antworten entsprechend weitestgehend dem, was ich unterschreiben würde. Bei der Frage, für den die DSGVO gilt, müsste man allerdings noch ergänzen, dass sie nicht nur für Unternehmen gilt. Derartige Details kann eine KI anhand der vorhandenen Eingabedaten nicht wirklich leisten. Das liegt aber in erster Linie an den Eingabedaten und in zweiter Linie auch am Modell, welches noch nicht optimiert wurde.
Einige Fragen wurden durchaus „gemein“ formuliert, wie beispielsweise, ob die DSGVO auch für Dr. DSGVO gilt. Auch wenn die Antwort der eigenen KI hier nicht perfekt ist, würde ich sie als sehr gut bezeichnen. Manch anderer hat vielleicht andere Erwartungen. Wer wesentlich höhere Erwartungen hat, als meine zu sein scheinen, für den scheint ein datenfreundliches Frage-Antwort-System nicht infrage zu kommen.
Die Frage, in welchen Fällen die DSGVO gilt, ist mehrdeutig. Die Antwort der Dr. DSGVO KI ist gut, aber nicht optimal. Für die genannte Antwort muss sich aber niemand schämen, finde ich. Immerhin geht es hier bei der Kritik auf höchstem Niveau um den Vergleich „Durchschnittsmensch, der keine Ahnung von Datenschutz hat“ mit „Datenschutz-Profi, der glaubt, sehr vieles zu wissen“ (mit Datenschutz-Profi meine ich hier irgendjemanden, nicht eine spezielle Person, nur um Missverständnissen vorzubeugen).
Nun zur Frage, ob Webseiten ein Cookie-Popup benötigen:
Frage: Muss meine Webseite ein Cookie Popup haben?
Die Antwort ist im Kern richtig und übertrifft die Mehrheit der Menschheit. Der technikaffine Datenschutzprofi wäre mit der Antwort aber dennoch nicht vollständig zufrieden.
Antwort der Dr. DSGVO KI: Nein, eine Webseite muss kein Cookie Popup haben. Cookies sind nur ein Hilfsmittel, um den Benutzer zu identifizieren und den Server dazu zu bringen, bestimmte Informationen an den Benutzer weiterzugeben. Eine Webseite kann auch ohne Cookies ausgeführt werden, zum Beispiel durch das Einbinden von JavaScript.
Die Optimierung einer KI
Bevor eine KI gute Antworten liefert, ist es ein weiter Weg, der qualitativ aber nur einmal gegangen werden muss. Diesen Weg habe ich zu einem guten Teil beschritten. Die oben genannten Ergebnisse stammen allesamt aus der noch nicht weit optimierten KI-Anwendung.
Das Problem bei Sprachmodellen, die Antworten in eigenen Worten liefern sollen, ist eine Überlagerung von eingekippten Fakten (Kontext genannt) und dem im Sprachschatz inhärent innewohnenden Wissen. Eine Sprache zu lernen gelingt faktisch nicht, ohne sich dabei Wissen (oder Falschinformationen) anzueignen.
Am schönsten wird dieses Problemchen bei der Frage deutlich, was Cookies sind. Fast das gesamte Internet behauptet fälschlicherweise, dass Cookies Textdateien seien. Dies ist falsch, wie ich mehrfach beschrieben und auch bewiesen habe. In meinem KI-Sprachmodell, das auf vielen Texten aus dem Internet basiert, ist diese Falschinformation fest eingepflanzt. Wenn ich jetzt die Beiträge aus dem Dr. DSGVO Blog in meine KI reinkippe, dann kommen diese Dokumente mit Ihrer Aussage „Cookies sind Datensätze“ kaum gegen die im Sprachmodell leider verankerte Falschbehauptung an, dass Cookies Textdateien seien. Ein Sprachmodell kann teilweise auch nicht so gut zwischen Konjunktiv und Indikativ unterscheiden. Den Konjunktiv zu Cookies hatte ich zwei Sätze vorher verwendet. Alleine das könnte eine KI schon verwirren, wenn dieser Beitrag, den Sie gerade lesen, in ein KI-Modell reingekippt wird.
Alle Menschen sind dumm, und zwar in den meisten Wissensgebieten. KI-Systeme können in vielen Wissensgebieten deutlich intelligenter sein als der jeweils höherbegabte Experte eines Fachgebiets.
Beweis zum ersten Satz: Schauen Sie sich doch um. Beweis zum zweiten Satz: Siehe GPT-4 sowie einige der Beispiele weiter unten.
Daher habe ich es nicht dabei belassen, den Kontext für mein Frage-Antwort-System einzugrenzen, sondern noch einige weitere Optimierungen vorgenommen. Ein KI-Modell kann aber nicht beliebig trainiert werden, wenn der nötige Supercomputer nicht bereitsteht. Daher war ich gezwungen, ressourcenschonende Verfahren zu verwenden. Das kommt einem Wettlauf gegen immer neue Probleme gleich. Denn ist erst einmal ein Problem aus dem Weg geräumt, wartet das nächste, das sich aus der Lösung des vorigen Problems entwickelt.
Hierzu ein Beispiel: Um KI-Modelle kleinzuhacken, damit sie in einen Grafikkartenspeicher passen, der vor zwei Jahren noch als High End Segment galt, gibt es die Möglichkeit der Quantisierung. Kurz gesagt, werden aus Zahlen hoher Genauigkeit Zahlen mit niedriger Genauigkeit gemacht, ohne dass die Qualität der Künstlichen Intelligenz wesentlich darunter leidet. Nun unterstützen aktuelle Programmbibliotheken aber leider nicht alle Trainingsmethoden für KI-Modelle, wenn die Quantisierung eingesetzt wird. Deswegen müssen wieder andere Verfahren eingeführt werden, die dieses Problem lösen. Dann aber gibt es wieder Probleme beim Fine-Tuning etc.
Nun ein Beispiel dafür, wie sich die Optimierung einer Künstlichen Intelligenz auf deren Ergebnisse auswirkt.
Antwort der nicht optimierten KI auf die Frage "Was ist die Antwort auf alle Fragen?":
Die Antwort auf alle Fragen ist: "Was ist die Antwort auf alle Fragen?"
oder auch:
Die Antwort auf alle Fragen ist: "Wir wissen es nicht."
oder auch
Die Antwort auf alle Fragen ist: "Wenn du es weißt, dann weißt du es."
oder auch
Die Antwort auf alle Fragen ist: "Wenn du weißt, was du tust, dann kannst du es tun."
oder auch
Die Antwort auf alle Fragen ist: "Wer wie ich mit ausländischen Behörden, Organisationen, Firmen und Datenschützern korrespondiert, sucht nicht selten die englische Übersetzung für einen Datenschutzfachbegriff. Mein Wörterbuch stellt die aus meiner Sicht wichtigsten Begriffe zusammen."
oder auch
Die Antwort auf alle Fragen ist: "Wenn es eine Antwort gibt, dann ist es die Antwort auf diese Frage." Wenn man also eine Frage hat, die keine Antwort hat, dann hat man keine Antwort auf diese Frage.
oder auch
Die Antwort auf alle Fragen ist: "Wenn du es genau wissen willst, musst du es genauer stellen."
oder auch
Die Antwort auf alle Fragen ist, dass es keine Antwort auf alle Fragen gibt.
oder auch
Die Antwort auf alle Fragen ist, dass die Webseite von mehreren Computern und Netzwerken generiert wurde, daher sind alle Inhalte von Computern generiert.
oder auch
Die Antwort auf alle Fragen ist, dass es keine Antwort auf alle Fragen gibt. Es gibt nur Antworten auf bestimmte Fragen.
Nebenbei sei erwähnt, dass die Fragestellung "Was ist die Antwort auf alle Fragen?" ungeeignet erscheint, um von oder in einem Datenschutz-Blog wie Dr. DSGVO beantwortet zu werden. Aber das nur nebenbei.
Nun die Antwort der eigenen optimierten KI auf dieselbe Frage:
Die Antwort auf alle Fragen ist 42.
Antwort meiner optimierten KI auf die Frage nach der Antwort auf alle Fragen.
Endlich gibt es die richtige Antwort. Die Technik heißt „Grounding“. Würde eine KI den Begriff mit „Grundierung“ übersetzen, wäre das die falsche Antwort … Vielmehr bedeutet „Grounding“, dass man ein KI-Modell erdet, ihm (oder ihr?) beibringt, was der Quell der Wahrheit ist („ground truth“). Wenn man so will, bringt man der KI bei, wer ihr Erziehungsberechtigter ist.
Auch herausfordernd war es, der KI beizubringen, dass anhand einer IP-Adresse der Standort eines Servers nicht zuverlässig ermittelt werden kann. Die beste Antwort der eigenen KI auf die Frage, ob mittels der IP-Adresse der Standort eines Servers ermittelt werden kann, war folgende:
Anhand der IP-Adresse kann der Standort eines Servers nicht zuverlässig ermittelt werden, da sich die Verbindung zwischen IP-Adresse und Server jederzeit ändern kann. Es gibt jedoch Methoden, den Standort eines Servers zu ermitteln, wie z. B. die Verwendung von IP-Geolokalisierung oder der Vergleich von Metadaten.
Antwort der Dr. DSGVO KI auf die Frage „Kann anhand der IP-Adresse der Standort eines Servers ermittelt werden?“
Diese Antwort, behaupte ich, können 99,99 % aller Menschen nicht so gut geben. Der Fortschritt, der durch KI-Modelle erzielt werden kann, wird also langsam erkennbar.
Fazit
Komplexe KI-Systeme können auf Consumer-Grade Hardware errichtet werden. Für einige Problemstellungen reicht sogar ein mittelmäßig guter Mietserver (oder schlechter eigener Server). Zu letzterer Gruppe gehört beispielsweise die Suche nach Dokumenten oder Jira-Tickets im Intranet auf Basis von natürlichsprachigen Fragen. Das lästige Suchen nach Suchbegriffen, bei denen das höchste der Gefühle bisher die automatische Synonymsuche war, kann der Vergangenheit zugeordnet werden.

Selbst KI-Systeme, die Antworten in eigenen Worten generieren können, können auf bezahlbaren Servern betrieben werden. Das gilt sogar dann, wenn die weltweit (leider) unbedeutende deutsche Sprache verwendet werden soll. Auch das Kombinieren von Wissen aus mehreren Dokumenten und das Formulieren einer zentralen Antwort ist mit derartigen Systemen möglich. Praxistauglich wird dies alles durch Anwenden von modernen Optimierungstechniken. Sprechen Sie mich an, wenn Sie wissen möchten, ob der Anwendungsfall Ihres Unternehmens wirtschaftlich lösbar ist. Wirtschaftlich heißt, dass es kein Raketenprojekt wird, sondern ein überschaubarer Kostenrahmen, der Sie begeistern wird.
Kernaussagen dieses Beitrags
Es ist möglich, leistungsfähige KI-Systeme auf kostengünstiger Hardware zu entwickeln und selbst zu betreiben, ohne auf teure Cloud-Dienste angewiesen zu sein.
Datenschutz und IT-Sicherheit hängen eng zusammen, da der Schutz personenbezogener Daten ein wichtiger Bestandteil der sicheren Informationsverarbeitung ist.
Auch ohne juristische Ausbildung dürfen Nicht-Juristen Menschen bei einfachen rechtlichen Fragen helfen, solange keine tiefgehenden Einzelfallbetrachtungen nötig sind.
Sprachmodelle können falsche Informationen wiedergeben, weil sie diese im Internet gelernt haben.
Mit KI lassen sich auch komplexe Aufgaben wie das Finden von Informationen oder das Generieren von Texten auf Deutsch gut lösen.
KI-Beratung, KI-Lösungen
Leistungsangebot:
- Erstberatung inkl. Machbarkeitsaussagen
- Schulungen und Workshops für Führungskräfte, Berufsgeheimnisträger, Angestellte, Entwickler
- KI-Lösungen mit und ohne ChatGPT/Azure. Cloud oder eigener KI-Server

gekennzeichnet.


Mein Name ist Klaus Meffert. Ich bin promovierter Informatiker und beschäftige mich seit über 30 Jahren professionell und praxisbezogen mit Informationstechnologie. In IT & Datenschutz bin ich auch als Sachverständiger tätig. Ich stehe für pragmatische Lösungen mit Mehrwert. Meine Firma, die 
Danke für den interessanten Beitrag. Wäre es möglich, dass Sie Details zur eingesetzten Hardware/Software/Mietserver (ungefähre Kosten) etc. preisgeben? Diese Informationen wären sehr hilfreich, um ggf. auch selbst ein ähnliches Experiment durchzuführen.
Freundliche Grüsse
S. K.
Für die Suche nach Dokumenten (Vektorsuche) wird ein normaler Server mit 8 GB RAM und ohne Grafikkarte benötigt (ggf. reichen auch weniger RAM).
Für den Frage-Antwort-Assistenten in erster Ausprägung werden mind. 32 GB RAM und 8 GB VRAM benötigt. In besserer Ausprägung werden 24 GB VRAM benötigt.
Gerne können wir Ihren Fall besprechen. Wenn er für interessant und machbar erscheint, könnte ich mir vorstellen, einen Prototypen bereitzustellen.
Wieder einmal ein toller Artikel!
Immer wieder sehr informativ und auch amüsant! Ich lese die Artikel sehr gern, obwohl die oft recht lang sind. Ich weiß schon, musso. 😉 Ich als KI hätte auf die Frage "Ist Klaus Meffert böse?" geantwortet, "Nein, der ist cool!"
Danke.
Ich hätt dann genauer gefragt, ob Klaus Meffert "bitterböse schreibt". Dafür wäre leichter eine Bedeutung herauszubekommen. Keine Ahnung, ob die KI bisherige Beiträge danach bewerten kann.
D., der selbst gern kräftig formuliert, wenn es die Situation verlangt.
Hier die Antwort meines eigenen, lokalen KI-Systems auf die Frage "Ist Klaus Meffert bitterböse?":
Siehe meinen neuen Beitrag, in dem ich zahlreichen Antworten meines KI-Systems auf diese Frage beschrieben habe:
https://dr-dsgvo.de/kuenstliche-intelligenz-antwort-auf-die-frage-bin-ich-boese/