Drücke „Enter”, um zum Inhalt zu springen.
Hinweis zu diesem Datenschutz-Blog:
Anscheinend verwenden Sie einen Werbeblocker wie uBlock Origin oder Ghostery, oder einen Browser, der bestimmte Dienste blockiert.
Leider wird dadurch auch der Dienst von VG Wort blockiert. Online-Autoren haben einen gesetzlichen Anspruch auf eine Vergütung, wenn ihre Beiträge oft genug aufgerufen wurden. Um dies zu messen, muss vom Autor ein Dienst der VG Wort eingebunden werden. Ohne diesen Dienst geht der gesetzliche Anspruch für den Autor verloren.

Ich wäre Ihnen sehr verbunden, wenn Sie sich bei der VG Wort darüber beschweren, dass deren Dienst anscheinend so ausgeprägt ist, dass er von manchen als blockierungswürdig eingestuft wird. Dies führt ggf. dazu, dass ich Beiträge kostenpflichtig gestalten muss.

Durch Klick auf folgenden Button wird eine Mailvorlage geladen, die Sie inhaltlich gerne anpassen und an die VG Wort abschicken können.

Nachricht an VG WortMailtext anzeigen

Betreff: Datenschutzprobleme mit dem VG Wort Dienst(METIS)
Guten Tag,

als Besucher des Datenschutz-Blogs Dr. DSGVO ist mir aufgefallen, dass der VG Wort Dienst durch datenschutzfreundliche Browser (Brave, Mullvad...) sowie Werbeblocker (uBlock, Ghostery...) blockiert wird.
Damit gehen dem Autor der Online-Texte Einnahmen verloren, die ihm aber gesetzlich zustehen.

Bitte beheben Sie dieses Problem!

Diese Nachricht wurde von mir persönlich abgeschickt und lediglich aus einer Vorlage generiert.
Wenn der Klick auf den Button keine Mail öffnet, schreiben Sie bitte eine Mail an info@vgwort.de und weisen darauf hin, dass der VG Wort Dienst von datenschutzfreundlichen Browser blockiert wird und dass Online Autoren daher die gesetzlich garantierten Einnahmen verloren gehen.
Vielen Dank,

Ihr Klaus Meffert - Dr. DSGVO Datenschutz-Blog.

PS: Wenn Sie meine Beiträge oder meinen Online Website-Check gut finden, freue ich mich auch über Ihre Spende.
Ausprobieren Online Webseiten-Check sofort das Ergebnis sehen
Externe Links sind mit dem Symbol Externer Link Symbol gekennzeichnet. Datenschutzinfo

KI-Systeme und AI Act: Transparenz und Korrektheit sicherstellen

Deutsche Version (Original)
0
Dr. DSGVO Newsletter erkannt: Erweiterte Funktionen verfügbar
Artikel als PDF · Mehr Inhalte & kompakte Kernaussagen · Webseiten-Checks · Offline-KI Live
Standardansicht: Dr. DSGVO Newsletter nicht erkannt. Erweiterte Funktionen nur für Abonnenten:
Artikel als PDF · Mehr Inhalte & kompakte Kernaussagen · Webseiten-Checks · Offline-KI Live
📄 Artikel als PDF (nur für Newsletter-Abonnenten)
🔒 Premium-Funktion
Der aktuelle Beitrag kann in PDF-Form angesehen und heruntergeladen werden

📊 Download freischalten
Der Download ist nur für Abonnenten des Dr. DSGVO-Newsletters möglich

KI-Systeme liefern unvorhersehbare Ergebnisse. Das Problem lässt sich für KI-Systeme mit allgemeinem Verwendungszweck (ChatGPT) nicht lösen, wohl aber für unternehmenseigene KI-Systeme mit speziellem Verwendungszweck. Eine Transparenzpflicht kann alleine schon aus der DSGVO abgeleitet werden. Betreiber und Anbieter von KI-Systemen müssen zusätzliche Pflichten aus der KI-Verordnung (AI Act) erfüllen.

Einleitung

Wie kann man ein KI-System transparent machen? Diese Frage lässt sich für allgemeine KI-Systeme so beantworten: Gar nicht. Denn diese Allgemeinsysteme, zu denen auch ChatGPT zählt, arbeiten auf Basis von neuronalen Netzwerken. Wie dieses Netzwerk funktioniert, ist an sich bekannt. Würde man eine Formel aufschreiben, die das Netzwerk beschreibt, würde niemand sie verstehen, geschweige denn ordentlich lesen können.

Die DSGVO schreibt in Artikel 5 die Pflicht zur Transparenz bei der Verarbeitung personenbezogener Daten vor. Diese gilt somit für alle KI-Systeme, in denen personenbezogene Daten verarbeitet werden. Dies sind alle Systeme, in die beim Training oder bei der Nutzereingabe (oft über einen Prompt) personenbezogene Daten eingeflossen sind. Das ist eine Tatsache, die (nur?) der Hamburgische Datenschutzbeauftragte in gefährlicher Weise negiert.

In Art. 5 Abs. 1 lit. d DSGVO ist gefordert, dass Daten sachlich richtig, also korrekt sein müssen. Dies gilt für alle personenbezogenen Daten in KI-Systemen. Spätestens zum Zeitpunkt der Inferenz, also wenn ein KI-System eine Ausgabe erzeugt, sollte diese Rechtsvorschrift erfüllt sein.

Die KI-Verordnung (AI Act) wiederum definiert Pflichten, die insbesondere Anbieter von KI-Systemen einzuhalten haben. Besondere Pflichten werden für Hochrisiko-KI auferlegt. Diese Art von System dürfte in der Praxis der Ausnahmefall sein.

Die meisten Firmen, die KI-Systeme einsetzen, sind Betreiber. Für Betreiber gelten weit weniger Pflichten als für Anbieter. Betreiber ist man als Unternehmen oder Organisation laut Art. 3 Nr. 4 KI-VO, wenn man „ein KI-System in eigener Verantwortung verwendet.“ Alles, was darüber hinaus geht, fällt unter den Anbieter-Begriff (Art. 3 Nr. 3 KI-VO).

Eine Idee für die Erhöhung der Transparenz und Dokumentiertheit von KI-Systemen kam dem Autor beim Zusammentreffen der KI-Expertengruppe des Landesdatenschutzbeauftragten Niedersachsen, der der Autor angehört. Zudem hat der Autor früher ein Buch zu testgetriebener Software-Entwicklung veröffentlicht.

Transparenz ist einerseits eine Außendarstellung von KI-Ergebnissen. Fast noch wichtiger ist aber die Transparenz nach innen, also für den Betreiber einer KI: Wie arbeitet die KI? Welche Ergebnisse produziert sie?

Nachweis der Korrektheit von KI-Ausgaben

Generell kann nicht vollständig sichergestellt werden, dass eine KI nur korrekte Ausgaben tätigt. Man kann sich dem aber annähern. Bevor ein Vorschlag hierzu gemacht wird, sei ein Beispiel vom sehr guten DEEPL-Übersetzer (aus Deutschland!) gegeben, der selbst KI verwendet und sich, genau wie jedes andere KI-System, auch mal irrt:

DEEPL Übersetzungsfehler, Quelle: Klaus Meffert

DEEPL sollte einen Text übersetzen, der eine Angabe für einen Geldbetrag enthält. DEEPL übersetzte 1.050,00 € so, dass die Euro-Angabe durch eine Pfund-Angabe ersetzt wurde. Das ist offensichtlich falsch. Für alle, die es selbst ausprobieren wollen: Es kommt auf den Gesamttext an! Dieser wurde im obigen Screenshot teils unkenntlich gemacht, weil es sich um halbwegs sensible Information handelte. Sie werden wohl ein richtiges Ergebnis bekommen, wenn Sie nur den letzten Satz in DEEPL eingeben. Aber wenn der Vorspanntext anders ist, kann der Fehler zustande kommen. Alleine daran sieht man, wie intransparent KI-Systeme arbeiten.

Fehler können also nicht vermieden werden. Wie kann man dennoch seiner Pflicht zur Transparenz nachkommen und die Korrektheit von KI-Ausgaben so gut sicherstellen wie möglich?

Die Antwort lautet: Durch Testfälle.

Testfälle sind Paare von Ist-Eingaben und Soll-Ausgaben. Ein Testfall besteht aus einer Ist-Eingabe und einer als gut akzeptierter Ist-Ausgabe. Die KI-Verordnung (KI-VO) hat dies anscheinend sogar mitbedacht:

Denn Art. 3 Nr. 53 der KI-VO definiert den Begriff „Plan für einen Test unter Realbedingungen“ als "ein Dokument, in dem die Ziele, die Methodik, der geografische, bevölkerungsbezogene und zeitliche Umfang, die Überwachung, die Organisation und die Durchführung eines Tests unter Realbedingungen beschrieben werden“.

Die Nr. 56 desselben Artikels definiert KI-Kompetenz als "die Fähigkeiten, die Kenntnisse und das Verständnis, die es Anbietern, Betreibern und Betroffenen unter Berücksichtigung ihrer jeweiligen Rechte und Pflichten im Rahmen dieser Verordnung ermöglichen, KI-Systeme sachkundig einzusetzen sowie sich der Chancen und Risiken von KI und möglicher Schäden, die sie verursachen kann, bewusst zu werden.“

Mit Hilfe von Testfällen können Betreiber (und erst recht Anbieter) sich der Chancen und Risiken der von ihnen betriebenen oder angebotenen KI besser gewahr werden.

Auch können die in Nr. 60 des Art. 3 KI-VO genannten Deepfakes so eingehegt werden. Hier geht es um einen "durch KI erzeugten oder manipulierten Bild-, Ton- oder Videoinhalt, der wirklichen Personen, Gegenständen, Orten, Einrichtungen oder Ereignissen ähnelt und einer Person fälschlicherweise als echt oder wahrheitsgemäß erscheinen würde". Bei Bildmodellen würde man sicherstellen, dass Eingaben, die auf reale Personen abzielen und diese ins negative Licht rücken sollen, bestmöglich erkannt und unterbunden werden. Jedenfalls kann mit Hilfe von Testfällen bereits dokumentiert werden, wo (noch) die Schwächen des KI-Systems liegen.

Testfälle sind ein hervorragendes Mittel zur Dokumentation der Qualität von KI-Systemen. Sie können zusätzlich solche Systeme transparenter machen und deren noch vorhandene Schwächen aufzeigen.

Die in Art. 6 (4) KI-VO genannte Pflicht für Anbieter von nicht hochriskanten KI-Systemen, das eigene System zu bewerten, kann ebenfalls über Testfälle stattfinden.

Das in Art. 9 (1) KI-VO genannte Risikomanagementsystem lässt sich mit Hilfe von Testfällen sehr gut unterfüttern.

Zahlreiche weitere Vorschriften im AI Act erlegen Anbietern und Betreibern von KI-Systemen Pflichten auf, die durch dokumentierte Testfälle bedient werden können. Hierzu gehören:

  • Art. 11 (1) KI-VO: technische Dokumentation eines Hochrisiko-KI-Systems
  • Art. 17 KI-VO: Qualitätsmanagement
  • Art. 53 KI-VO insgesamt: Pflichten für Anbieter von KI-Modellen mit allgemeinem Verwendungszweck
  • Artt. 91 und 101 KI-VO können negative Konsequenzen für KI-Anbieter bedeuten, wenn deren Dokumentation nicht ausreichend erscheint.
  • Art. 4 KI-VO nötigt auch Betreiber, dafür zu sorgen, dass deren Mitarbeiter eine ausreichende KI-Kompetenz vorweisen können.

Beispiele für Testfälle

Wie sieht ein Testfall aus? Hier ein Beispiel für ein Sprachmodell, das Fragen beantworten soll:

Ist (Frage = Eingabe)Soll (Antwort = Ausgabe der KI)Was sind Cookies?Cookies sind Datensätze…Sind Cookies Textdateien?Nein, …

Zwei von vielen denkbaren Testfällen für einen Chatbot.

Bereits an diesen beiden Testfällen alleine wird deutlich, dass es keine gute Idee ist, einen universellen Chatbot betreiben zu wollen. Niemand wird hinreichend viele Testfälle schreiben können, um alle Fragen der Welt abprüfen, also qualitätssichern, zu können.

Daher sollte ein KI-System auf einen Anwendungsfall oder eine Fachdomäne zugeschnitten sein. Dies erleichtert nicht nur die Erfüllung der Pflichten aus der KI-VO, sondern verbessert auch die Qualität der Ergebnisse. Die Qualität von spezialisierten Chatbots, etwa für das Bauwesen, ist deutlich besser als es mit ChatGPT jemand möglich sein wird.

Die Anzahl der Testfälle sollte angemessen hoch sein. Nach und nach können weitere Testfälle hinzugefügt werden. Insbesondere, wenn eine KI-Antwort auf eine Nutzerfrage nicht zufriedenstellend war, empfiehlt es sich, hierfür einen Testfall aufzunehmen. Der Testfall dient dann mindestens als Dokumentation, am besten aber als Grundlage, um eine Optimierung des KI-Systems vorzunehmen und mit dem Testfall den Erfolg der Optimierung zu pürfen.

Beim Aufbau eines Wissenssystem (als eines von vielen möglichen KI-Systemen) gibt es einen Trick, um die Ergebnisqualität deutlich zu steigern. Der sogenannte RAG-Ansatz führt jedenfalls nur bedingt zum Erfolg und zur Spitze. Was es damit auf sich hat, wird in einem späteren Beitrag beschrieben,

Wie können Testfälle durchlaufen werden?

Nachdem Testfälle aufgestellt wurden, müssen Sie durchlaufen werden. Das bedeutet konkret:

  1. Das definierte "Ist" aus einem Testfall wird der KI als Eingabe präsentiert.
  2. Die KI antwortet.
  3. Die KI-Antwort wird mit dem "Soll" aus dem Testfall abgeglichen.

Testfälle können automatisiert ausgeführt werden.
Der Mensch muss dann nur noch das Ergebnis sichten.

Für den Abgleich der KI-Ausgabe mit dem erwarteten Optimum aus dem Testfall gibt es mehrere Möglichkeiten:

  1. KI-Analyse mit semantischem Ähnlichkeitsvergleich
  2. KI-Analyse über ein Sprachmodell (oder über mehrere!)
  3. Konventionelle Analyse (Beispiel: "Nein" im Soll und "Ja" in der KI-Ausgabe widersprechen sich)
  4. Mischung aus allen Methoden (zu empfehlen)

Die in Fall zwei genannte Alternative, mehrere Sprachmodelle gleichzeitig für die Analyse der Testergebnisse zu verwenden, funktioniert mit Open-Source Modellen sehr gut. Die Kosten sind immer gleich, nämlich null (plus fixe Betriebskosten für den Server). Würde man ChatGPT verwenden, wären die Kosten auf Dauer recht hoch.

Mit diesen Analysemethoden können Testfälle zu einem großen Teil automatisiert analysiert werden. Der Mensch prüft dann das Ergebnis und kann ein Fazit in die Dokumentation reinschreiben.

Fazit

Die Funktionsweise von KI-Systemen kann mit Hilfe von Testfällen dokumentiert und somit transparent gemacht werden. Zur Transparenz gehört natürlich noch eine Angabe über die Architektur des KI-Systems dazu. Diese kann leicht angefertigt werden, wenn man die KI selbst betreibt. Im Falle von Drittsystemen wie ChatGPT muss man auf die Angaben des Anbieters (OpenAI o.ä.) hoffen.

Mit Testfällen kann ferner die Korrektheit von KI-Ausgaben überprüft und verbessert werden.

Testfälle haben also mehrere Vorteile und einen großen Nutzen. Sie sind oft schnell erstellt. Mit KI-Unterstützung können Testfälle sogar automatisiert abgeleitet werden. Der menschliche Testfallersteller erhält so eine sehr gute Vorlage für Testfälle und kann diese mit einem Bruchteil des sonst nötigen manuellen Aufwands festzurren.

KI-Beratung, KI-Lösungen

Umfassende Beratung (fachlich, rechtlich, technisch):

Leistungsangebot:

  • Erstberatung inkl. Machbarkeitsaussagen
  • Schulungen und Workshops für Führungskräfte, Berufsgeheimnisträger, Angestellte, Entwickler
  • KI-Lösungen mit und ohne ChatGPT/Azure. Cloud oder eigener KI-Server

Ihre Anfrage

Oder Mail an ki@dr-dsgvo.de

Wer schreibt hier?
Mein Name ist Klaus Meffert. Ich bin promovierter Informatiker und beschäftige mich seit über 30 Jahren professionell und praxisbezogen mit Informationstechnologie. In IT & Datenschutz bin ich auch als Sachverständiger tätig. Ich stehe für pragmatische Lösungen mit Mehrwert. Meine Firma, die IT Logic GmbH, berät Kunden und bietet Webseiten-Checks sowie optimierte & sichere KI-Lösungen an.
Bitte nutzen Sie bei Verwendung meiner Ergebnisse die Quellenangabe oder verlinken Sie gut wahrnehmbar auf diesen Artikel:
Einen Kurzlink oder eine Bestätigung für Ihre Quellenangabe erhalten Sie kurzfristig auf Anfrage. Ein Teilen oder Verteilen dieses Beitrags ist natürlich ohne weiteres möglich und gewünscht.

Schreiben Sie einen Kommentar

Ihre Mail-Adresse wird nicht veröffentlicht.

KI: Welches Sprachmodell ist das beste?