Drücke „Enter”, um zum Inhalt zu springen.
Hinweis zu diesem Datenschutz-Blog:
Anscheinend verwenden Sie einen Werbeblocker wie uBlock Origin oder Ghostery, oder einen Browser, der bestimmte Dienste blockiert.
Leider wird dadurch auch der Dienst von VG Wort blockiert. Online-Autoren haben einen gesetzlichen Anspruch auf eine Vergütung, wenn ihre Beiträge oft genug aufgerufen wurden. Um dies zu messen, muss vom Autor ein Dienst der VG Wort eingebunden werden. Ohne diesen Dienst geht der gesetzliche Anspruch für den Autor verloren.

Ich wäre Ihnen sehr verbunden, wenn Sie sich bei der VG Wort darüber beschweren, dass deren Dienst anscheinend so ausgeprägt ist, dass er von manchen als blockierungswürdig eingestuft wird. Dies führt ggf. dazu, dass ich Beiträge kostenpflichtig gestalten muss.

Durch Klick auf folgenden Button wird eine Mailvorlage geladen, die Sie inhaltlich gerne anpassen und an die VG Wort abschicken können.

Nachricht an VG WortMailtext anzeigen

Betreff: Datenschutzprobleme mit dem VG Wort Dienst(METIS)
Guten Tag,

als Besucher des Datenschutz-Blogs Dr. DSGVO ist mir aufgefallen, dass der VG Wort Dienst durch datenschutzfreundliche Browser (Brave, Mullvad...) sowie Werbeblocker (uBlock, Ghostery...) blockiert wird.
Damit gehen dem Autor der Online-Texte Einnahmen verloren, die ihm aber gesetzlich zustehen.

Bitte beheben Sie dieses Problem!

Diese Nachricht wurde von mir persönlich abgeschickt und lediglich aus einer Vorlage generiert.
Wenn der Klick auf den Button keine Mail öffnet, schreiben Sie bitte eine Mail an info@vgwort.de und weisen darauf hin, dass der VG Wort Dienst von datenschutzfreundlichen Browser blockiert wird und dass Online Autoren daher die gesetzlich garantierten Einnahmen verloren gehen.
Vielen Dank,

Ihr Klaus Meffert - Dr. DSGVO Datenschutz-Blog.

PS: Wenn Sie meine Beiträge oder meinen Online Website-Check gut finden, freue ich mich auch über Ihre Spende.
Ausprobieren Online Webseiten-Check sofort das Ergebnis sehen
Externe Links sind mit dem Symbol Externer Link Symbol gekennzeichnet. Datenschutzinfo

Datenschutz Deluxe: Der Podcast über Datenschutz und KI

Der unabhängige Podcast zum digitalen Datenschutz und zu Künstlicher Intelligenz. Die Moderatoren Stephan Plesnik und Frank Kremin diskutieren mit Dr. Klaus Meffert, Betreiber des Blogs Dr. DSGVO, konstruktiv und kontrovers spannende Themen.

Die Themen im Podcast behandeln insbesondere

  • Digitaler Datenschutz: Webseiten, Cookies und Cookie Tools,
  • Künstliche Intelligenz,
  • Social Media,
  • technische Fragestellungen und Möglichkeiten inklusive Erforderlichkeiten und milderer Mittel,
  • Recht und Technik im Verbund,
  • Praxistipps.

Die Podcast-Folgen

Der Player wird von Dr. DSGVO selbst gehostet und läuft lokal ab. Podcast-Plattformen wie Podigee werden nicht benutzt.

Immer wieder greifen wir naturgemäß aktuelle Themen auf, nicht nur zu Künstlicher Intelligenz, sondern auch zu fragwürdigem Datenschutz. Dazu gehören beispielsweise PIMS als vorab gescheiterter Versuch, Cookies beherrschen zu wollen, obwohl es nicht nur um Cookies geht. Wir entlarven also auch billigend ausgestrahlte Inkompetenz und Lobbyismus.

Hier finden Sie die verfügbaren Folgen und Beiträge dazu. Die Transkripte sind ebenfalls verfügbar.

Die Transkripte wurden mit einer eigenen KI erzeugt. Die Nachbearbeitung pro Folge beschränkt sich auf ca. fünf zu korrigierende Begriffe. Die eigene KI arbeitet also deutlich zuverlässiger als jede allgemeine Lösung. Einer der Gründe ist, dass ein eigenes Wörterbuch verwendet wird. Dieses Wörterbuch ist aber nur ein Baustein von vielen und besteht auch nicht bloß aus einer statischen Liste von Begriffen. Vielmehr greifen mehrere ausgeklügelte Mechanismen ineinander, um mit Hilfe von KI ein sehr gutes Ergebnis zu erreichen. Wir setzen auf optimierte KI statt auf Prompt-Optimierungen. Eine optimierte KI erlaubt einen maximalen Grad der Automatisierung.

Auch der Podcast-Player inkl. Live Transkript-Anzeige wurde selbst erstellt.

Haben Sie Anregungen oder einen Themenwunsch?

Dann schreiben Sie bitte eine Nachricht. Wir berücksichtigen Ihre Wünsche und Kommentare gerne.

Wir freuen uns auf Sie!

Zu den Transkripten

Die oben genannten Transkripte bieten übrigens spannende Möglichkeiten. Nicht nur, dass man sie sich in anderen Sprachen oder Sprachstilen vorlesen lassen könnte. Man kann sie auch zusammenfassen oder übersetzen lassen. Das alles kann am besten mit KI LLMs (oder DEEPL, wenn gewünscht) stattfinden.

Wo ChatGPT den Dienst (in der Web-Oberfläche) verweigert, kommt man mit einer eigenen KI schnell weiter, auch wenn der Text des Transkriptes 40.000 Zeichen oder länger ist.

Zu den Themen generell

Die Podcasts handelten ursprünglich vom digitalen Datenschutz und manchmal auch von allgemeinen Datenschutzthemen, die außerhalb der Internet-Welt relevant sind. Oft gibt es aber zwischen Online- und Offline-Welt Berürhungspunkte, wie etwa bei der Videoüberwachung: Die Kamera läuft in der realen Welt, das Videosignal wird aber digital übertragen.

Später kam dann Künstliche Intelligenz als Hauptthema hinzu. Es passt hervorragend zum digitalen Datenschutz, weil KI-Modelle extrem viele Daten verarbeiten. Beim Erstellen dieser elektronischen Geirne fließen viele Milliarden Trainingsdatensätze in je ein Gehirn. Ein Datensatz ist hierbei durchaus umfangreich und kann beispielsweise mehrere Din A4-Seiten lang sein.

KI-Modelle wiederum verarbeiten personenbezogene Daten. Das passiert sowohl beim Training als auch bei der Befragung. Bei der Befragung sind oft personenbezogene Daten (oder Geschäftsgeheimnisse) im Eingabe-Prompt an die KI. Auch die Ausgabe eines Sprachmodells enthält oft personenbezogene Daten. Diese Ausgabe kann wortgetreue Zitate aus Trainingsdaten enthalten.

Wir reden also über Datenschutz, Künstliche Intelligenz und rechtliche Herausforderungen und führen eine Bestandsaufnahme durch.

Der technologische Durchbruch

Moderne KI-Systeme wie ChatGPT haben erstmals den Turing-Test bestanden und gelten fast schon als Artificial General Intelligence (AGI), also als Allgemeinintelligenzen. Diese Systeme können deutlich mehr als spezialisierte Algorithmen, die nur einzelne Aufgaben lösen. Der Transformer-Ansatz von 2017 ermöglicht es, beliebige Datentypen in semantisch aufgeladene Zahlenreihen (Vektoren) zu überführen und komplexe Zusammenhänge zu verstehen.

Datenschutz versus Urheberrecht

Die rechtlichen Bedenken verschiedener Datenschutzbehörden basieren oft auf einem Missverständnis. Wenn KI-Systeme ausschließlich öffentliche Datenquellen nutzen (Wikipedia, Common Crawl, öffentliche Webtexte), liegt kein klassisches Datenschutzproblem vor. Diese Daten sind bereits öffentlich zugänglich und meist nicht personenbezogen.

Das eigentliche Problem liegt im Urheberrecht: Jeder Ersteller eines Werks mit Schöpfungshöhe ist automatisch Urheber, unabhängig von seinem Willen. KI-Systeme verwenden diese urheberrechtlich geschützten Inhalte ohne explizite Genehmigung zur Modellentwicklung.

Technische Risiken und Grenzen

KI-Modelle können durch geschickte Prompts dazu gebracht werden, gespeicherte Informationen preiszugeben – auch personenbezogene Daten. Die Tokenisierung zerlegt Texte in Wortfetzen, wobei seltene Begriffe oft vollständig gespeichert werden. Namen mit Sonderzeichen bleiben häufig im Klartext erhalten.

Ein fundamentales Problem entsteht durch das Training mit dem gesamten Internet: KI-Systeme absorbieren sowohl positive als auch negative Inhalte ohne moralische Bewertung. Ohne ethische Grundlagen können sie schnell problematische Ausgaben produzieren, wie der gescheiterte Microsoft Twitter-Bot demonstrierte.

Personenbezogene Daten als verstecktes Risiko

KI-Modelle speichern personenbezogene Daten nicht nur explizit, sondern auch in pseudonymisierter Form. Nach der DSGVO gelten bereits Daten als personenbezogen, wenn eine objektive Möglichkeit zur Dekodierung besteht – unabhängig davon, ob diese faktisch erfolgt. Das Breyer-Urteil des EuGH zeigt dies am Beispiel von IP-Adressen. In KI-Systemen können Namen, E-Mail-Adressen oder andere Identifikatoren als einzelne Token oder in Kombinationen gespeichert sein, die durch gezielte Abfragen extrahierbar werden.

Die eigentliche Gefahr entsteht durch die Kontextualisierung dieser Daten. Während ein isolierter Name wenig problematisch ist, wird er in Verbindung mit anderen Informationen zu einem Datenschutzrisiko. KI-Modelle können durch geschickte Prompt-Engineering dazu gebracht werden, ganze Sätze oder Absätze zu reproduzieren, die ursprünglich in den Trainingsdaten enthalten waren. Diese "dauerhaft gepeicherte Erinnerung" führt dazu, dass private Informationen, die einmal in öffentlichen Quellen auftauchten, dauerhaft im Modell gespeichert und abrufbar bleiben.

Für den Schutz personenbezogener Daten wurde die DSGVO eingeführt. Sie greift immer bei Daten, die direkt oder indirekt auf eine Person schließen lassen. Ohne Datenschutz keine Datensicherheit.

⚡ DSGVO WEBSITE-CHECK

Ist Ihre Website DSGVO-konform?

Website in wenigen Sekunden auf DSGVO-Compliance prüfen

Jetzt Website prüfen
✓ kostenfrei ✓ Sofort-Ergebnisse ✓ Keine Anmeldung

Deswegen ist es wichtig, dass vor allm Webseiten und Apps die Datenschutzregeln respektieren. Die eigene Webseite abzusichern sollte recht leicht möglich sein, wenn die Probleme bekannt sind. Mit dem DSGVO-Scanner erhält man direkt ein gutes Lagebild und kann Maßnahmen ergreifen, um die Rechtssicherheit zu erhöhen.

Es wäre sehr unglücklich, wenn Daten über Personen von Webseiten in KI-Modelle gelangen würden. Dann nämlich könnte es sein, dass der Betreiber der Webseite dafür zur Rechenschaft gezogen wird. Datenschutz dient also nicht nur zur Sicherstellung der Privatsphäre von Einzelpersonen, sondern schützt auch vor rechtlichen Problemen.

Fazit

Der Durchbruch in der KI-Entwicklung erfordert eine differenzierte rechtliche Betrachtung. Datenschutz und Urheberrecht müssen separat behandelt werden, während gleichzeitig ethische Standards für den KI-Einsatz entwickelt werden müssen.

Regulatorische Realität

Datenschutzbehörden in verschiedenen Ländern haben unterschiedliche Befugnisse. Während die italienische Behörde eigenständig Verbote aussprechen kann, variieren die rechtlichen Rahmenbedingungen erheblich. Die Herausforderung besteht darin, einer Intelligenz, die potenziell menschenähnliche Fähigkeiten besitzt, moralische Werte zu vermitteln.

Der Durchbruch in der KI-Entwicklung erfordert eine differenzierte rechtliche Betrachtung. Datenschutz und Urheberrecht müssen separat behandelt werden, während gleichzeitig ethische Standards für den KI-Einsatz entwickelt werden müssen.