Was behandelt der Podcast 'Datenschutz Deluxe'?

Der Podcast behandelt Themen wie digitaler Datenschutz, Künstliche Intelligenz, Social Media und rechtliche Fragestellungen im Zusammenhang mit Datenverarbeitung und Technologie. Er analysiert aktuelle Entwicklungen und kritische Aspekte.

Welche Besonderheiten weist der Podcast hinsichtlich seiner Veröffentlichung auf?

Der Podcast wird von Dr. DSGVO selbst gehostet und nicht über gängige Podcast-Plattformen verbreitet. Zudem werden die Transkripte der Folgen ebenfalls veröffentlicht, um eine umfassende Dokumentation zu gewährleisten.

Wie können KI-Modelle trotz Nutzung öffentlicher Daten personenbezogene Daten speichern?

KI-Modelle speichern personenbezogene Daten, wenn eine objektive Möglichkeit zur Dekodierung besteht, selbst wenn die Daten ursprünglich öffentlich waren. Dies liegt daran, dass die Kombination von Informationen zu einer Identifizierung führen kann, was durch die Architektur der Modelle verstärkt wird.

Welche Risiken birgt die Nutzung von KI-Modellen, die mit dem gesamten Internet trainiert wurden?

Da KI-Modelle den gesamten Internetinhalt absorbieren, können sie sowohl positive als auch negative Inhalte ohne moralische Bewertung verarbeiten. Dies kann zu problematischen Ausgaben führen, da sie Informationen, die in öffentlichen Quellen auftauchen, dauerhaft speichern und abrufen können.

Warum ist die DSGVO wichtig im Zusammenhang mit KI-Modellen?

Die DSGVO ist wichtig, um die Privatsphäre von Einzelpersonen zu schützen und gleichzeitig vor rechtlichen Problemen zu schützen, die durch die Speicherung und Verarbeitung personenbezogener Daten entstehen können. Sie greift bei allen Daten, die direkt oder indirekt auf eine Person schließen lassen.

Wie unterscheiden sich die Zuständigkeiten von Datenschutzbehörden in verschiedenen Ländern?

Datenschutzbehörden haben unterschiedliche Befugnisse. Einige, wie die italienische Behörde, können eigenständig Verbote aussprechen, während andere unterschiedliche Rahmenbedingungen haben.

Welche Herausforderung ergibt sich bei der Ethisierung von KI?

Es ist schwierig, einer KI mit menschenähnlichen Fähigkeiten moralische Werte zu vermitteln. Dies erfordert eine sorgfältige rechtliche Betrachtung, um ethische Standards für den KI-Einsatz zu entwickeln.

Warum sind Datenschutz und Urheberrecht separat zu betrachten?

Datenschutz und Urheberrecht sind unterschiedliche Rechtsbereiche, die im Kontext der KI-Entwicklung und -Nutzung getrennt behandelt werden müssen. Dies gewährleistet eine umfassende Betrachtung der relevanten Aspekte.

Datenschutz Deluxe: Der Podcast über Datenschutz und KI

Der unabhängige Podcast zum digitalen Datenschutz und zu Künstlicher Intelligenz. Die Moderatoren Stephan Plesnik und Frank Kremin diskutieren mit Dr. Klaus Meffert, Betreiber des Blogs Dr. DSGVO, konstruktiv und kontrovers spannende Themen.

Die Themen im Podcast behandeln insbesondere

Digitaler Datenschutz: Webseiten, Cookies und Cookie Tools,
Künstliche Intelligenz,
Social Media,
technische Fragestellungen und Möglichkeiten inklusive Erforderlichkeiten und milderer Mittel,
Recht und Technik im Verbund,
Praxistipps.

Die Podcast-Folgen

Der Player wird von Dr. DSGVO selbst gehostet und läuft lokal ab. Podcast-Plattformen wie Podigee werden nicht benutzt.

Immer wieder greifen wir naturgemäß aktuelle Themen auf, nicht nur zu Künstlicher Intelligenz, sondern auch zu fragwürdigem Datenschutz. Dazu gehören beispielsweise PIMS als vorab gescheiterter Versuch, Cookies beherrschen zu wollen, obwohl es nicht nur um Cookies geht. Wir entlarven also auch billigend ausgestrahlte Inkompetenz und Lobbyismus.

Hier finden Sie die verfügbaren Folgen und Beiträge dazu. Die Transkripte sind ebenfalls verfügbar.

Folge 47: Google's KI Suche und geleakte SEO Dokumente (Transkript)
Folge 46: Videoüberwachung und Gesichtserkennung mit KI auf öffentlichen Plätzen (Transkript)
Folge 45: Das digitale Leben mit Messengern wie WhatsApp / digitale Lebensführung (Beitrag) (Transkript)
Folge 44: TikTok-Verbot in der EU wegen gefährlichem Anreizsystem aufgrund DSA? (Transkript)
Folge 43: Real-Time Bidding (RTB): Der Echtzeit-Austausch Ihrer Daten für Online-Werbung (Beitrag) (Transkript)
Folge 42: Der Datenschutzbeauftragte: Zwangsbestellung oder nicht? (Transkript)
Folge 41: Was ist Künstliche Intelligenz? KI-Definitionen: AI Act (2x), OECD, eigene (Transkript)
Folge 40: Alternativen zu Microsoft Office, Windows und Teams (Transkript)
Folge 39: Cookie Banner: Ablehnen muss direkt möglich sein (Transkript) (siehe auch Urteile)
Folge 38: Microsoft Copilot: Versicherung bei Urheberrechtsverletzungen? (Transkript) (Beitrag 1: Test von Copilot, Beitrag 2: EchoLeak, Beitrag 3: Audit Logs Sicherheitslücke)
Folge 37: Künstliche Intelligenz: Der Nutzungsvorbehalt von Urhebern, den es nicht gibt (Transkript)
Folge 36: Meta/Facebook/Instagram: Fragwürdige Einwilligungsabfrage (Transkript)
Folge 35: Microsoft Outlook: Datenfeindlichstes Mailprogramm der Welt? (Transkript)
Folge 34: Chatbots nutzen: wofür und wofür besser nicht? (Transkript)
Folge 33: Ein Leben ohne WhatsApp ist möglich und sinnvoll (Transkript, Zusammenfassung)
Folge 32: Können personenbezogene Daten zuverlässig anonymisiert werden? (Transkript)
Folge 31: Künstliche Intelligenz: Unterliegen KI-generierte Werke dem Urheberrecht? (Transkript)
Folge 30: Künstliche Intelligenz: Personenbezogene Daten in KI-Modellen (Transkript)
Folge 29: Künstliche Intelligenz und Datenschutzfolgenabschätzung (Transkript)
Folge 28: Datenschutz im Unternehmen: Problembewusstsein und Lösungsmöglichkeiten (Transkript)
Folge 27: Künstliche Intelligenz auf Plattformen von Internetkonzernen (Transkript)
Folge 26: Chatkontrolle: Nützlich oder Eingriff in die Privatsphäre? (Transkript)
Folge 25: IT-Sicherheit im Unternehmen: Mitarbeitersensibilisierung und -schulung (Transkript)
Folge 24: Künstliche Intelligenz: ChatGPT als Gefahr, für den Datenschutz? (Transkript)
Folge 23: Videoüberwachung durch Teslas (Transkript)
Folge 22: Microsoft Teams und der Datenschutz (Transkript)
Folge 21: Zugriff durch Geheimdienste auf Daten von Google, Apple, Facebook & Co. (Transkript)
Folge 20: Die Facebook Fanpage der Bundesregierung (Transkript)
Folge 19: Wie schützt man seine Privatsphäre im Internet? (Transkript)
Folge 18: Sind Cookies personenbezogene Daten? (Transkript)
Folge 17: Können Privatpersonen mit der DSGVO Geld verdienen? (Transkript)
Folge 16: Hinweisgeberschutzgesetz: Worum geht es und wie sieht eine pragmatische Lösung aus? (Transkript)
Folge 15: Google Ads und Datenschutzfragen (Transkript)
Folge 14: E-Mails, Phishing und Echtheit von Nachrichten (Transkript)
Folge 13: Was ist das berechtigte Interesse für die Verarbeitung von Daten? (Transkript)
Folge 12: Was sind personenbezogene Daten? (Transkript)
Folge 11: Welche Website-Agenturen sind seriös? (Transkript)
Folge 10: Cookies und Cookie Tools: Probleme mit dem Datenschutz vorprogrammiert (Transkript)
Folge 9: Google Tag Manager: Weder ein Cookie noch eine Domäne noch erforderlich (Transkript)
Folge 8: Conversion Tracking im Internet geht auch ohne Cookies und ohne Google Analytics (Transkript)
Folge 7: Smart Home Geräte: Datenschutz und gesetzliche Vorgaben (Transkript)
Folge 6: Datenschutzverstöße aus Sicht von Rechtsanwalt und von Datenschützer (Transkript)
Folge 5: Server Side Tracking und Tagging, Cookies, Cookie Abfragen umgehen (Transkript)
Folge 4: Reichweitenmessung für Webseiten und Apps (Transkript)
Folge 3: Google Topics, Google Floc und Cookies sowie Star Trek Computer (Transkript)
Folge 2: Cookies, Cookie Consent Tools, PIMS und Weltwunder (Transkript)
Folge 1: Einstieg, Antworten auf spannende Datenschutzfragen (Transkript)

Die Transkripte wurden mit einer eigenen KI erzeugt. Die Nachbearbeitung pro Folge beschränkt sich auf ca. fünf zu korrigierende Begriffe. Die eigene KI arbeitet also deutlich zuverlässiger als jede allgemeine Lösung. Einer der Gründe ist, dass ein eigenes Wörterbuch verwendet wird. Dieses Wörterbuch ist aber nur ein Baustein von vielen und besteht auch nicht bloß aus einer statischen Liste von Begriffen. Vielmehr greifen mehrere ausgeklügelte Mechanismen ineinander, um mit Hilfe von KI ein sehr gutes Ergebnis zu erreichen. Wir setzen auf optimierte KI statt auf Prompt-Optimierungen. Eine optimierte KI erlaubt einen maximalen Grad der Automatisierung.

Auch der Podcast-Player inkl. Live Transkript-Anzeige wurde selbst erstellt.

Haben Sie Anregungen oder einen Themenwunsch?

Dann schreiben Sie bitte eine Nachricht. Wir berücksichtigen Ihre Wünsche und Kommentare gerne.

Nachricht schreiben

Wir freuen uns auf Sie!

Zu den Transkripten

Die oben genannten Transkripte bieten übrigens spannende Möglichkeiten. Nicht nur, dass man sie sich in anderen Sprachen oder Sprachstilen vorlesen lassen könnte. Man kann sie auch zusammenfassen oder übersetzen lassen. Das alles kann am besten mit KI LLMs (oder DEEPL, wenn gewünscht) stattfinden.

Wo ChatGPT den Dienst (in der Web-Oberfläche) verweigert, kommt man mit einer eigenen KI schnell weiter, auch wenn der Text des Transkriptes 40.000 Zeichen oder länger ist.

Zu den Themen generell

Die Podcasts handelten ursprünglich vom digitalen Datenschutz und manchmal auch von allgemeinen Datenschutzthemen, die außerhalb der Internet-Welt relevant sind. Oft gibt es aber zwischen Online- und Offline-Welt Berürhungspunkte, wie etwa bei der Videoüberwachung: Die Kamera läuft in der realen Welt, das Videosignal wird aber digital übertragen.

Später kam dann Künstliche Intelligenz als Hauptthema hinzu. Es passt hervorragend zum digitalen Datenschutz, weil KI-Modelle extrem viele Daten verarbeiten. Beim Erstellen dieser elektronischen Geirne fließen viele Milliarden Trainingsdatensätze in je ein Gehirn. Ein Datensatz ist hierbei durchaus umfangreich und kann beispielsweise mehrere Din A4-Seiten lang sein.

KI-Modelle wiederum verarbeiten personenbezogene Daten. Das passiert sowohl beim Training als auch bei der Befragung. Bei der Befragung sind oft personenbezogene Daten (oder Geschäftsgeheimnisse) im Eingabe-Prompt an die KI. Auch die Ausgabe eines Sprachmodells enthält oft personenbezogene Daten. Diese Ausgabe kann wortgetreue Zitate aus Trainingsdaten enthalten.

Wir reden also über Datenschutz, Künstliche Intelligenz und rechtliche Herausforderungen und führen eine Bestandsaufnahme durch.

Der technologische Durchbruch

Moderne KI-Systeme wie ChatGPT haben erstmals den Turing-Test bestanden und gelten fast schon als Artificial General Intelligence (AGI), also als Allgemeinintelligenzen. Diese Systeme können deutlich mehr als spezialisierte Algorithmen, die nur einzelne Aufgaben lösen. Der Transformer-Ansatz von 2017 ermöglicht es, beliebige Datentypen in semantisch aufgeladene Zahlenreihen (Vektoren) zu überführen und komplexe Zusammenhänge zu verstehen.

Datenschutz versus Urheberrecht

Die rechtlichen Bedenken verschiedener Datenschutzbehörden basieren oft auf einem Missverständnis. Wenn KI-Systeme ausschließlich öffentliche Datenquellen nutzen (Wikipedia, Common Crawl, öffentliche Webtexte), liegt kein klassisches Datenschutzproblem vor. Diese Daten sind bereits öffentlich zugänglich und meist nicht personenbezogen.

Das eigentliche Problem liegt im Urheberrecht: Jeder Ersteller eines Werks mit Schöpfungshöhe ist automatisch Urheber, unabhängig von seinem Willen. KI-Systeme verwenden diese urheberrechtlich geschützten Inhalte ohne explizite Genehmigung zur Modellentwicklung.

Technische Risiken und Grenzen

KI-Modelle können durch geschickte Prompts dazu gebracht werden, gespeicherte Informationen preiszugeben – auch personenbezogene Daten. Die Tokenisierung zerlegt Texte in Wortfetzen, wobei seltene Begriffe oft vollständig gespeichert werden. Namen mit Sonderzeichen bleiben häufig im Klartext erhalten.

Ein fundamentales Problem entsteht durch das Training mit dem gesamten Internet: KI-Systeme absorbieren sowohl positive als auch negative Inhalte ohne moralische Bewertung. Ohne ethische Grundlagen können sie schnell problematische Ausgaben produzieren, wie der gescheiterte Microsoft Twitter-Bot demonstrierte.

Personenbezogene Daten als verstecktes Risiko

KI-Modelle speichern personenbezogene Daten nicht nur explizit, sondern auch in pseudonymisierter Form. Nach der DSGVO gelten bereits Daten als personenbezogen, wenn eine objektive Möglichkeit zur Dekodierung besteht – unabhängig davon, ob diese faktisch erfolgt. Das Breyer-Urteil des EuGH zeigt dies am Beispiel von IP-Adressen. In KI-Systemen können Namen, E-Mail-Adressen oder andere Identifikatoren als einzelne Token oder in Kombinationen gespeichert sein, die durch gezielte Abfragen extrahierbar werden.

Die eigentliche Gefahr entsteht durch die Kontextualisierung dieser Daten. Während ein isolierter Name wenig problematisch ist, wird er in Verbindung mit anderen Informationen zu einem Datenschutzrisiko. KI-Modelle können durch geschickte Prompt-Engineering dazu gebracht werden, ganze Sätze oder Absätze zu reproduzieren, die ursprünglich in den Trainingsdaten enthalten waren. Diese "dauerhaft gepeicherte Erinnerung" führt dazu, dass private Informationen, die einmal in öffentlichen Quellen auftauchten, dauerhaft im Modell gespeichert und abrufbar bleiben.

Für den Schutz personenbezogener Daten wurde die DSGVO eingeführt. Sie greift immer bei Daten, die direkt oder indirekt auf eine Person schließen lassen. Ohne Datenschutz keine Datensicherheit.

⚡ DSGVO WEBSITE-CHECK

Ist Ihre Website DSGVO-konform?

Website in wenigen Sekunden auf DSGVO-Compliance prüfen

Jetzt Website prüfen

✓ kostenfrei ✓ Sofort-Ergebnisse ✓ Keine Anmeldung

Deswegen ist es wichtig, dass vor allm Webseiten und Apps die Datenschutzregeln respektieren. Die eigene Webseite abzusichern sollte recht leicht möglich sein, wenn die Probleme bekannt sind. Mit dem DSGVO-Scanner erhält man direkt ein gutes Lagebild und kann Maßnahmen ergreifen, um die Rechtssicherheit zu erhöhen.

Es wäre sehr unglücklich, wenn Daten über Personen von Webseiten in KI-Modelle gelangen würden. Dann nämlich könnte es sein, dass der Betreiber der Webseite dafür zur Rechenschaft gezogen wird. Datenschutz dient also nicht nur zur Sicherstellung der Privatsphäre von Einzelpersonen, sondern schützt auch vor rechtlichen Problemen.

Fazit

Der Durchbruch in der KI-Entwicklung erfordert eine differenzierte rechtliche Betrachtung. Datenschutz und Urheberrecht müssen separat behandelt werden, während gleichzeitig ethische Standards für den KI-Einsatz entwickelt werden müssen.

Regulatorische Realität

Datenschutzbehörden in verschiedenen Ländern haben unterschiedliche Befugnisse. Während die italienische Behörde eigenständig Verbote aussprechen kann, variieren die rechtlichen Rahmenbedingungen erheblich. Die Herausforderung besteht darin, einer Intelligenz, die potenziell menschenähnliche Fähigkeiten besitzt, moralische Werte zu vermitteln.