Drücke „Enter”, um zum Inhalt zu springen.
Hinweis zu diesem Datenschutz-Blog:
Anscheinend verwenden Sie einen Werbeblocker wie uBlock Origin oder Ghostery, oder einen Browser, der bestimmte Dienste blockiert.
Leider wird dadurch auch der Dienst von VG Wort blockiert. Online-Autoren haben einen gesetzlichen Anspruch auf eine Vergütung, wenn ihre Beiträge oft genug aufgerufen wurden. Um dies zu messen, muss vom Autor ein Dienst der VG Wort eingebunden werden. Ohne diesen Dienst geht der gesetzliche Anspruch für den Autor verloren.

Ich wäre Ihnen sehr verbunden, wenn Sie sich bei der VG Wort darüber beschweren, dass deren Dienst anscheinend so ausgeprägt ist, dass er von manchen als blockierungswürdig eingestuft wird. Dies führt ggf. dazu, dass ich Beiträge kostenpflichtig gestalten muss.

Durch Klick auf folgenden Button wird eine Mailvorlage geladen, die Sie inhaltlich gerne anpassen und an die VG Wort abschicken können.

Nachricht an VG WortMailtext anzeigen

Betreff: Datenschutzprobleme mit dem VG Wort Dienst(METIS)
Guten Tag,

als Besucher des Datenschutz-Blogs Dr. DSGVO ist mir aufgefallen, dass der VG Wort Dienst durch datenschutzfreundliche Browser (Brave, Mullvad...) sowie Werbeblocker (uBlock, Ghostery...) blockiert wird.
Damit gehen dem Autor der Online-Texte Einnahmen verloren, die ihm aber gesetzlich zustehen.

Bitte beheben Sie dieses Problem!

Diese Nachricht wurde von mir persönlich abgeschickt und lediglich aus einer Vorlage generiert.
Wenn der Klick auf den Button keine Mail öffnet, schreiben Sie bitte eine Mail an info@vgwort.de und weisen darauf hin, dass der VG Wort Dienst von datenschutzfreundlichen Browser blockiert wird und dass Online Autoren daher die gesetzlich garantierten Einnahmen verloren gehen.
Vielen Dank,

Ihr Klaus Meffert - Dr. DSGVO Datenschutz-Blog.

PS: Wenn Sie meine Beiträge oder meinen Online Website-Check gut finden, freue ich mich auch über Ihre Spende.
✓ Ausprobieren DSGVO Website-Check sofort DSGVO-Probleme finden

ChatGPT en Bing-AI als garantie voor onjuiste resultaten. Gegevensvriendelijkheid en gegevenskwaliteit?

0
Dr. DSGVO Newsletter detected: Extended functionality available
More articles · Website-Checks · Live Offline-AI
📄 Artikel als PDF (alleen voor abonnees van de nieuwsbrief)
🔒 Premium-Funktion
Der aktuelle Beitrag kann in PDF-Form angesehen und heruntergeladen werden

📊 Download freischalten
Der Download ist nur für Abonnenten des Dr. DSGVO-Newsletters möglich

Wanneer ChatGPT de mensheid voor het eerst verbaasde met zijn ongelofelijke resultaten, denken velen dat deze chatbot moet worden gebruikt voor alles en iedereen. Wat in het privéleven onschuldig lijkt, leidt in het bedrijfsleven tot problemen die snel juridisch kunnen worden aangepakt.

Inleiding

Onlangs deed een Duitse onderneming aankondigingen dat ze een AI-oplossing voor het interpreteren van juridische teksten aanbiedt. De aanleiding what een artikel op Dr. GDPR over Kunstmatige Intelligentie voor de analyse van juridische teksten.

De AI-toepassing van de bedrijf genoemde is nog in het beta-stadium. De vermoedening is dat snel een prototype is gemaakt om de markt voor dergelijke toepassingen te verkennen. Op geen enkel moment werd er melding gemaakt van welk taalmodel in de achtergrond wordt gebruikt. Onderzoeken geven aan dat het om ChatGPT gaat.

Dit artikel is geschreven samen met een presentatie op 05.09.2023 bij de IT Club Mainz & Rheinhessen in het Gutenberg Digital Hub in Mainz.

Zie verder omlaag voor impressies.

De antwoorden van het AI-systeem waren goed, maar niet wereldschokkend. Op juridische vragen werden halfweg plausibele antwoorden met bronnen geleverd. De antwoorden zouden echter niet voldoende zijn geweest om een juridische discussie voor zichzelf te kunnen beslissen. Waarschijnlijk zouden de resultaten zelfs rechtstreeks naar een nederlaag geleid hebben.

Dat ChatGPT-3 door de AI-toepassing van het Duitse bedrijf is gebruikt, kon worden vastgesteld door aan de chatbot om uitleg te vragen. De antwoord van de AI what: „Yes, ik baseer me op een model dat GPT-3 heet en dat door OpenAI is ontwikkeld. […]

Wat is zo problematisch aan ChatGPT? De vraag kan ook gesteld worden over Microsoft Copilot. Een eenvoudig test bewijst, dat Copilot zelfs met eenvoudige taken overweldigd wordt.

Motivatie

Chatbots maken doorgaans gebruik van een ingevoerde kennisbasis. Hier een voorbeeld van een toepassing van de bovengenoemde Duitse onderneming, die kennelijk ChatGPT in de achtergrond gebruikt:

Foute antwoord van een chatbot gebaseerd op ChatGPT. (afbeelding is automatisch vertaald).

De chatbot kent dus geen uitspraak niet dat bestaat en door een duidelijke identificator uniek is geïdentificeerd. De chatbot had het gebruiker liever laten weten waar de grenzen van de chatbot liggen in plaats van alsof er geen gevraagde uitspraak zou zijn.

Om ChatGPT te kunnen gebruiken, hoeft alleen de OpenAI-schrijfinterface (API) te worden gebruikt. Omdat het gebruik van deze API zo eenvoudig is, lijken zich kennelijk veel mensen te voelen bevoegd dit te doen. Daarmee neemt het ongemak zijn loop, zoals blijkt uit het voorbeeld hierboven.

Zo simpel is het om ChatGPT uit een eigen programma te gebruiken (Aanwijzing: Alle data gaat naar OpenAI/ChatGPT, alleen de volgende code ligt lokaal bij de programmeur):

import openai
openai.api\_key = "XYZ" #Ihr kostenpflichtiger OpenAI API-Schlüssel
completion = openai.ChatCompletion()
def frage\_chatgpt(frage):
chat\_log = \[{
'role': 'system',
'content': 'Du bist ein hilfreicher Assistent',
}\]
chat\_log.append({'role': 'user', 'content': frage})
response = completion.create(model='gpt-3.5-turbo', messages=chat\_log)
antwort= response.choices\[0\]\['message'\]\['content'\]
return antwort
print(frage\_chatgpt("Was ist die Antwort auf alle Fragen?"))
Aufruf der OpenAI API für ChatGPT, um für eine Frage eine Antwort von ChatGPT zu erhalten.

Dat kan iedereen echt. In elk geval krijgen zoveel niet-programmeerders het voor elkaar om deze code te schrijven en uit te voeren, net zo goed als mensen die geen automechanicus zijn en een bandenspatslapje kunnen doen. Zoals in de code wordt aangeduid, kost de pret na overschrijding van een testlimiet per aanroep geld. De respons tijd zou ook sneller kunnen zijn (dat is klagen op hoog niveau om de illusie van sommigen te dopen dat ChatGPT alles kan).

Een ander voorbeeld van een vals verhaal dat door ChatGPT wordt gegenereerd:

Foute antwoord van een chatbot die gebaseerd is op ChatGPT. (afbeelding is automatisch vertaald).

Hier mijn vaststelling, die ook in mijn eigen AI kan worden opgenomen, niet echter in ChatGPT: Cookies zijn geen tekstbestanden, maar datasets. ChatGPT zal dus tot nader order altijd verkeerd antwoorden.

Herinnering: ChatGPT is een extreem geavanceerd taalmodel dat zijn gelijkenis zoekt.

Helaas is ChatGPT gebaseerd op zo veel miljoenen of miljarden documenten dat te veel onjuist algemeen kennis en te weinig nauwkeurig speciaal kennis in het kunstmatige brein heeft gekregen.

De Bing-zoekopdracht van Microsoft is ook geïnspireerd door kunstmatige intelligentie. Microsoft had zich onlangs financieel aangesloten bij OpenAI om te profiteren van de hype rond ChatGPT. Vooral als op recht eenvoudig gestelde zoekvragen de Bing-AIwordt ingeschakeld, worden de resultaten snel fout of vreemd. Omgekeerd liggen de resultaten vaak in het positieve verwachtingsvlak wanneer Bing conventioneel zoekt. Conventioneel lukt het vaak het beste om goede treffers te behalen. De verschillen zijn dat antwoorden uit zoekresultaten "alleen" worden geciteerd, maar niet worden geabstraheerd, dus in eigen woorden worden weergegeven door de AI.

Impulslezing bij de IT Club Mainz 6 Rheinhessen op 05.09.2023 in het Gutenberg Digital Hub in Mainz. (afbeelding is automatisch vertaald).

Een juiste, geciteerde antwoord is beter dan een fout antwoord in eigen woorden.

De betere oplossing

Een betere oplossing geeft vaker juiste antwoorden en biedt de gebruiker de kans om mogelijk onnauwkeurige of foutieve antwoorden beter te herkennen, zodat ze kritisch kunnen worden geëvalueerd. Of een antwoord onnauwkeurig of foutief kan zijn, kan met een bedrijfs-eigen AI goed worden vastgesteld, heel anders dan bij gebruik van de black box genaamd ChatGPT.

De toepassingscase voor bedrijfs-eigen AI-systeem is altijd dan gegeven wanneer exacte antwoorden nodig zijn of wanneer vaak eigen documenten gezocht moeten worden. ChatGPT faalt hierin of is in het beste geval te duur, aangezien OpenAI na gebruiksvolume berekent.

Automatisering, validatie en optimalisatie zijn eigenschappen die vooral bedrijfs-eigen AI-systemen bieden, niet echter black boxes zoals ChatGPT.

Het afhankelijk maken van anderen lijkt ook niet noodzakelijkerwijs als beste strategie te werken. We kennen dat uit de laatste jaren. Als voorbeelden kunnen systemen en platforms van Google, Microsoft, Meta of Apple worden genoemd.

Gegevenskwaliteit, zoals genoemd in de titel van dit artikel: De plicht om persoonsgegevens juist op te slaan of te verwerken, volgt uit Artikel 18 lid 1 GDPR. Is de juistheid van dergelijke gegevens betwist of is hun verwerking niet of niet langer gerechtvaardigd, dan kan een betrokken persoon beperkingen in de verwerking vragen.

Aber ook voor gegevens die geen persoonlijke betrekking hebben, is hun juistheid vaak fundamenteel. Neem bijvoorbeeld een advocaat de antwoorden van een chatbot op in zijn processtukken, dan zou het beter zijn als dat wat daar geschreven staat, correct is en door een controle standhoudt.

Bij onderzoeksprojecten of in patenten zou het fataal zijn als onjuiste instructies of onjuiste conclusies in de werkzaamheden zouden worden opgenomen. Rechtelijk riskant is bovendien de overdracht van kritische gegevens naar derden. Gegevens kunnen kritisch zijn, wanneer bijvoorbeeld

  • geheim,
  • Rechtstreeks beschermd door auteursrechten
  • persoonlijk of
  • Vertrouwelijk

Zijn.

Feitenkennis opdoen

De betrouwbaarheid van een tekstverwerkende AI kan aanzienlijk worden verbeterd door belangrijke feiten expliciet in het elektronische brein te plaatsen. Dit wordt vaak ook als Grounding aangeduid. Microsoft zou dit gebruiken voor zijn zoekmachine Bing, maar daarbij faalt het, zoals talloze voorbeelden laten zien. Correct uitgevoerd, helpt Grounding bij het elimineren van verspreide onjuiste informatie.

Na de ondernemings-eigene AI is op orde gebracht, levert ze ook betere antwoorden dan ChatGPT, en dat voor het kennisgedeelte wat relevant is. Wie Goethe what, hoeft ons eigen AI-systeem niet te weten. Dit onnodige aanvullende kennis belast een AI-model alleen maar en leidt tot foute uitspraken, in ieder geval minstens tot minder prestaties („de AI ziet de bomen niet meer door het bos“) of langzamere antwoorden.

Hier een voorbeeld van een antwoord dat is gegenereerd uit de Dr. GDPR kennisbank en kwalitatief veel beter (en vooral juist) is dan de resultaten van Microsoft Bing en ChatGPT:

Antwoord van het autonome Dr. GDPR-AI-systeem op de vraag "Wat zijn cookies?. (afbeelding is automatisch vertaald).

Doorzoekbaar bedrijfskennis onderscheidt zich doordat het meestal overzichtelijk is, in de vorm van documenten aanwezig en waarvan de uitspraken voorafgaand als juist (of juister dan externe bronnen) worden beschouwd. Een eigen AI-zoekmachine voor bedrijfskennis heeft gelijk meerdere voordelen.

Het eerste is dat de eigen bedrijfs- AI autarkisch is en niet afhankelijk van anderen. De vraag naar een gegevensbeschermingsimpactassessments (DSFA) doet zich hier nauwelijks of helemaal niet voor. Geheime of vertrouwelijke gegevens zijn in eigen systemen goed opgeslagen.

Tweede, een autonome bedrijfs-ki kan worden aangepast aan eigen behoeften. Als je naar het programma voorbeeld boven kijkt, valt je misschien op:

  1. Met Python kunnen kunstmatige intelligentiesystemen in enkele regels code opgebouwd worden.
  2. De complexiteit zit niet in het programma, maar in het AI-model dat slechts een keer opgebouwd hoeft te worden.
  3. Een klein stapje is genoeg om veel te veranderen.

Economische toepassingen met aanzienlijk meer waarde zijn mogelijk. Eigen AI-systemen zijn zelfs vaak kostenefficiënter dan het gebruik van de ChatGPT-interface, afgezien van de genoemde nadelen bij gebruik van een derde systeem.

Conclusie

Kunstmatige intelligentie wordt, waarschijnlijk vanwege de gerechtvaardigde enthousiasme voor de nieuwe mogelijkheden, door velen overschat of onjuist ingeschat. Algemene intelligenties zoals ChatGPT zijn precies hiervoor geschikt: om algemene vragen te beantwoorden, zonder claim op betrouwbaarheid of zelfs maar juistheid. Dit is alleen al aan de gebruikershandleiding van dergelijke systemen herkenbaar, die geen enkel hint bevatten dat de resultaten zorgvuldig gecontroleerd moeten worden of dat er soms een fout antwoord bij kan zitten.

Weinig programmeerregels zijn al voldoende om met behulp van 100 miljard kunstmatige neuronen een foutieve uitvoer te genereren. Een paar extra regels code helpen daarbij om met een eigen systeem juiste antwoorden te krijgen.

Bedrijven die een AI willen gebruiken, moeten eerst één vraag beantwoorden: Waarvoor wordt deze AI precies ingezet? Als deze vraag niet kan worden beantwoord, dan staat er wel iets vast. Dit bedrijf heeft waarschijnlijk geen AI-systeem nodig of weet nog niet waar het voor moet worden gebruikt.

De private gebruik van ChatGPT en soortgelijke systemen is zeker interessant, maar iets volledig anders dan het gebruik van chatbots of AI-systemen in het algemeen in een bedrijf.

Als een bedrijf een probleem heeft dat opgelost kan worden met behulp van kunstmatige intelligentie, dan is het de moeite waard om na te gaan of dit probleem opgelost kan worden met behulp van een eigen AI-systeem.

About the author on dr-dsgvo.de
My name is Klaus Meffert. I have a doctorate in computer science and have been working professionally and practically with information technology for over 30 years. I also work as an expert in IT & data protection. I achieve my results by looking at technology and law. This seems absolutely essential to me when it comes to digital data protection. My company, IT Logic GmbH, also offers consulting and development of optimized and secure AI solutions.

Artificiële intelligentie: Hoe slaan AI-taalmodellen gegevens op? Zitten de modellen ook persoonsgegevens in?