Wanneer ChatGPT de mensheid voor het eerst verbaasde met zijn ongelofelijke resultaten, denken velen dat deze chatbot moet worden gebruikt voor alles en iedereen. Wat in het privéleven onschuldig lijkt, leidt in het bedrijfsleven tot problemen die snel juridisch kunnen worden aangepakt.
Inleiding
Onlangs deed een Duitse onderneming aankondigingen dat ze een AI-oplossing voor het interpreteren van juridische teksten aanbiedt. De aanleiding what een artikel op Dr. GDPR over Kunstmatige Intelligentie voor de analyse van juridische teksten.
De AI-toepassing van de bedrijf genoemde is nog in het beta-stadium. De vermoedening is dat snel een prototype is gemaakt om de markt voor dergelijke toepassingen te verkennen. Op geen enkel moment werd er melding gemaakt van welk taalmodel in de achtergrond wordt gebruikt. Onderzoeken geven aan dat het om ChatGPT gaat.
Dit artikel is geschreven samen met een presentatie op 05.09.2023 bij de IT Club Mainz & Rheinhessen in het Gutenberg Digital Hub in Mainz.
Zie verder omlaag voor impressies.
De antwoorden van het AI-systeem waren goed, maar niet wereldschokkend. Op juridische vragen werden halfweg plausibele antwoorden met bronnen geleverd. De antwoorden zouden echter niet voldoende zijn geweest om een juridische discussie voor zichzelf te kunnen beslissen. Waarschijnlijk zouden de resultaten zelfs rechtstreeks naar een nederlaag geleid hebben.
Dat ChatGPT-3 door de AI-toepassing van het Duitse bedrijf is gebruikt, kon worden vastgesteld door aan de chatbot om uitleg te vragen. De antwoord van de AI what: „Yes, ik baseer me op een model dat GPT-3 heet en dat door OpenAI is ontwikkeld. […]
Wat is zo problematisch aan ChatGPT? De vraag kan ook gesteld worden over Microsoft Copilot. Een eenvoudig test bewijst, dat Copilot zelfs met eenvoudige taken overweldigd wordt.
Motivatie
Chatbots maken doorgaans gebruik van een ingevoerde kennisbasis. Hier een voorbeeld van een toepassing van de bovengenoemde Duitse onderneming, die kennelijk ChatGPT in de achtergrond gebruikt:

De chatbot kent dus geen uitspraak niet dat bestaat en door een duidelijke identificator uniek is geïdentificeerd. De chatbot had het gebruiker liever laten weten waar de grenzen van de chatbot liggen in plaats van alsof er geen gevraagde uitspraak zou zijn.
Om ChatGPT te kunnen gebruiken, hoeft alleen de OpenAI-schrijfinterface (API) te worden gebruikt. Omdat het gebruik van deze API zo eenvoudig is, lijken zich kennelijk veel mensen te voelen bevoegd dit te doen. Daarmee neemt het ongemak zijn loop, zoals blijkt uit het voorbeeld hierboven.
Zo simpel is het om ChatGPT uit een eigen programma te gebruiken (Aanwijzing: Alle data gaat naar OpenAI/ChatGPT, alleen de volgende code ligt lokaal bij de programmeur):
import openai
openai.api\_key = "XYZ" #Ihr kostenpflichtiger OpenAI API-Schlüssel
completion = openai.ChatCompletion()
def frage\_chatgpt(frage):
chat\_log = \[{
'role': 'system',
'content': 'Du bist ein hilfreicher Assistent',
}\]
chat\_log.append({'role': 'user', 'content': frage})
response = completion.create(model='gpt-3.5-turbo', messages=chat\_log)
antwort= response.choices\[0\]\['message'\]\['content'\]
return antwort
print(frage\_chatgpt("Was ist die Antwort auf alle Fragen?"))
Aufruf der OpenAI API für ChatGPT, um für eine Frage eine Antwort von ChatGPT zu erhalten.
Dat kan iedereen echt. In elk geval krijgen zoveel niet-programmeerders het voor elkaar om deze code te schrijven en uit te voeren, net zo goed als mensen die geen automechanicus zijn en een bandenspatslapje kunnen doen. Zoals in de code wordt aangeduid, kost de pret na overschrijding van een testlimiet per aanroep geld. De respons tijd zou ook sneller kunnen zijn (dat is klagen op hoog niveau om de illusie van sommigen te dopen dat ChatGPT alles kan).
Een ander voorbeeld van een vals verhaal dat door ChatGPT wordt gegenereerd:

Hier mijn vaststelling, die ook in mijn eigen AI kan worden opgenomen, niet echter in ChatGPT: Cookies zijn geen tekstbestanden, maar datasets. ChatGPT zal dus tot nader order altijd verkeerd antwoorden.
Herinnering: ChatGPT is een extreem geavanceerd taalmodel dat zijn gelijkenis zoekt.
Helaas is ChatGPT gebaseerd op zo veel miljoenen of miljarden documenten dat te veel onjuist algemeen kennis en te weinig nauwkeurig speciaal kennis in het kunstmatige brein heeft gekregen.
De Bing-zoekopdracht van Microsoft is ook geïnspireerd door kunstmatige intelligentie. Microsoft had zich onlangs financieel aangesloten bij OpenAI om te profiteren van de hype rond ChatGPT. Vooral als op recht eenvoudig gestelde zoekvragen de Bing-AIwordt ingeschakeld, worden de resultaten snel fout of vreemd. Omgekeerd liggen de resultaten vaak in het positieve verwachtingsvlak wanneer Bing conventioneel zoekt. Conventioneel lukt het vaak het beste om goede treffers te behalen. De verschillen zijn dat antwoorden uit zoekresultaten "alleen" worden geciteerd, maar niet worden geabstraheerd, dus in eigen woorden worden weergegeven door de AI.

Een juiste, geciteerde antwoord is beter dan een fout antwoord in eigen woorden.
De betere oplossing
Een betere oplossing geeft vaker juiste antwoorden en biedt de gebruiker de kans om mogelijk onnauwkeurige of foutieve antwoorden beter te herkennen, zodat ze kritisch kunnen worden geëvalueerd. Of een antwoord onnauwkeurig of foutief kan zijn, kan met een bedrijfs-eigen AI goed worden vastgesteld, heel anders dan bij gebruik van de black box genaamd ChatGPT.
De toepassingscase voor bedrijfs-eigen AI-systeem is altijd dan gegeven wanneer exacte antwoorden nodig zijn of wanneer vaak eigen documenten gezocht moeten worden. ChatGPT faalt hierin of is in het beste geval te duur, aangezien OpenAI na gebruiksvolume berekent.
Automatisering, validatie en optimalisatie zijn eigenschappen die vooral bedrijfs-eigen AI-systemen bieden, niet echter black boxes zoals ChatGPT.
Het afhankelijk maken van anderen lijkt ook niet noodzakelijkerwijs als beste strategie te werken. We kennen dat uit de laatste jaren. Als voorbeelden kunnen systemen en platforms van Google, Microsoft, Meta of Apple worden genoemd.
Gegevenskwaliteit, zoals genoemd in de titel van dit artikel: De plicht om persoonsgegevens juist op te slaan of te verwerken, volgt uit Artikel 18 lid 1 GDPR. Is de juistheid van dergelijke gegevens betwist of is hun verwerking niet of niet langer gerechtvaardigd, dan kan een betrokken persoon beperkingen in de verwerking vragen.
Aber ook voor gegevens die geen persoonlijke betrekking hebben, is hun juistheid vaak fundamenteel. Neem bijvoorbeeld een advocaat de antwoorden van een chatbot op in zijn processtukken, dan zou het beter zijn als dat wat daar geschreven staat, correct is en door een controle standhoudt.
Bij onderzoeksprojecten of in patenten zou het fataal zijn als onjuiste instructies of onjuiste conclusies in de werkzaamheden zouden worden opgenomen. Rechtelijk riskant is bovendien de overdracht van kritische gegevens naar derden. Gegevens kunnen kritisch zijn, wanneer bijvoorbeeld
- geheim,
- Rechtstreeks beschermd door auteursrechten
- persoonlijk of
- Vertrouwelijk
Zijn.
Feitenkennis opdoen
De betrouwbaarheid van een tekstverwerkende AI kan aanzienlijk worden verbeterd door belangrijke feiten expliciet in het elektronische brein te plaatsen. Dit wordt vaak ook als Grounding aangeduid. Microsoft zou dit gebruiken voor zijn zoekmachine Bing, maar daarbij faalt het, zoals talloze voorbeelden laten zien. Correct uitgevoerd, helpt Grounding bij het elimineren van verspreide onjuiste informatie.
Na de ondernemings-eigene AI is op orde gebracht, levert ze ook betere antwoorden dan ChatGPT, en dat voor het kennisgedeelte wat relevant is. Wie Goethe what, hoeft ons eigen AI-systeem niet te weten. Dit onnodige aanvullende kennis belast een AI-model alleen maar en leidt tot foute uitspraken, in ieder geval minstens tot minder prestaties („de AI ziet de bomen niet meer door het bos“) of langzamere antwoorden.
Hier een voorbeeld van een antwoord dat is gegenereerd uit de Dr. GDPR kennisbank en kwalitatief veel beter (en vooral juist) is dan de resultaten van Microsoft Bing en ChatGPT:

Doorzoekbaar bedrijfskennis onderscheidt zich doordat het meestal overzichtelijk is, in de vorm van documenten aanwezig en waarvan de uitspraken voorafgaand als juist (of juister dan externe bronnen) worden beschouwd. Een eigen AI-zoekmachine voor bedrijfskennis heeft gelijk meerdere voordelen.
Het eerste is dat de eigen bedrijfs- AI autarkisch is en niet afhankelijk van anderen. De vraag naar een gegevensbeschermingsimpactassessments (DSFA) doet zich hier nauwelijks of helemaal niet voor. Geheime of vertrouwelijke gegevens zijn in eigen systemen goed opgeslagen.
Tweede, een autonome bedrijfs-ki kan worden aangepast aan eigen behoeften. Als je naar het programma voorbeeld boven kijkt, valt je misschien op:
- Met Python kunnen kunstmatige intelligentiesystemen in enkele regels code opgebouwd worden.
- De complexiteit zit niet in het programma, maar in het AI-model dat slechts een keer opgebouwd hoeft te worden.
- Een klein stapje is genoeg om veel te veranderen.
Economische toepassingen met aanzienlijk meer waarde zijn mogelijk. Eigen AI-systemen zijn zelfs vaak kostenefficiënter dan het gebruik van de ChatGPT-interface, afgezien van de genoemde nadelen bij gebruik van een derde systeem.
Conclusie
Kunstmatige intelligentie wordt, waarschijnlijk vanwege de gerechtvaardigde enthousiasme voor de nieuwe mogelijkheden, door velen overschat of onjuist ingeschat. Algemene intelligenties zoals ChatGPT zijn precies hiervoor geschikt: om algemene vragen te beantwoorden, zonder claim op betrouwbaarheid of zelfs maar juistheid. Dit is alleen al aan de gebruikershandleiding van dergelijke systemen herkenbaar, die geen enkel hint bevatten dat de resultaten zorgvuldig gecontroleerd moeten worden of dat er soms een fout antwoord bij kan zitten.
Weinig programmeerregels zijn al voldoende om met behulp van 100 miljard kunstmatige neuronen een foutieve uitvoer te genereren. Een paar extra regels code helpen daarbij om met een eigen systeem juiste antwoorden te krijgen.
Bedrijven die een AI willen gebruiken, moeten eerst één vraag beantwoorden: Waarvoor wordt deze AI precies ingezet? Als deze vraag niet kan worden beantwoord, dan staat er wel iets vast. Dit bedrijf heeft waarschijnlijk geen AI-systeem nodig of weet nog niet waar het voor moet worden gebruikt.
De private gebruik van ChatGPT en soortgelijke systemen is zeker interessant, maar iets volledig anders dan het gebruik van chatbots of AI-systemen in het algemeen in een bedrijf.
Als een bedrijf een probleem heeft dat opgelost kan worden met behulp van kunstmatige intelligentie, dan is het de moeite waard om na te gaan of dit probleem opgelost kan worden met behulp van een eigen AI-systeem.



My name is Klaus Meffert. I have a doctorate in computer science and have been working professionally and practically with information technology for over 30 years. I also work as an expert in IT & data protection. I achieve my results by looking at technology and law. This seems absolutely essential to me when it comes to digital data protection. My company, IT Logic GmbH, also offers consulting and development of optimized and secure AI solutions.
