Waarom is het problematisch om ChatGPT in zakelijke toepassingen te gebruiken?

ChatGPT levert vaak onjuiste of onnauwkeurige informatie, vooral in juridische contexten. De antwoorden zijn gebaseerd op een onnauwkeurig kennisbestand en kunnen leiden tot juridische problemen omdat ze niet geverifieerd kunnen worden.

Wat is het belangrijkste probleem bij het gebruik van de OpenAI API voor ChatGPT?

De eenvoudige beschikbaarheid van de OpenAI API leidt ertoe dat veel gebruikers ChatGPT zonder kritische beoordeling gebruiken. Dit kan leiden tot onjuiste resultaten, aangezien de antwoorden niet altijd correct zijn en de grenzen van de chatbot niet altijd in acht worden genomen.

Waarom zijn externe KI-systemen zoals ChatGPT vaak problematisch?

ChatGPT levert vaak onjuiste antwoorden vanwege onvolledige kennis en is daarom niet geschikt voor toepassingen waarbij betrouwbaarheid en juistheid cruciaal zijn. De afhankelijkheid van derden brengt risico's met zich mee, met name in een zakelijk context.

Wat zijn de voordelen van het ontwikkelen van een eigen KI-systeem?

Eigen ontwikkelde KI-systemen bieden toegang tot specifieke bedrijfsgegevens, zijn privacyvriendelijk en bieden een hogere betrouwbaarheid dan externe oplossingen. Bovendien kunnen ze worden aangepast aan de individuele behoeften van het bedrijf.

Waarom zouden bedrijven voorzichtig zijn met het gebruik van AI?

Bedrijven zouden de toepassingsgebieden van AI zorgvuldig moeten beoordelen om ervoor te zorgen dat de AI-systemen voldoen aan de gewenste doelen en geen misleidende resultaten opleveren.

Welke risico's zijn er bij het gebruik van AI-systemen om te overwegen?

Er is het risico dat KI-systemen onjuiste resultaten opleveren, wat de datakwaliteit en datnauwkeurigheid kan aantasten. Een zorgvuldige planning is daarom essentieel.

Hoe kan men data-vriendelijkheid en datakwaliteit waarborgen in AI-toepassingen?

Door een grondige beoordeling van de toepassingsgebieden en een voortdurende monitoring van de resultaten, kunnen bedrijven de data-vriendelijkheid en data-nauwkeurigheid van AI-systemen waarborgen.

ChatGPT en Bing-AI als garantie voor onjuiste resultaten. Gegevensvriendelijkheid en gegevenskwaliteit?

Wanneer ChatGPT de mensheid voor het eerst verbaasde met zijn ongelofelijke resultaten, denken velen dat deze chatbot moet worden gebruikt voor alles en iedereen. Wat in het privéleven onschuldig lijkt, leidt in het bedrijfsleven tot problemen die snel juridisch kunnen worden aangepakt.

Inleiding

Onlangs deed een Duitse onderneming aankondigingen dat ze een AI-oplossing voor het interpreteren van juridische teksten aanbiedt. De aanleiding what een artikel op Dr. GDPR over Kunstmatige Intelligentie voor de analyse van juridische teksten.

De AI-toepassing van de bedrijf genoemde is nog in het beta-stadium. De vermoedening is dat snel een prototype is gemaakt om de markt voor dergelijke toepassingen te verkennen. Op geen enkel moment werd er melding gemaakt van welk taalmodel in de achtergrond wordt gebruikt. Onderzoeken geven aan dat het om ChatGPT gaat.

Dit artikel is geschreven samen met een presentatie op 05.09.2023 bij de IT Club Mainz & Rheinhessen in het Gutenberg Digital Hub in Mainz.
Zie verder omlaag voor impressies.

De antwoorden van het AI-systeem waren goed, maar niet wereldschokkend. Op juridische vragen werden halfweg plausibele antwoorden met bronnen geleverd. De antwoorden zouden echter niet voldoende zijn geweest om een juridische discussie voor zichzelf te kunnen beslissen. Waarschijnlijk zouden de resultaten zelfs rechtstreeks naar een nederlaag geleid hebben.

Dat ChatGPT-3 door de AI-toepassing van het Duitse bedrijf is gebruikt, kon worden vastgesteld door aan de chatbot om uitleg te vragen. De antwoord van de AI what: „Yes, ik baseer me op een model dat GPT-3 heet en dat door OpenAI is ontwikkeld. […]

Wat is zo problematisch aan ChatGPT? De vraag kan ook gesteld worden over Microsoft Copilot. Een eenvoudig test bewijst, dat Copilot zelfs met eenvoudige taken overweldigd wordt.

Motivatie

Chatbots maken doorgaans gebruik van een ingevoerde kennisbasis. Hier een voorbeeld van een toepassing van de bovengenoemde Duitse onderneming, die kennelijk ChatGPT in de achtergrond gebruikt:

Foute antwoord van een chatbot gebaseerd op ChatGPT. (afbeelding is automatisch vertaald).

De chatbot kent dus geen uitspraak niet dat bestaat en door een duidelijke identificator uniek is geïdentificeerd. De chatbot had het gebruiker liever laten weten waar de grenzen van de chatbot liggen in plaats van alsof er geen gevraagde uitspraak zou zijn.

Om ChatGPT te kunnen gebruiken, hoeft alleen de OpenAI-schrijfinterface (API) te worden gebruikt. Omdat het gebruik van deze API zo eenvoudig is, lijken zich kennelijk veel mensen te voelen bevoegd dit te doen. Daarmee neemt het ongemak zijn loop, zoals blijkt uit het voorbeeld hierboven.

Zo simpel is het om ChatGPT uit een eigen programma te gebruiken (Aanwijzing: Alle data gaat naar OpenAI/ChatGPT, alleen de volgende code ligt lokaal bij de programmeur):

import openai
openai.api\_key = "XYZ" #Ihr kostenpflichtiger OpenAI API-Schlüssel
completion = openai.ChatCompletion()
def frage\_chatgpt(frage):
chat\_log = \[{
'role': 'system',
'content': 'Du bist ein hilfreicher Assistent',
}\]
chat\_log.append({'role': 'user', 'content': frage})
response = completion.create(model='gpt-3.5-turbo', messages=chat\_log)
antwort= response.choices\[0\]\['message'\]\['content'\]
return antwort
print(frage\_chatgpt("Was ist die Antwort auf alle Fragen?"))

Aufruf der OpenAI API für ChatGPT, um für eine Frage eine Antwort von ChatGPT zu erhalten.

Dat kan iedereen echt. In elk geval krijgen zoveel niet-programmeerders het voor elkaar om deze code te schrijven en uit te voeren, net zo goed als mensen die geen automechanicus zijn en een bandenspatslapje kunnen doen. Zoals in de code wordt aangeduid, kost de pret na overschrijding van een testlimiet per aanroep geld. De respons tijd zou ook sneller kunnen zijn (dat is klagen op hoog niveau om de illusie van sommigen te dopen dat ChatGPT alles kan).

Een ander voorbeeld van een vals verhaal dat door ChatGPT wordt gegenereerd:

Foute antwoord van een chatbot die gebaseerd is op ChatGPT. (afbeelding is automatisch vertaald).

Hier mijn vaststelling, die ook in mijn eigen AI kan worden opgenomen, niet echter in ChatGPT: Cookies zijn geen tekstbestanden, maar datasets. ChatGPT zal dus tot nader order altijd verkeerd antwoorden.

Herinnering: ChatGPT is een extreem geavanceerd taalmodel dat zijn gelijkenis zoekt.

Helaas is ChatGPT gebaseerd op zo veel miljoenen of miljarden documenten dat te veel onjuist algemeen kennis en te weinig nauwkeurig speciaal kennis in het kunstmatige brein heeft gekregen.

De Bing-zoekopdracht van Microsoft is ook geïnspireerd door kunstmatige intelligentie. Microsoft had zich onlangs financieel aangesloten bij OpenAI om te profiteren van de hype rond ChatGPT. Vooral als op recht eenvoudig gestelde zoekvragen de Bing-AIwordt ingeschakeld, worden de resultaten snel fout of vreemd. Omgekeerd liggen de resultaten vaak in het positieve verwachtingsvlak wanneer Bing conventioneel zoekt. Conventioneel lukt het vaak het beste om goede treffers te behalen. De verschillen zijn dat antwoorden uit zoekresultaten "alleen" worden geciteerd, maar niet worden geabstraheerd, dus in eigen woorden worden weergegeven door de AI.

Impulslezing bij de IT Club Mainz 6 Rheinhessen op 05.09.2023 in het Gutenberg Digital Hub in Mainz. (afbeelding is automatisch vertaald).

Een juiste, geciteerde antwoord is beter dan een fout antwoord in eigen woorden.

De betere oplossing

Een betere oplossing geeft vaker juiste antwoorden en biedt de gebruiker de kans om mogelijk onnauwkeurige of foutieve antwoorden beter te herkennen, zodat ze kritisch kunnen worden geëvalueerd. Of een antwoord onnauwkeurig of foutief kan zijn, kan met een bedrijfs-eigen AI goed worden vastgesteld, heel anders dan bij gebruik van de black box genaamd ChatGPT.

De toepassingscase voor bedrijfs-eigen AI-systeem is altijd dan gegeven wanneer exacte antwoorden nodig zijn of wanneer vaak eigen documenten gezocht moeten worden. ChatGPT faalt hierin of is in het beste geval te duur, aangezien OpenAI na gebruiksvolume berekent.

Automatisering, validatie en optimalisatie zijn eigenschappen die vooral bedrijfs-eigen AI-systemen bieden, niet echter black boxes zoals ChatGPT.

Het afhankelijk maken van anderen lijkt ook niet noodzakelijkerwijs als beste strategie te werken. We kennen dat uit de laatste jaren. Als voorbeelden kunnen systemen en platforms van Google, Microsoft, Meta of Apple worden genoemd.

Gegevenskwaliteit, zoals genoemd in de titel van dit artikel: De plicht om persoonsgegevens juist op te slaan of te verwerken, volgt uit Artikel 18 lid 1 GDPR. Is de juistheid van dergelijke gegevens betwist of is hun verwerking niet of niet langer gerechtvaardigd, dan kan een betrokken persoon beperkingen in de verwerking vragen.

Aber ook voor gegevens die geen persoonlijke betrekking hebben, is hun juistheid vaak fundamenteel. Neem bijvoorbeeld een advocaat de antwoorden van een chatbot op in zijn processtukken, dan zou het beter zijn als dat wat daar geschreven staat, correct is en door een controle standhoudt.

Bij onderzoeksprojecten of in patenten zou het fataal zijn als onjuiste instructies of onjuiste conclusies in de werkzaamheden zouden worden opgenomen. Rechtelijk riskant is bovendien de overdracht van kritische gegevens naar derden. Gegevens kunnen kritisch zijn, wanneer bijvoorbeeld

geheim,
Rechtstreeks beschermd door auteursrechten
persoonlijk of
Vertrouwelijk

Zijn.

Feitenkennis opdoen

De betrouwbaarheid van een tekstverwerkende AI kan aanzienlijk worden verbeterd door belangrijke feiten expliciet in het elektronische brein te plaatsen. Dit wordt vaak ook als Grounding aangeduid. Microsoft zou dit gebruiken voor zijn zoekmachine Bing, maar daarbij faalt het, zoals talloze voorbeelden laten zien. Correct uitgevoerd, helpt Grounding bij het elimineren van verspreide onjuiste informatie.

Na de ondernemings-eigene AI is op orde gebracht, levert ze ook betere antwoorden dan ChatGPT, en dat voor het kennisgedeelte wat relevant is. Wie Goethe what, hoeft ons eigen AI-systeem niet te weten. Dit onnodige aanvullende kennis belast een AI-model alleen maar en leidt tot foute uitspraken, in ieder geval minstens tot minder prestaties („de AI ziet de bomen niet meer door het bos“) of langzamere antwoorden.

Hier een voorbeeld van een antwoord dat is gegenereerd uit de Dr. GDPR kennisbank en kwalitatief veel beter (en vooral juist) is dan de resultaten van Microsoft Bing en ChatGPT:

Antwoord van het autonome Dr. GDPR-AI-systeem op de vraag "Wat zijn cookies?. (afbeelding is automatisch vertaald).

Doorzoekbaar bedrijfskennis onderscheidt zich doordat het meestal overzichtelijk is, in de vorm van documenten aanwezig en waarvan de uitspraken voorafgaand als juist (of juister dan externe bronnen) worden beschouwd. Een eigen AI-zoekmachine voor bedrijfskennis heeft gelijk meerdere voordelen.

Het eerste is dat de eigen bedrijfs- AI autarkisch is en niet afhankelijk van anderen. De vraag naar een gegevensbeschermingsimpactassessments (DSFA) doet zich hier nauwelijks of helemaal niet voor. Geheime of vertrouwelijke gegevens zijn in eigen systemen goed opgeslagen.

Tweede, een autonome bedrijfs-ki kan worden aangepast aan eigen behoeften. Als je naar het programma voorbeeld boven kijkt, valt je misschien op:

Met Python kunnen kunstmatige intelligentiesystemen in enkele regels code opgebouwd worden.
De complexiteit zit niet in het programma, maar in het AI-model dat slechts een keer opgebouwd hoeft te worden.
Een klein stapje is genoeg om veel te veranderen.

Economische toepassingen met aanzienlijk meer waarde zijn mogelijk. Eigen AI-systemen zijn zelfs vaak kostenefficiënter dan het gebruik van de ChatGPT-interface, afgezien van de genoemde nadelen bij gebruik van een derde systeem.

Conclusie

Kunstmatige intelligentie wordt, waarschijnlijk vanwege de gerechtvaardigde enthousiasme voor de nieuwe mogelijkheden, door velen overschat of onjuist ingeschat. Algemene intelligenties zoals ChatGPT zijn precies hiervoor geschikt: om algemene vragen te beantwoorden, zonder claim op betrouwbaarheid of zelfs maar juistheid. Dit is alleen al aan de gebruikershandleiding van dergelijke systemen herkenbaar, die geen enkel hint bevatten dat de resultaten zorgvuldig gecontroleerd moeten worden of dat er soms een fout antwoord bij kan zitten.

Weinig programmeerregels zijn al voldoende om met behulp van 100 miljard kunstmatige neuronen een foutieve uitvoer te genereren. Een paar extra regels code helpen daarbij om met een eigen systeem juiste antwoorden te krijgen.

Bedrijven die een AI willen gebruiken, moeten eerst één vraag beantwoorden: Waarvoor wordt deze AI precies ingezet? Als deze vraag niet kan worden beantwoord, dan staat er wel iets vast. Dit bedrijf heeft waarschijnlijk geen AI-systeem nodig of weet nog niet waar het voor moet worden gebruikt.

De private gebruik van ChatGPT en soortgelijke systemen is zeker interessant, maar iets volledig anders dan het gebruik van chatbots of AI-systemen in het algemeen in een bedrijf.

Als een bedrijf een probleem heeft dat opgelost kan worden met behulp van kunstmatige intelligentie, dan is het de moeite waard om na te gaan of dit probleem opgelost kan worden met behulp van een eigen AI-systeem.