Iedereen spreekt over kunstmatige intelligentie, maar niemand weet wat er daarmee bedoelt. Tenminste de eerste factor. De Italiaanse gegevensbeschermingsautoriteit heeft het gebruik van ChatGPT verboden, maar zoekmachines als Google mogen nog steeds doorgaan. Wat is kunstmatige intelligentie van nu eigenlijk en wat heeft dat met gegevensbescherming te maken?
Kortom
Samenvatting:
Kunstmatige intelligentie (AI) en gegevensbescherming zijn twee thema's die de afgelopen jaren steeds meer aandacht hebben gekregen. AI-systeem zoals ChatGPT berusten op openbare databronnen en maken gebruik van soortgelijke methodes als zoekmachines. Daardoor is het gegevensbeschermingsprobleem bij AI-toepassingen niet noodzakelijkerwijs groter dan bij zoekmachines. Wel kunnen AI-systeem auteursrechtelijke problemen veroorzaken, wanneer ze vreemde inhoud in andere vorm hergeven.
Gevraagde vragen beantwoord:
Wat is kunstmatige intelligentie van nu?
Antwoord: Künstliche intelligente van het huidige moment verwijst naar moderne AI-systemen zoals ChatGPT of andere Large Language Models (LLMs), die op hoogwaardige massadaten en geniepale wiskundige modellen zijn gebaseerd om mensachtige intelligentie na te bootsen.
Wat heeft kunstmatige intelligentie met gegevensbescherming te maken?
Kunstmatige intelligentie kan vooral dan privacy-problemen opleveren als ze toegang hebben tot niet-openbare persoonsgegevens.
Wat is de verschillende tussen kunstmatige intelligentie en zoekmachines op het gebied van gegevensbescherming?
Antwoord: Kunstmatige intelligentie en zoekmachines verzamelen beide gegevens uit openbare bronnen, maar AI-systeem kunnen inhoud in andere vorm weergeven en mogelijk auteursrechtelijke problemen veroorzaken, terwijl zoekmachines doorgaans alleen korte snippets tonen.
Wat zijn de hoofdproblemen met kunstmatige intelligentie?
Antwoord: De hoofdproblemen met betrekking tot kunstmatige intelligentie zijn auteursrechtelijke problemen, de mogelijkheid van AI om mensen te vervangen en mogelijke privacy-problemen.
Belangrijke sleutelwoorden:
Kunstmatige intelligentie, ChatGPT, LLMs, Grote Taalmodellen, Common Crawl datasets, Wikipedia, Online teksten, Vectors, Kennisbasis, Wiskundig model, Getallenreeksen, Cloud Computing, Python, Pytorch, TensorFlow
Podcast bij het artikel:
Inleiding
Sinds enige jaren wordt de term kunstmatige intelligentie inflationair en onderscheidend gebruikt. Nu, in 2023, is naar mijn mening het absolute doorbraak gekomen. Uit mijn oogpunt als informaticus is het eerste gelukt om het grondbeginsel van menselijke intelligentie te ontwijken. Tweede is het gelukt om aan te tonen dat dit gelukt is.
Het menselijke brein is een automaat, de hardware is biologisch. Ons brein berust op stochastische processen (gecontroleerd toeval). Dit is ook het grondprincipe van de kwantumfysica, die ons hele leven bepaalt. Analoog (automatisch, stochastisch, willekeurig) gedraagt het zich met elektronische AI-systemen.
Dus is de Turing Test naar mijn mening voor het eerst door een computerprogramma geslaagd. Wat Joseph Weizenbaum met zijn virtuele psychiater Eliza toen "alleen" bereikte, doet hij nu, in april 2023, via een geavanceerde simulatie van het menselijk brein. Ik had trouwens de eer om meneer Weizenbaum toen (het what waarschijnlijk rond het jaar 2000) persoonlijk te hebben ontmoet op mijn universiteit, de TU Ilmenau. Ook ben ik trots dat de TU Ilmenau tot de topuniversiteiten in Europa behoorde en in een ranking als volgt werd genoemd: Cambridge, Oxford, Zürich, Eindhoven, Londen, Ilmenau. Wie kent Ilmenau niet?
Wat is kunstmatige intelligentie?
Wat kunstmatige intelligentie is, kan ik niet volledig beantwoorden. Allerecht kan ik wel veel zeggen over de huidige systemen zoals ChatGPT of algemeen over LLMs (Large Language Models).
De huidige systemen, die terecht voor enthousiasme-wedstrijden zorgen, berusten in wezen op twee aanpakken:
- De kennisbasis: Kwalitatief hoogwaardige massadaten
- Geniaal wiskundig model: het denk- en begrijdencentrum van de hersenen
De kennisbasis van ChatGPT is vooral gebaseerd op de volgende openbare bronnen:
- Gemeenschappelijke kruipdata (CC en CC4): Grote selectie van het internet (gedeeltelijk willekeurig). Iedereen kan deze downloaden.
- Wikipedia: Openbaar wordt al lange tijd als dump aangeboden. Iedereen kan het downloaden.
- Divers vormen van digitale boeken: Iedereen kan ze downloaden.
- Online tekst: Openbaar, door crawlen of via dumps op te halen.
Het gaat hier niet om geheimzinnige informatie, maar om het soort dingen dat zoekmachines als Google in wezen ook opgraven. Google crawlt zelfs nog veel meer bronnen, zoals PDF-documenten, sociale media-platformen en nog veel meer websites.
De meeste gegevens die voor AI-toepassingen als ChatGPT gebruikt worden zijn ofwel openbaar of niet persoonsgebonden.
Gegevensbescherming is niet het hoofdprobleem als we over kunstmatige intelligentie praten. Het is de mogelijkheid van kunstmatige intelligentie om mensen te vervangen. Daarvoor komt nog het auteursrecht.
Nu wordt het interessant. Het mathematische model dat de basis vormt van de huidige krachtige AI-systemen, werkt ongeveer zo:
- Verander de kennisbasis in getallenreeksen om (vectoren).
- Afhankelijk van het te oplossen probleem: Omzet een invoer (vraag, tekst om te vertalen e.d.) ook in getallenreeksen.
- Voer een Gelijkensoeken uit tussen de twee eerder genoemde vectoren. De meest gelijkende data-paren zijn het waarschijnlijkste resultaat.
Viele Artikel in PDF-Form · Kompakte Kernaussagen für Beiträge · Offline-KI · Freikontingent+ für Website-Checks



My name is Klaus Meffert. I have a doctorate in computer science and have been working professionally and practically with information technology for over 30 years. I also work as an expert in IT & data protection. I achieve my results by looking at technology and law. This seems absolutely essential to me when it comes to digital data protection. My company, IT Logic GmbH, also offers consulting and development of optimized and secure AI solutions.
