Wat is kunstmatige intelligentie op dit moment?

Huidige kunstmatige intelligentie is gebaseerd op moderne KI-systemen zoals ChatGPT en Large Language Models (LLM's). Deze systemen gebruiken hoogwaardige massadata en een ingenieuze wiskundig model om mensachtige intelligentie te simuleren.

Wat is het belangrijkste probleem met betrekking tot kunstmatige intelligentie?

Het belangrijkste probleem met betrekking tot kunstmatige intelligentie is het vermogen van AI om mensen te vervangen, waarbij auteursrechtelijke kwesties ook een belangrijke rol spelen. AI-systemen zijn gebaseerd op openbare databronnen en kunnen inhoud in een andere vorm reproduceren.

Welke voorbeelden van toepassingen van AI-systemen worden in het artikel genoemd?

AI-systemen worden ingezet voor taken zoals vraag-antwoord systemen, tekstvertaling, beeldgeneratie, tekstsamenvattingen en muziekcompositie. Deze systemen zijn gebaseerd op het vectoriseren van data en het aanpassen van vooraf getrainde modellen.

Wat is de rol van GPU's (grafische processors) in de context van AI-toepassingen?

GPU's zijn cruciaal voor AI-toepassingen vanwege hun vermogen om complexe berekeningen efficiënter uit te voeren dan CPU's. Ze worden vaak gebruikt voor het trainen en uitvoeren van AI-modellen, met name door technologieën zoals CUDA van Nvidia.

Hoe werkt een lokaal KI-systeem in vergelijking met cloud-gebaseerde?

Een lokaal KI-systeem wordt getraind met eigen data en heeft geen internetverbinding nodig, terwijl cloud-gebaseerde systemen afhankelijk zijn van data van derden. Dit maakt een betere controle en databeveiliging mogelijk bij lokale oplossingen.

Wat is de rol van openbare data bij het gebruik van AI-systemen?

AI-systemen kunnen openbare data gebruiken die vrij beschikbaar zijn, wat hun werking mogelijk maakt. Dit kan echter ook tot privacyproblemen leiden, vooral als gebruikersgegevens worden opgeslagen, zoals in Italië vastgesteld is.

Waarom stellen AI-systemen zoals ChatGPT problemen met betrekking tot auteursrechten?

AI-systemen zoals ChatGPT verwerken en reproduceren inhoud uit openbare bronnen, wat kan leiden tot misbruik van auteursrechten op beschermd materiaal. Dit is vooral problematisch wanneer de inhoud op een manier wordt gereproduceerd die verder gaat dan korte citaten.

Wat zijn de belangrijkste zorgen met betrekking tot privacy in verband met AI-systemen?

Hoewel KI-systemen openbaar toegankelijke data gebruiken, kunnen er toch privacyproblemen ontstaan, vooral als gevoelige informatie in die data zit. De regulering richt zich primair op auteursrechtelijke kwesties en het risico van machtige systemen, minder op directe privacybescherming.

Artificiële intelligentie: feiten en misverstanden. Gegevensbescherming? Auteursrecht?

Iedereen spreekt over kunstmatige intelligentie, maar niemand weet wat er daarmee bedoelt. Tenminste de eerste factor. De Italiaanse gegevensbeschermingsautoriteit heeft het gebruik van ChatGPT verboden, maar zoekmachines als Google mogen nog steeds doorgaan. Wat is kunstmatige intelligentie van nu eigenlijk en wat heeft dat met gegevensbescherming te maken?

Kortom

Samenvatting:

Kunstmatige intelligentie (AI) en gegevensbescherming zijn twee thema's die de afgelopen jaren steeds meer aandacht hebben gekregen. AI-systeem zoals ChatGPT berusten op openbare databronnen en maken gebruik van soortgelijke methodes als zoekmachines. Daardoor is het gegevensbeschermingsprobleem bij AI-toepassingen niet noodzakelijkerwijs groter dan bij zoekmachines. Wel kunnen AI-systeem auteursrechtelijke problemen veroorzaken, wanneer ze vreemde inhoud in andere vorm hergeven.

Gevraagde vragen beantwoord:

Wat is kunstmatige intelligentie van nu?
Antwoord: Künstliche intelligente van het huidige moment verwijst naar moderne AI-systemen zoals ChatGPT of andere Large Language Models (LLMs), die op hoogwaardige massadaten en geniepale wiskundige modellen zijn gebaseerd om mensachtige intelligentie na te bootsen.
Wat heeft kunstmatige intelligentie met gegevensbescherming te maken?
Kunstmatige intelligentie kan vooral dan privacy-problemen opleveren als ze toegang hebben tot niet-openbare persoonsgegevens.
Wat is de verschillende tussen kunstmatige intelligentie en zoekmachines op het gebied van gegevensbescherming?
Antwoord: Kunstmatige intelligentie en zoekmachines verzamelen beide gegevens uit openbare bronnen, maar AI-systeem kunnen inhoud in andere vorm weergeven en mogelijk auteursrechtelijke problemen veroorzaken, terwijl zoekmachines doorgaans alleen korte snippets tonen.
Wat zijn de hoofdproblemen met kunstmatige intelligentie?
Antwoord: De hoofdproblemen met betrekking tot kunstmatige intelligentie zijn auteursrechtelijke problemen, de mogelijkheid van AI om mensen te vervangen en mogelijke privacy-problemen.

Belangrijke sleutelwoorden:

Kunstmatige intelligentie, ChatGPT, LLMs, Grote Taalmodellen, Common Crawl datasets, Wikipedia, Online teksten, Vectors, Kennisbasis, Wiskundig model, Getallenreeksen, Cloud Computing, Python, Pytorch, TensorFlow

Podcast bij het artikel:

Vertaling

Inleiding

Sinds enige jaren wordt de term kunstmatige intelligentie inflationair en onderscheidend gebruikt. Nu, in 2023, is naar mijn mening het absolute doorbraak gekomen. Uit mijn oogpunt als informaticus is het eerste gelukt om het grondbeginsel van menselijke intelligentie te ontwijken. Tweede is het gelukt om aan te tonen dat dit gelukt is.

Het menselijke brein is een automaat, de hardware is biologisch. Ons brein berust op stochastische processen (gecontroleerd toeval). Dit is ook het grondprincipe van de kwantumfysica, die ons hele leven bepaalt. Analoog (automatisch, stochastisch, willekeurig) gedraagt het zich met elektronische AI-systemen.

Dus is de Turing Test naar mijn mening voor het eerst door een computerprogramma geslaagd. Wat Joseph Weizenbaum met zijn virtuele psychiater Eliza toen "alleen" bereikte, doet hij nu, in april 2023, via een geavanceerde simulatie van het menselijk brein. Ik had trouwens de eer om meneer Weizenbaum toen (het what waarschijnlijk rond het jaar 2000) persoonlijk te hebben ontmoet op mijn universiteit, de TU Ilmenau. Ook ben ik trots dat de TU Ilmenau tot de topuniversiteiten in Europa behoorde en in een ranking als volgt werd genoemd: Cambridge, Oxford, Zürich, Eindhoven, Londen, Ilmenau. Wie kent Ilmenau niet?

Wat is kunstmatige intelligentie?

Wat kunstmatige intelligentie is, kan ik niet volledig beantwoorden. Allerecht kan ik wel veel zeggen over de huidige systemen zoals ChatGPT of algemeen over LLMs (Large Language Models).

De huidige systemen, die terecht voor enthousiasme-wedstrijden zorgen, berusten in wezen op twee aanpakken:

De kennisbasis: Kwalitatief hoogwaardige massadaten
Geniaal wiskundig model: het denk- en begrijdencentrum van de hersenen

De kennisbasis van ChatGPT is vooral gebaseerd op de volgende openbare bronnen:

Gemeenschappelijke kruipdata (CC en CC4): Grote selectie van het internet (gedeeltelijk willekeurig). Iedereen kan deze downloaden.
Wikipedia: Openbaar wordt al lange tijd als dump aangeboden. Iedereen kan het downloaden.
Divers vormen van digitale boeken: Iedereen kan ze downloaden.
Online tekst: Openbaar, door crawlen of via dumps op te halen.

Het gaat hier niet om geheimzinnige informatie, maar om het soort dingen dat zoekmachines als Google in wezen ook opgraven. Google crawlt zelfs nog veel meer bronnen, zoals PDF-documenten, sociale media-platformen en nog veel meer websites.

De meeste gegevens die voor AI-toepassingen als ChatGPT gebruikt worden zijn ofwel openbaar of niet persoonsgebonden.
Gegevensbescherming is niet het hoofdprobleem als we over kunstmatige intelligentie praten. Het is de mogelijkheid van kunstmatige intelligentie om mensen te vervangen. Daarvoor komt nog het auteursrecht.

Nu wordt het interessant. Het mathematische model dat de basis vormt van de huidige krachtige AI-systemen, werkt ongeveer zo:

Verander de kennisbasis in getallenreeksen om (vectoren).
Afhankelijk van het te oplossen probleem: Omzet een invoer (vraag, tekst om te vertalen e.d.) ook in getallenreeksen.
Voer een Gelijkensoeken uit tussen de twee eerder genoemde vectoren. De meest gelijkende data-paren zijn het waarschijnlijkste resultaat.

Dit proces kan op alle mogelijke soorten gegevens toegepast worden, namelijk in het bijzonder op:

ChatGPT, LLaMa e.d., met name tekstvervulling, vraag-antwoordassistenten, vertaling, gelijkaardig zoeken, samenvattingen van tekst (extractief en abstraherend: geselecteerde originele zinnen versus sinvolle weergave in nieuwe woorden…)
Photos: Dall-E, Midjourney etc.
Auditief bestanden: Wav2Vec, GANSynth. Wie kent voorbeelden?
Filmpjes: hier
Elke andere signaal, ofwel continu (analoog) ofwel discontinu (digitaal), het enige dat telkens nodig is, is een omzetting in discrete waarden en vectoren

De kunst bestond (!) in de vectorisering van invoerdata. Dit probleem is nu op uitstekende wijze opgelost. Wij allen, vooral informatici en andere technisch geïnteresseerde personen, kunnen deze mogelijkheden nu toepassen. Alle niet-technische mensen moeten vooraf gemaakte systemen gebruiken. Wie dieper ingrijpende kennis heeft van softwaretechniek en moderne technologieën kan zich zulke systemen zelf bouwen, uitbreiden en grondig veranderen.

Ik heb het gisteren uitgeprobeerd en een systeem geprogrammeerd, dat antwoorden op vragen geeft. Daarvoor wordt een openbaar toegankelijke kennisdatabase gebruikt, ook Gegevensset genoemd. Als programmeertaal van keuze is zich Python ontwikkeld. Als AI-frameworks zijn in het bijzonder Pytorch en TensorFlow te noemen. Omdat deze frameworks ressourcenhungrig zijn, schaadt het niet om kennis te hebben met Cloud Computing. Hoe goed dat er data-schonende Cloud-oplossingen ook uit Duitsland komen.

Een bijzonderheid van ChatGPT is de Algemene aanpak. Het systeem kan niet alleen een taak uitstekend vervullen, maar tegelijkertijd meerdere. Dit wordt ook wel Artificiële Geest Intelligentie genoemd. AGI staat voor Artificial General Intelligence, terwijl AI tot nu toe al voor Artificial Intelligence stond en in het Nederlands met AI aangeduid wordt.

Veel AI-systeem kunnen alvast uitdagende taken op een prima manier afhandelen, voordat ChatGPT erbij kwam. Maar hun capaciteit what beperkt tot elkmaal één relatief sterk ingesloten probleemgebied. ChatGPT daarentegen is zeer veelzijdig inzetbaar. Bijvoorbeeld kon men met DEEPL (Duitse firma uit Keulen!) al tekst fantastisch vertalen. Met ChatGPT gaat het niet alleen om dat, maar nog veel meer, waarvan DEEPL helemaal geen idee heeft.

Om Tijdintensieve kunstmatige intelligentie-algoritmen sneller te kunnen berekenen, worden vaak graphics cards gebruikt voor de berekening. In tegenstelling tot normale processors (CPUs) hebben grafische kaarten GPUs (grafische processorunits). Zonder meer kunnen GPUs de rekenoperaties van AI-toepassingen aanzienlijk efficiënter uitvoeren dan CPUs.

De meest populaire interface en platform voor een GPU is naar mijn weten CUDA van NVidia, een bekende fabrikant van grafische kaarten. CUDA staat voor Compute Unified Device Architecture. Er zijn ook IPUs van de leverancier Graphcore. IPU staat voor Intelligence Processing Unit, terwijl CPU voor Central Processing Unit en GPU voor Graphics Processing Unit staat. Van Google is er dan uitnahamselijk iets positiefs te melden, namelijk TPUs (Tensor Processing Units). TPUs vinden waarschijnlijk voornamelijk in de Google Cloud toepassing, waarom ze voor de data-schutzaffine ontwikkelaar vaak weinig interessant zijn.

De prestaties van dergelijke AI-geïntegreerde grafische kaarten worden onder meer bepaald door het aantal CUDA-kernen dat ze hebben. Grafische kaarten uit de consumentensector hebben bijvoorbeeld 5888 zulke kernen (Nvidia GeForce RTX 3070) en zijn zelfs voor particulieren betaalbaar.

Als je denkt dat je bij kan houden, hier een paar Verdere begrippen, die je kennen moet: Model, Reader, Retriever, Index, Encoder/Decoder, Transformer, Pipeline, Policy, Dataframe. Dat is maar een klein deel van de belangrijke begrippen die nodig zijn om moderne AI-systemen beter te begrijpen. Wie GPT-systeem beter wil begrijpen moet bijvoorbeeld al iets hebben gehoord over (herhalende) neurale netwerken, Markov-modellen en concepten als LSTM en NLP.

De toepassingsgebieden van gelijkeniszoekingen over discrete vectoren zijn enorm. Zij allen berusten op hetzelfde (niet hetzelfde) grondbeginsel:

Vraag-antwoord-systemen. Voorbeeld uit mijn lokale installatie, die slechts een vrij geringe kennisbasis gebruikt: „Waarom what de voormalige Amerikaanse president John F. Kennedy bekend? Omdat hij het Apollo-programma (een week na Kennedys dood gaf president Johnson een presidentsverordening waarbij de ruimtefaciliteiten van Cape Canaveral en Apollo naar Kennedy waren vernoemd)
Vertaling van tekst uit een bron-taal naar een doel-taal.
Wat is het beste beeld dat bij een gegeven prompt past?
Een afbeelding genereren vanuit een tekstprompt.
Samenvatting van een tekst maken.
Een muziekstuk componeren dat dezelfde kenmerken heeft als andere werken van een componist.

De zoektocht naar gelijkenissen zorgt ervoor dat van computersystemen met "eenvoudige middelen" de innere structuur van het Duitse taal kan worden geleerd. Wow! Leg iemand uit wat "innere structuur" betekent, laat staan hoe je deze kunt leren zonder jarenlang de taal in het echte leven te gebruiken.

Een bijzonder charmanter Zug moderne AI-Systemen, die op LLMs baseren: Vortraineerde modellen kunnen door Fine-Tuning voor specifieke problemen getraind worden. Daarom komt ook het acroniem GPT (Generative Pre-trained Transformer). Het systeem werd dus een keer aangeleerd en kan dan heel snel zijn vaardigheden op specifieke taken uitbreiden. Precies zo gedraagt het zich met een mens die heeft geleerd om te leren.

Om dit te doen moet je weten dat het trainen van een taalmodel zeer rekenintensief is. Op een normaal pc duurt dit enkele weken, als de juiste datasets beschikbaar zijn. Alleen maar enkele weken, moet men zeggen. Gans vroeger had je daarvoor een supercomputer voor nodig.

Men kan dus weggaan en een taalmodel als basis nemen, dat door iemand anders moeizaam is getraind. Dit taalmodel wordt dan zijn eigen domeinspecifieke gegevens ingespoten. Uiteindelijk komt er een AI-systeem uit, dat de capaciteiten van het krachtige taalmodel plus kennis over het eigen probleemgebied heeft. Het fine-tunen van het krachtige model is hierbij in een wip gebeurd. Belangrijk hierbij is een goede basisgegevensset, die machineleesbaar moet zijn. Met de juiste technische hulpmiddelen kan zo'n werkbank worden opgericht om alle mogelijke kennisproblemen efficiënt op te lossen. En dat met een lokaal geïnstalleerd AI-systeem, dat geen internetverbinding nodig heeft en waarvoor geen kosten bij derden ontstaan.

Veel mensen zeggen dat ChatGPT en andere vergelijkbaar prestatieve systemen "alleen maar" Willekeurig werken: Precies zo werkt ook ons brein. Ons brein is ook alleen maar een Automaat, niets meer. Maar blijkbaar een zeer prestatief automat. De graad van toeval in ons brein kunnen we als breindeelrers niet zelf regelen (hoogstens door het innemen van alcohol of andere middelen). In AI-systemen kan toeval worden geregeld door de opgave van de zogenoemde Temperatuur. Een hogere temperatuur produceert creatievere antwoorden. Een temperatuur bij het vriespunt zorgt in plaats daarvan voor een deterministisch automat, dat altijd dezelfde antwoorden geeft op dezelfde vragen.

Uit het lexicon van de neurowetenschappen: Stochastische processen vinden vaak toepassing bij de beschrijving van individuele neuronen (stochastische schommelingen van het membranapotential, stochastische gevolgen van actiepotentiaal) of van neuronensystemen (populatiegelijkheden voor neurale netwerken met stochastische activiteit) Een menselijk brein bestaat onder andere uit precies deze componenten en berust op deze principes.
Bron: Spektrum der Wissenschaft, vetgedrukt door mij, eveneens de laatste zin.

Een opmerking, omdat een lezer zich over dit artikel bij mij meldde: Hij beloofde me te laten weten waarom mijn begrip van intelligentie kritisch is. Ik ben nieuwsgierig naar zijn reactie en zal hem in deze blogpost integreren zodra hij beschikbaar is.

Wat heeft kunstmatige intelligentie met gegevensbescherming te maken?

Lokale AI-systemen, zoals het net beschreven systeem, bewaren hun gegevens in ieder geval niet bij derden. Zij konden dit echter doen zonder dat (speciale) privacyproblemen ontstaan. Dit geldt namelijk als de gegevens uit openbare bronnen stammen die vrij beschikbaar zijn.

Wie iemand op Facebook openlijk informatie over zijn persoon geeft, heeft hij het recht op privacy betreffende deze informatie verspeeld.
Als je de bescherming van je eigen gegevens belangrijk vindt, meld je niet openbaar over je eigen gezondheidstoestand, ziektes en vakantieplannen.

Als er waren de bekende zoekmachines niet, zou het antwoord op het probleem van gegevensbescherming bij AI-toepassingen eenvoudiger zijn. Maar zoekmachines doen in eerste instantie niets anders dan AI-systemen: ze verzamelen veel data. Wat ChatGPT betreft is de aanpak zelfs gelijk, wat het beschikbaar zijn van de bronnen betreft. ChatGPT verzamelt namelijk eveneens als Google of Bing data uit openbare bronnen.

Hier waar de verschillen zouden moeten zijn, begrijp ik het niet.

Zoekmachines geven goede, maar niet bijzonder intelligente antwoorden op vragen. Een vraag is een zoekwoord of ook al eens een eenvoudig gestelde kennisvraag. AI-systeem geven eveneens goede (of soms betere) antwoorden op spraakmatig of inhoudelijk complexe vragen.

Kwalitatief gaat het om zoekmachines en bepaalde vormen van AI-systeem als vraag-antwoord-systemen. ChatGPT is een dergelijke antwoordautomat, precies zoals de zoekmachines van Google of Bing. De manier van gegevensverwerking is al bij klassieke zoekmachines als behoorlijk invasief te beschrijven. AI-systeem gaan hier niet echt verder, als men de wiskundige modellen ziet die wel heel rekenintensief zijn, maar dat niet noodzakelijk opwindender maken.

Dit punt is dus ook kwalitatief gelijk, hoewel ChatGPT de Turing-test wel doorstaat, maar naive zoekmachines dat niet doen. In het eerder verlinkte artikel van mij wordt de Turing-test kort uitgelegd en met een echt voorbeeld geïllustreerd.

Ray Kurzweil had gelijk toen hij al in het jaar 2005 een boek met de volgende titel schreef: "De singulariteit is nabij".
Ik had het boek toen gelezen, maar geen idee hoezeer hij gelijk had.

De antwoorden die zoekmachines geven, zijn in wezen een herhaling van eerder gelezen inhoud. AI-toepassingen geven inhoud vaak ook weer in andere vormen, zoals ChatGPT. Dit is een verschil. Maar dit heeft met privacybeleid eigenlijk maar beperkt te maken. Men kan erover twisten of misleidende uitspraken of hallucinaties van kunstmatige intelligentie een privacyprobleem zijn. Ik zie dat eerst niet.

In het kader van de verbodenisering van ChatGPT in Italië door de Italiaanse gegevensbeschermingsautoriteit werd ook Jongerenbescherming als reden genoemd. Zo ver ik weet zijn inhoud op YouTube, Facebook, Twitter en in zoekmachines van Google en Bing voor iedereen toegankelijk die een paar knoppen indrukt. Waar hier de jongerenbescherming zou moeten zijn, zie ik dat niet.

Als een kunstmatige intelligentie openbare bronnen aansluit, zie ik dus eerst geen privacyprobleem. In elk geval is het probleem niet anders dan voor zoekmachines, sociale netwerken of andere portals die derde inhoud hergeven. Italië heeft waarschijnlijk (op basis van een data-lek) vastgesteld dat ook gebruikersinvoer van ChatGPT wordt opgeslagen. Zo ver als ik weet doen grote zoekmachines dit ook. Dat maakt het niet beter, maar stelt vragen waarom er niet eerder tegen zoekmachines is opgetreden.

Waar ligt het probleem met kunstmatige intelligentie?

AI-systeem kunnen mogelijk voor Auteursrechtproblemen zorgen. Want de weergave van inhoud in een vorm die verder gaat dan korte citaten is juridisch problematisch. Dit geldt zowel voor tekst als voor andere mediavormen, zoals beelden. Hier een voorbeeld van een door de computer gegenereerd beeld dat hopelijk geen auteursrechten schendt (niemand weet het precies):

Bild gegenover het prompt "kunstmatige intelligentie, computer, internet…" gemaakt door AI."

Zoekmachines geven meestal alleen snipper (snippets) van zoekresultaten weer. Dat wordt als toegestaan beschouwd. Hier een voorbeeld van zo'n snippet:

Een zoekresultaat (snippet) uit de zoekmachine DuckDuckGo (wie gebruikt nog wel Google en geeft dit concern nog meer zijn gegevens?).

Soms worden antwoorden op gestelde vragen rechtstreeks in de zoekmachine getoond. Hier begint het probleem: Als ik me al de tijd en moeite neem om gratis bijdrages te publiceren, dan wil ik dat lezers mijn website bezoeken. Zo heb ik tenminste de kans dat daaruit een goed contact van welke aard ook ontstaat.

Als een zoekmachine mijn inhoud rechtstreeks weergeeft, bezoeken mensen uiteindelijk niemand meer mijn website. Waarom zou ik dan mijn inhoud überhaupt openbaar of gratis beschikbaar stellen?

Analog en nog extremer gedraagt het zich met AI-algoritmen en -systemen. Zulke systemen begrijpen vreemde inhoud, en geven ze in andere (synonyeme of met andere informatie gecombineerde) vorm weer. Daarentegen heb ik iets, althans als het mijn inhoud zijn en de AI-betreibers mij hiervoor niets aanbieden (link, geld etc.). Daarom vindt u een artikel op Dr. GDPR, waarin beschreven wordt hoe ChatGPT ervoor gehinderd wordt, uw eigen inhoud af te zuigen.

Conclusie

AI-systeem als ChatGPT maken gebruik van openbare bronnen (dat is tenminste de informatie die OpenAI openbaar maakt). Ze doen dus niets anders dan zoekmachines. Zo ver te ik weet, is de Google-zoekmachine nog nergens in Europa verboden geworden, noch in Italië noch in Duitsland. De Duitse toezichthouder op gegevensbescherming heeft OpenAI ook gevraagd waarom ChatGPT werkt.

Er is echter wel een auteursrechtelijk probleem als inhoud van andere mensen door AI-systemen wordt gebruikt zonder toestemming. Hierover heb ik nog niet veel gelezen.

Ik begrijp de opwinding over bekende AI en gegevensbescherming niet helemaal:

De gegevens komen uit openbare bronnen, die ook zoekmachines afgrazen.
Er zijn eenvoudige maatregelen om privacyproblemen op te lossen, als die er al zijn.

Deze Maatregelen zal ik binnenkort beschrijven aan Dr. GDPR. Mijn benadering is gebaseerd op een technisch begrip van de werking van AI-systeem, gecombineerd met mijn kennis over gegevensbescherming. Aan een klant kon ik al helpen om juridische problemen met zijn AI-systeem te vermijden. Had het gegevensbestand van de AI beperkt moeten worden, dan zou het AI-systeem niet meer functioneren.

Ik vind het moeilijk om de aanpak van sommige overheidsinstanties (vooral Italië) te volgen. AI-systeem moeten gegeregeld worden, zodat de mensheid nog even kan bestaan. Deze regelgeving heeft voornamelijk niets met gegevensbescherming te maken, maar met auteursrecht en de gevaar van overheersende systemen. Op basis van de huidige ontwikkelingen verwacht ik dat de beurshandel binnenkort niet meer in zijn huidige vorm kan bestaan en zal verdwijnen. Want dankzij intelligente systemen zullen binnenkort (bijna) iedereen in staat zijn om de koersontwikkeling van aandelen met een betrouwbare precisie te voorspellen, waardoor men zonder risico speculatief met aandelen kan handelen.

Eerst in tweede instantie en vooral bij systemen die niet-openbare inhoud gebruiken, kan een privacy-probleem ontstaan. Bij door licenties beschermd materiaal is echter weer het auteursrecht de juiste toetssteen.

U kunt het zelf maar eens proberen, bij OpenAI na te vragen, of gegevens van uw website in hun index aanwezig zijn en de verwijdering uit index en alle AI-modellen eisen (de verlinkte mailadres stamt uit de gegevensbeschermingsverklaring van OpenAI).