Hoe werkt kunstmatige intelligentie (AI) in essentie?

AI-systemen zoals ChatGPT zijn gebaseerd op kunstmatige neurale netwerken, die menselijke hersenen nabootsen. Deze netwerken verwerken informatie in getallenreeksen (vectoren) en gebruiken rekenoperaties om taken uit te voeren.

Wat is de rol van grafische kaarten (GPUs) bij AI?

GPU's zijn cruciaal voor AI-toepassingen, omdat ze dankzij hun architectuur bijzonder geschikt zijn voor de parallelle uitvoering van rekenoperaties die in AI-algoritmen worden gebruikt. Ze maken een aanzienlijk snellere verwerking mogelijk in vergelijking met traditionele CPU's.

Hoe werken beeldgeneratoren zoals DALL-E of Midjourney?

Deze generatoren werken met vectoren die afbeeldingen, tekst of video's weergeven. Ze vergelijken deze vectoren om nieuwe afbeeldingen of video's te creëren, op basis van de ingevoerde informatie.

Welke uitdagingen zijn er bij het berekenen van AI-modellen?

De berekening van modellen zoals BloombergGPT vereist enorme rekenkracht, bijvoorbeeld door 512 krachtige grafische kaarten met elk 40 GB grafische geheugen. Dit leidt tot hoge kosten en vormt een aanzienlijke technische uitdaging.

Wat is de LAION 5B dataset?

De LAION 5B dataset is een wereldwijd populair dataset, samengesteld door LAION, dat meer dan 5 miljard afbeeldingen bevat. Deze afbeeldingen zijn gedownload van openbaar toegankelijke bronnen en worden gebruikt voor AI-beeldtoepassingen.

Welke juridische aspecten zijn relevant in verband met AI-gegenereerde beelden?

AI-gegenereerde beelden vallen onder zowel het auteursrecht als de privacy, omdat ze een geautomatiseerde verwerking van persoonsgegevens (zoals afbeeldingen) omvatten. Het is cruciaal om de juridische kaders in acht te nemen om auteursrechtinbreuken en privacyproblemen te voorkomen.

Hoe reageert LAION op een verwijderverzoek van fotografen?

LAION reageert vaak op verwijderingsverzoeken van fotografen met een factuur en een vordering tot schadevergoeding, omdat de tijdelijke opslag en analyse van afbeeldingen als toelaatbaar wordt beschouwd en er geen directe schending van het auteursrecht is.

Waarom is het gebruik van openbare data aan te raden bij AI-toepassingen?

Het gebruik van openbaar beschikbare gegevens minimaliseert juridische risico's, omdat ze vrij beschikbaar zijn en geen persoonsgegevens bevatten. Het is belangrijk om gebruikersgegevens te vermijden, aangezien deze gevoelige informatie kunnen bevatten.

Artificiële intelligentie: technische en juridische grondslagen

Hoe werkt kunstmatige intelligentie (AI) en waarom is AI nu revolutionair en wereldwijd belangrijk? Wat zijn de juridische voorwaarden voor het verwerken van grote hoeveelheden gegevens om een elektronisch brein te trainen? En hoe ziet het eruit met het opslaan van gebruikersinput en de aflevering van beelden en tekst? Uit een passage uit een van mijn presentaties.

Inleiding

Wieveel mensen die weinig van kunstmatige intelligentie begrijpen, gebruiken vaak termen als ChatGPT om indruk te maken. Velen denken dat ChatGPT een zoekmachine is. Spoiler: Dat is volledig onzin. ChatGPT heeft een naar huidige maatstaven ouden gegevensbestand. Dat is opzettelijk en gewild. Want ChatGPT dient als antwoordmachine en niet om actueel weten te vinden.

Wie je meer van kunstmatige intelligentie (AI) begrijpt en de Aandelenmarkt in het oog hield, heeft men zich voor een tijdje geleden Nvidia-aandelen gekocht en sindsdien een gigantische koersstijging kunnen vaststellen. Want Nvidia is de fabrikant van grafische kaarten die als absolute topatleten gelden wanneer het gaat om AI-toepassingen.

Ik voorspel de ondergang van de aandelenmarkt in zijn huidige vorm, omdat iedereen binnen afzienbare tijd met een zekerheid van meer dan 50% een voorspelling over aandelenkoersen kan doen.
Mijn theorie met de veronderstelling dat dit mijzelf binnenkort zal lukken.

Wat is hier aan de hand? Eenvoudig gezegd: Een Grafikkart zoals de Nvidia Geforce RTX 3070 heeft 5888 kernen in haar GPU. De GPU is de processor van de grafikkart. In tegenstelling daarmee staat de CPU, de klassieke processor van een computer. Goede hedendaagse Intel-processors hebben 10 of een paar meer kernen.

Een Intel-kern is wiskundig gezien iets als een Albert Einstein (die als fysicus heel goed rekende). Een Nvidia GPU-kern is een matige wiskundige. AI-algoritmen berusten toevallig op berekenoperaties die vooral goed uitvoerbaar zijn op grafische kaart-processeurs (GPUs). Terwijl de Albert Einstein-kern een vermenigvuldiging spelenderwijs makkelijk uitvoert en zich de helft van de tijd langzaam vervelen, is de GPU-wiskundige hard bezig, maar wordt bijna even snel met deze eenvoudige berekenoperatie klaar.

5888 parallel werkende gemiddelde wiskundigen zouden voor een miljoen eenvoudige vermenigvuldigingen veel minder tijd nodig hebben dan 10 woedende Einsteins. Terwijl de computer met een grafische kaart al lang klaar is met de berekening, zou men denken dat de computer die alleen op Intel draait vastgelopen what. Men mag bij de grafische kaart rekenen op een prestatieverhoging van het factor 50 of meer. De grafische kaart wordt niet gebruikt om beeldjes of video's of spellen te tonen, maar alleen om te berekenen. Dat hoor je dan ook aan de luide ventilator van de kaart, die elke computer-ventilator in de schaduw stelt.

Terwijl de CPU in Villariba nog gloeit en slechts 20 procent van de goederen is uitgeladen, blinkt het al in Villabaj.
Alstublieft vergeven u mij de saloppe vergelijking met deze twee fiktieve dorpen, die uit reclame bekend zijn en waarover dus meer bekend is dan over actuele AI-algoritmen.

De videokaart maakt al een hele grote verschil bij algoritmen die voor complexere taken al gauw 10 dagen achter elkaar getraind moeten worden, of die voor het maken van een beeld 10 seconden op een GPU nodig hebben, maar op een – giechel- CPU 8 minuten. U hebt vast wel eens gehoord van DALL-E of Midjourney en weet dat u niet 10 minuten hoeft te wachten op een beeld.

Werking van een actuele AI

Systeem van kunstmatige intelligentie zoals ChatGPT zijn gebaseerd op kunstmatige neurale netwerken. Een neuronaal netwerk is ook in het menselijk hoofd ofwel brein te vinden. Het werkt ongeveer zo:

Basisfunctie van de menselijke intelligentie. (afbeelding is automatisch vertaald).

Getoond wordt de manier waarop mensen informatie verwerken en hoe intelligentie ontstaat. Ongeveer zoveel als in het beeld te zien is, begrijpen we waarom er überhaupt intelligentie bestaat. Ik beweer dat we niets over weten, maar ons alleen verbazen over hoe neuronen met hun verbindingen in staat zijn om iets wat lijkt op intelligentie tot stand te brengen. Spoiler: Het heeft niets te maken met God, zoals ik straks zal laten zien.

In het bovenstaande beeld zijn links een reeks van omgevingsinvloeden, dus signalen. Dat kunnen geluiden, tonen, standbeelden, bewegende beelden, geuren, luchtbewegingen e.d. zijn. Vleermuizen kennen namelijk ook ultrageluiden zeer goed. In het midden komt ons brein, dat al deze signalen opneemt en verwerkt. Rechts is te zien het neurale netwerk, waarin de signalen worden verwerkt en opgeslagen.

Een Neuron is vergelijkbaar met een eenvoudige processorunit. Tussen de neuronen bestaan verbindingen, en dat zijn er heel veel. Het zijn miljarden. Ofwel een neuron schiet af, ofwel het is actief, wordt bepaald door het actiepotential, dat wordt gegenereerd vanuit andere verbonden neuronen naar een doelneuron.

Nu komen we aan bij de technische realisatie van hedendaagse AI-algoritmes.

Structuur van een moderne AI-algoritme. (afbeelding is automatisch vertaald).

In het beeld zien u hetzelfde als boven bij de mens.

In het midden ziet u het elektronisch brein, bovenaan what het dat van de mens.

Rechts op het beeld ziet u het neurale netwerk in digitale vorm, dat bij mensen biologisch en dus meer analoog aanwezig is.

Zo ver is zo gelijk. Maar het kan nog gelijker worden. De elektronische hersenen omvormen dankzij de transformer-methode (bekend sinds 2017) alle signalen in rijtjes van getallen, vectoren genoemd. Precies hetzelfde doet dat menselijke brein. In ieder geval is het kwalitatief hetzelfde. Dat er in de algemene implementatie van biologie en elektronica kleine verschillen zijn, is nagenoeg onbelangrijk en zorgt alleen voor een mogelijke prestatieverbetering van de biologie ten opzichte van de elektronica. Zeker kennen jullie het Mooresche wet: Elke 12 tot 24 maanden verdubbelt zich de rekenkracht van een processor, vaak tegelijkertijd met dalende prijzen. Dus is de prestatieswinnaar de machine, en dat sinds nu (ca. jaar 2023).

Daarom is AI revolutionair

Deze vectoren, dus getallenreeksen, die afbeeldingen, teksten of video's of andere dingen voorstellen, kunnen nu met elkaar vergeleken worden. Nu kunnen dus teksten met teksten, afbeeldingen met afbeeldingen, video's met video's, teksten met afbeeldingen, afbeeldingen met video's, teksten en geluidssignalen met afbeeldingen of video's etc. vergeleken worden. Nu weet u hoe ongeveer beeldgeneratoren zoals Dall-E of Midjourney werken. Nu weet u dat ze snelstens en eenvoudigst al eerder exclusieve toepassingen als SoundHound, die muziekstukken na een paar seconden kunnen identificeren, kunnen worden voorprogrammeerd.

Dat het zo snel en eenvoudig mogelijk gaat om prachtige programma's te schrijven, heb ik zelf bewezen:

Audiotranscriptie van mijn podcast: Geluid naar tekst, in ongekende goede kwaliteit. Voor 30 minuten gesproken taal komt automatisch een door AI gegenereerd transcript uit, waarbij ik misschien nog vijf woorden handmatig moet corrigeren. Zinsdelen en onbekende woorden zoals "alles tutti", "Hömmele" (yes, dat is de naam ervan!) of "Megafail van Microsoft, die een Twitter-AI-tool hadden" worden moeiteloos herkend.
Video-uitvoering op basis van een beeld- en audio-ingang: Mijn twee-dimensionale foto in zeer slechte kwaliteit plus de stem van een Amerikaanse president als enige ingang resulteert in mijn driedimensionale animatiekop en mond die zich synchroon met de stem bewegt als Videoanimatie.
image generator: Bekend uit andere applicaties. Maar het maakt een verschil, weet de technicus of men iets laat berekenen in een cloud van Microsoft, Dall-E of ergens anders op lokaal systeem. De verschillen zijn namelijk: Lokaal betaal ik niets. In de cloud kan ik bij verkeerde programmierung in een maand per ongeluk 100.000 euro vernietigen (voorbeeld: ongewollende oneindige recursieve aanroep). Lokaal heb ik de volledige controle over alle gegevens. Bij Microsoft en Google helpt ook bidden niets, maar hoogstens een verdovingsmiddel of puur alcohol om al die zorgen met de datakrabben voor even te vergeten of het hoofd helemaal van verstand te bevrijden.
Objectherkenning: Welke objecten zijn op een foto te herkennen? Wat zijn de contouren van elk afzonderlijk object? Hoe heet het object? Hoe zou je dat zeggen als "Markeer alle theepotten op de foto" of "Zoek voor mij alle foto's waarop twee of meer mensen in een kantoor discussiëren en op stoelen zitten" of "Vervang het gezicht op de foto door dat van Norman Reedus, mijn dubbelganger, zeggen veel…).
Semantische zoekopdracht: In plaats van op zoekwoorden of cryptische SQL-opdrachten zoekt men nu over natuurlijke zinnen of vergelijkt hele documenten met elkaar.

Ik heb eens een paar duizend foto's laten berekenen op mijn computer. Hier is het resultaat in de vorm van een mozaïek (elk mozaïeksteen is in werkelijkheid een foto met een resolutie van 512 x 512 pixels):

Een mosaïek van ongeveer 400 afbeeldingen gegenereerd door een AI. Elk beeld is op mijn lokale hardware gegenereerd. Het totale beeld is verkleind om de laadtijd te verkorten. (afbeelding is automatisch vertaald).

De afzonderlijke beelden van het mozaïek zijn ontstaan uit een berekening met kunstmatige intelligentie. Gemengd werden de beelden van twee bekende kunstenaars die ik ken. De Variëteitrijkdom is hier nog niet optimaal, omdat het om eerste pogingen ging. Het gaat nog veel beter, zoals ik een dag later ontdekte. Wat op de markt voor kunstmatige intelligentie een eeuwigheid duurt, is voor sommige gegevensbeschermingsautoriteiten een tijdseenheid die ze niet kennen (Wat is een dag? Sommige autoriteiten kennen alleen de tijdbegrippen „jaar“, „decennium“ en „nooit“)?

Locale systemen als oplossing

Zojuist is aangetoond dat veel complexe berekeningen op eigen computers kunnen worden uitgevoerd. Als iemand weer Bullshit Bingo wil spelen en met Engelse woorden en merknamen om zich heen gooit, om onwetendheid te verbergen, ga dan niet weer naar Microsoft, AWS of Google rennen.

Wie je iemand nu nog voor elk klein probleem een Wolken-dienst boekt, is een armoedig wijf en weet hij/zij nog minder van AI dan van privacy en internettoepassingen. Dat zou niet erg zijn als-ie dat niet hoefde te weten. De verkeerde adviseurs zijn echter slecht nieuws.

Een AI is niet geschikt voor exacte uitspraken. Zij is net zo betrouwbaar als een over het algemeen zeer intelligent mens.

Sommige problemen zijn echter zo complex dat ze niet op standaard hardware kunnen draaien. Bijvoorbeeld ChatGPT versie 4. Dit systeem bestaat zelfs helemaal niet als open-source, zodat niemand in de verleiding komt om alles goed te doen.

Sommigen zijn dan maar verstandig genoeg en gooien hun Bedrijfsgeheimen niet in een chatbot van Microsoft of Google. Met wie dat doet, wil ik persoonlijk niets te maken hebben.

Als een bijzonder plastisch voorbeeld van rekenkosten mag BloombergGPT genoemd worden. Dat is een Large Language Model (LLM) van de financiële zender Bloomberg. Het is zo krachtig dat het 1,3 miljoen rekenuren nodig had om het model af te ronden. Een model is een elektronisch brein.

Het Bloomberg-geheugen what echter al na 148 rekenuren klaar omdat 512 zeer prestatieve grafische kaarten met elk 40 GB grafisch geheugen (NIET: computer-hauptspeicher) werden gebruikt. Elk van deze 512 grafische kaarten kostte ongeveer 14.000 euro. Wie bij zijn pc wil overstappen van 16 naar 32 GB RAM betaalt dat uit eigen zak. Wie een grafische kaart wil upgraden van 8 naar 16 GB geheugen betaalt een klein vermogen (iets overdreven).

Juridische overwegingen

Ik beperk mij in wezen tot enkele notities die ik heb ontleend aan de uitspraken van advocaat Jonas Breyer. Het is geen toeval dat zijn achternaam u bekend voor[kunnen] (aanwijzing: „IP-adressen zijn persoonsgegevens“).

Auteursrecht

Goed en slecht tegelijk voor ons allemaal als het om kunstmatige intelligentie gaat. Er bestaat de kans dat Europa wereldkampioen in regelgeving blijft. Dan zal er in Europa weinig bedrijven zijn die met kunstmatige intelligentie succesvol zijn. In plaats daarvan zullen we dan bij de Amerikanen aankopen, want zij doen wat ze willen maar worden niet gestraft (kunnen).

Belangrijkste voorwaarde: Wat ik als mens mag en niet mag, mag een AI evenveel of weinig.

Een afbeelding uit de hoofd te tekenen is net zo legaal voor een mens als voor een kunstmatige intelligentie. Als het resultaat te veel gelijkenis heeft met een werk dat onder auteursrecht valt, is het niet legaal. Alles wat een minimum aan creativiteit heeft, is onder auteursrecht beschermd. Dat zijn bijna alle afbeeldingen of foto's waarop niet alleen een vierkant of cirkel te zien is.

Bovendien is het volgens § 44b UrhG toegestaan, werken van anderen kortstondig op te slaan om deze naar patronen te analyseren. Precies dat doet AI meestal.

De zaak LAION

Hier komen we aan bij het geval LAION e.V., een Duitse vereniging, die door een Duitse fotograaf is aangeklaagd. LAION heeft meer dan 5 miljard foto's in een trainingsgegevensset voor AI-beeldtoepassingen verzameld en openbaar gemaakt. De gegevensset bevat alleen de links naar de openlijk toegankelijke originele foto's.

De LAION 5B-database is wereldwijd populair en de basis voor bijna elke tweede beeldgenerator die wat op zich heeft.
Mijn eigen waarneming na onderzoek naar talrijke Stable Diffusion-algoritmes.

LAION had deze afbeeldingen ooit gedownload en gebruikt om een elektronisch brein te berekenen. Daarna heeft LAION volgens eigen zeggen de afbeeldingen weer verwijderd. Met het brein kunnen vervolgens afbeeldingen zoals die hierboven of het volgende berekend worden.

Daryl Dixon in origamivorm, gegenereerd door een AI op mijn lokale systeem.

Een fotograaf heeft nu in de LAIOn-database zijn foto's teruggevonden. Zoals gezegd, alleen de links en niet de originele afbeeldingen. De fotograaf vroeg aan LAION om zijn materiaal uit de trainingsdata te wissen. Wat precies bedoeld wordt met dat, kon ik nog niet achterhalen. Misschien gaat het fotograaf om dat de inzichten uit zijn foto's uit het elektronische brein worden gewist.

Hier de LAION beeldbank als schema en met originele gegevens (uitzondering):

Het linker onderste beeld is van https://www.outdoorphotographer.com/images/gallery/full/131/417131.jpg (sinds 30-07-2023 niet meer op te roepen). Het rechter onderste beeld is daaruit gegenereerd en nieuw. (afbeelding is automatisch vertaald).

De vraag is nu of LAION de kennis uit kortgeslagen en geanalyseerde beelden moet wissen of niet. LAION zegt "nee" en heeft de fotograaf als antwoord op zijn verzoek om te wissen een rekening van een advocaat met schadevergoeding in ruimte van ongeveer 850 euro gestuurd.

Gegevensbeschermingsrecht

Persoonsgebonden gegevens zijn beschermd door de AVG. AI-toepassingen vereisen altijd een automatische verwerking. Daarom onderworpen ze zich altijd aan de AVG, wanneer persoonsgebonden gegevens in het spel zijn.

Personenbezogen kunnen niet alleen tekst maar ook beelden zijn. Ik ben van mening dat openbare informatie slechts een geringe of geen essentiële bescherming tegen gegevensverwerking kan genieten. Foutieve verklaringen die door een AI worden gegenereerd, hebben in eerste instantie niets met de bescherming van persoonsgegevens te maken. Ook het auteursrecht is iets anders dan de bescherming van persoonsgegevens.

Ik zie de bescherming van persoonsgegevens als ondergeschikte problematiek, wanneer het gaat om AI-toepassingen. Hij heeft hier zijn zeer goede rechtvaardiging en voorkomt niet, maar beschermt. Anders zie ik het eerder bij auteursrecht of merkrecht.

Overige wettelijke bepalingen

Het merkenrecht beschermt expliciet (artikel 3 Merkenwet) en impliciet beschermd merk (artikel 4, lid 2 Merkenwet e.d.).

Naast woord- en beeldmerken zijn er ook geurmerken, geluiden, vormen en waarschijnlijk nog wat meer.

Patenten, modellen van fabrieksproducten en sommige ontwerpen zijn eveneens beschermd. Een flessenvorm kan ook beschermd zijn.

De Gegevenswet ligt nog maar in een commissie-ontwerp. Hij verplicht grotere bedrijven om hun gegevens vrij te geven, als iemand daarom vraagt. Dat klinkt vreemd en is het ook.

Er is ook een commissieontwerp voor een AI-Verordening. In het geding staat of er een omkeer van de bewijslast moet komen, als iemand een werk gebruikt dat door een AI is gegenereerd. Is dit werk rechtmatig gegenereerd? Om dat te bewijzen zou men bijvoorbeeld bij een beeldgenerator de toestand van het AI-systeem moeten opslaan als backup om later de bewijslast veilig te kunnen voeren. Dat verhindert AI en maakt het niet mogelijk.

Regulering beschermt grote bedrijven, die zich een advocaat en personeel kunnen permitteren voor omvangrijke procedures. Kleine ondernemingen worden hierdoor onderdrukt.

Beter dan reguleren, wat ik voor feitelijk niet mogelijk hou, vind ik afschrikking en sanctie. Twee woorden die bijgevolg geheel onbekend zijn bij de toezichthouders op het gebied van privacy zoals de Hessische (en sommige rechters uit dat land) . Waar parkeren minder auto's fout? Daar, waar zelfs op de straat parkeren met 800 euro bestraft wordt (maar nooit een ticket krijgt) of daar, waar iedere vijfde die fout parkeert, wordt aangeschreven?

Raden

Gebruik lokale AI-systemen. De wereld kan zo eenvoudig zijn. Geen problemen meer met Google en Microsoft. Wat what er nog van die Privacy Shield? Is die er nog? Nee, die is er niet meer. USA zijn uit.

Verwissel niet ChatBots met zoekmachines. Alleen al door middel van een semantische zoekopdracht, zonder ChatGPT, kan elk document of beeld beter gevonden worden dan ooit tevoren. Gans zonder OpenAI of Microsoft.

Controleer de Oefen-gegevens: Alleen eigen of handverzamelde gegevens zijn vrij van juridische problemen. Moet je moeilijk doen, want AI is gebaseerd op grote hoeveelheden gegevens. Gelukkig zijn er uitwegen. Het beste zou het zijn om (gewoonlijk) alleen openbare data te gebruiken als het niet de eigen gegevens zijn.

Gebruikersinvoer mag niet willekeurig opgeslagen worden. Hij kan persoonsgegevens bevatten. De reden waarom hij wordt opgeslagen, moet zorgvuldig gekozen en geregeld worden. Daarom is ChatGPT in Italië tijdelijk verboden geweest.

De uitgaven die een AI produceert, zijn afhankelijk van de vorm verschillend te hanteren. Tekstuitgaven zijn geen wetenschappelijke rapportages. Zie het geval van de New Yorkse advocaat die zich liet overtuigen door ChatGPT om 12 vonnissen in ontvangst te nemen, die er nooit waren geweest. Dwaas als je deze resultaten vervolgens voor het gerecht inbrengt en zo doet alsof het de waarheid is.

Ik hield een lezing over dit onderwerp op de Duitse luchtvaartveiligheidsconferentie in mei 2023.