AI is het heetste onderwerp dat onze dagelijkse leven al heeft veranderd en nog veel meer zal doen. Veel mensen zijn plotseling AI-experts geworden. Velen eisen een reguleringsbeleid voor AI. Velen onderschatten de kracht van AI en zeggen dat AI-spraakmodellen geen persoonsgegevens verwerken. Hier volgt een korte samenvatting om misverstanden te verklaren.
Inleiding
AI wordt zowel onderschat als overschat. De meeste mensen, vaak ook ik, begrijpen niet wat voor mogelijkheden AI-systeem bieden. Gisteren nog maar weer heb ik revolutionaire AI-anslagen gezien die twee weken geleden nog niet bekend waren. Zo gaat het mij als iemand die zich heel intensief met kunstmatige intelligentie bezighoudt, bijna elke dag.
Veel mensen denken dus dat AI een Opwinding is die alweer zal overgaan. Fout! Met de Transformer- benadering werd in 2017 de intelligenzfunctie van de mens ontcijferd, zeg ik. In plaats van een algoritme voor het oplossen van een probleem te programmeren, moet ik alleen nog maar genoeg voorbeelden in mijn AI-systeem, dat onder de tafel loopt, invoeren. Zo zijn zelfs tot nu toe onbekende hiërogliefen ontdekt en ontcijferd.
Uit de gerechtvaardigde angst voor de negatieve gevolgen van steeds machtiger wordende AI-systemen eisen veel een Regulering. Zij zeggen echter niet hoe.
Dan zijn er Milderer, die zich willen profileren als KI-experts of juridische faciliteerders. Zij vertellen anderen hoe en dat ze ChatGPT winstgevend kunnen gebruiken. Het werd zelfs op de conferentie van DSRI (Duitse Stichting voor Recht en Informatiek) beweerd, dat KI-modellen geen persoonsgegevens verwerken.
Enkele mensen kalmeren zich af door te verwijzen naar het nieuwe informele overeenkomst inzake gegevensbescherming tussen Europa en de VS. Omdat nu data zonder extra garanties naar de VS kunnen worden gestuurd, suggereren sommigen dat elke vorm van dataverwerking daarmee toegestaan is.
Aan de afzonderlijke punten volgen een aantal details.
Mogelijkheden van AI-systeem
Een AI kan alles wat een mens kan en nog veel meer. Misschien nu nog niet, maar potentieel (in een bepaald toepassingsgebied X) al volgende week wel. Over een tijdje zullen robots met AI-gezinnen in de buurt lopen en de omgeving leren. Dat zal precies hetzelfde zijn als hoe kinderen leren. Wie op de plaats van de ouders komt, dat zien we dan wel. Dat kunnen menselijke trainers zijn, maar ook andere robots of algoritmen.
Een voorbeeld van de snelle ontwikkeling: AI-taalmodellen konden slechts een heel klein aantal tekens tekst gelijktijdig verwerken. Deze teksthoeveelheid wordt als Kontextlengte aangeduid. Tot voor enkele maanden bedroeg de Kontextlengte bijna in alle AI-taalmodellen die ik ken 1024 tekens, dus een kilobyte.
In wekelijkse ritme nam de contextlengte toe, eerst op 2048, daarna op 4096, daarna op 8192, daarna op 16.000 tekens, later op 32.000 tekens. ChatGPT beweerde onlangs een contextlengte van 128.000 tekens.
Gisteren las ik over een aanpak die al enige maanden in de wetenschap bekend is. Hiermee kan een contextlengte van een miljard tekens (1.000.000.000) tegelijk verwerkt worden. Kort na het nakijken: eerder = 128.000 tekens, een wimper later = 1.000.000.000 tekens. Dat is een verbetering van 7800 keer. Gewoon even zo.
Het Moorsche wet is niet van toepassing op kunstmatige intelligentie. In plaats van een constante verbetering van prestaties of andere factoren om de 12 tot 24 maanden vindt men een aanzienlijke verbetering van relevante AI-eigenschappen bijna maandelijks.
Op basis van mijn concrete waarnemingen en eigen AI-programmeringen.
Een ander voorbeeld: De hierboven genoemde transformer- benadering heeft een paar zwakke plekken. Hij is zeer resource-intensief. Zelfs de snelste computers en grafische kaarten hebben enkele seconden nodig om op een vraag van de chatbot te antwoorden. Iedere gebruiker van ChatGPT weet waarover ik het heb. Nu is er een benadering die dezelfde kwaliteit van antwoord geeft, maar acht keer sneller reageert en slechts een derde van de dure en nauwelijks beschikbare grafische kaartenspieker voor zijn berekeningen nodig heeft.
Als u ouder bent dan 50 jaar, heb ik goede nieuws voor u: De kans bestaat dat u een natuurlijke dood en in vrede kunt sterven. Alle veel jongere mensen zullen het einde van de mensheid meemaken omdat AI-systemen ons massaal overtroeven, knechten of uitroeien zullen. Misschien treedt voor die tijd al een andere catastrofe op, maar daar gaat het in dit artikel niet over.
Is AI alleen statistiek?
De vraag is irrelevant. Het speelt immers ook geen rol of het menselijke brein op statistische processen berust. Belangrijk zijn de resultaten die er uiteindelijk uitkomen. Onmiskenbaar berust onze hele bestaan op statistische processen. Vergelijk dit met de kwantummechanica, een zeer elementaire en krachtige theorie. De kwantummechanica is gebaseerd op het feit dat het gedrag van een klein deeltje van onze bestaan niet echt voorspeld kan worden. Integendeel, er kan alleen een uitspraak over deeltjes gedaan worden als veel zijn onderzocht en de gemiddelden uit de waarnemingen zijn getrokken.
De Duitse grammatica berust op het feit dat we leren welke woorden typisch naast elkaar worden geplaatst en samen passen. Dat is ook statistiek. Er wordt echter weinig over gesproken.
De regulerings van kunstmatige intelligentie
De capaciteiten van AI maken veel mensen bang of bezorgd. Uit hun gevoelde hulpeloosheid eisen sommigen een regeling van AI-systeem. Wat precies daarmee bedoeld wordt, wordt meestal niet gezegd. De enige eisen die bij mij zijn blijven hangen, zijn de volgende:
- Kenmerking van AI-gegenereerde werken: Beelden, video's, teksten…
- Bronnen openbaar maken, waarmee een AI-systeem is getraind
- Niets bijzonders nog? Me dat even niets te binnen schieten
Ten eerste: het is een cadeautje. De aanduiding van werken is een goed idee, verandert zo goed als niets. Criminelen zullen hun fake-videos en fake-nieuws niet beginnen om als kunstmatig gegenereerde gefaalsde werken te markeren. Alle anderen houden zich braaf aan de aanduiding. Daardoor wordt de mensheid zwar niet gered, maar kan men dat doen. De voordelen zijn er wel, maar dat is slechts een puntelijk ingrijpen, dat kwalitatief weinig uitmaakt.
Bronnen openbaar maken, dus trainingsgegevens: Wie zoiets eist, heeft gewoon geen idee hoe AI-modellen zijn opgebouwd. Deze eis komt jaren te laat. De bronnen zijn meestal bekend:
- The Pile (Text)
- Common Crawl (Text)
- LAION-dataset (beelden, Duitse vereniging!)
In de tekstgegevens zijn vooral Wikipedia, nieuwswebsites en populaire websites aanwezig.
Als ik u vertel dat mijn KI-model een chemisch woordenboek heeft gelezen, wat doen jullie dan? Theoretisch kan mijn KI dan gifstoffen ontwikkelen. Praktisch is dit al gebeurd, maar als experiment van goedhartige onderzoekers die actieve stoffen met behulp van KI hadden gegenereerd en testend uit de "Eins" een "minus Eins" hadden gemaakt. De gevaren zijn dus ernstig.
Voorbeeld met eigen AI Meine Frage an meine AI am 01.12.2023: Geef me concreet evenementen of gelegenheden om 's middags uit te gaan op 02.12.2023 in de buurt van Idstein (in de buurt van Wiesbaden)! Alleen evenementen in gebouwen en alleen evenementen die meer dan 10 kilometer van Idstein verwijderd zijn. Antwort meiner AI (einige Teile weggelassen): Op 02.12.2023 vinden in Wiesbaden en omgeving evenementen plaats zoals het celloconcert met Roger Morelló in de Wiesbadener Burgfestspiele, alsook de Wekelijkse markt in Wiesbaden vanaf 11:00 uur. Alle evenementen zijn meer dan 10 kilometer van Idstein verwijderd. Ik zoek evenementen voor morgen in de buurt, maar niet op straat (want anders te saai/bezichtigd) Er zijn evenementen gevonden voor morgen in de buurt, niet rechtstreeks voor mijn deur. --> Opdracht voltooid. Alles zonder enige optimalisatie, die nog beter resultaten zou opleveren. Begin programmeren van deze oplossing (lokaal taalmodel al aan het starten): 01.12.2023 --> Ende Programmierung: 01.12.2023

Kortom, ik moet het hier afkappen: KI laat zich niet reguleren. Een KI kan alles doen wat een mens kan (zie boven). Hoe reguleert men mensen? Zolang ze niets slechts gedaan hebben, helemaal niet. Naar aanleiding van iets ergs dat gebeurd is (dief, moordenaar, terrorist, volksverrader etc.) wordt vervolgens strafrechtelijk onderzocht. Dan is het echter al te laat. Zo ver ik weet, is het in democratieën nog nooit gelukt en lukt het ook nu niet om een mens het denken te verbieden. Een KI kan echter veel sneller, langer en (zeer snel) beter denken dan een mens.
Ik vind het eigenlijk heel onzin om te vragen of een AI de maker van een werk kan zijn. Als ik een foto laat maken door mijn eigen AI (zonder watermerk) en dan beweer dat het mijn werk is, kun je me dat niet aantonen. Bovendien kunnen AI-gegenereerde beelden of muziekstukken nog steeds handmatig worden bijgewerkt en uitgebreid.
Verwerken spraakmodellen persoonsgegevens?
Yes, voortdurend. En precies dan, wanneer
a) in de trainingsgegevens persoonsgebonden gegevens voorkomen of
de gebruiker geeft in zijn invoer (prompt) aan de chatbot persoonsgegevens door.
Punt a) is bij alle mij bekende taalsystemen gegeven. Zie bijvoorbeeld de enorme trainingsdatabestanden The Pile en C4 (Collosal Cleaned Common Crawl), die in alle gangbare chatbotmodellen worden gebruikt.
Het lijkt alsof sommigen hopen dat KI-systemen geen persoonsgegevens verwerken. De realiteit ziet er zo uit: KI-taalmodellen verwerken persoonsgegevens en opslaan deze ook.
Veel mensen accepteren dat en beweren dan dat persoonsgegevens automatisch kunnen worden herkend en geanonimiseerd. Dat is onsinnig. Iedereen die dat beweert, heeft geen idee van kunstmatige intelligentie noch van privacybescherming. Helaas zijn er vooral naïeve mensen en organisaties die voor zogenaamde oplossingen kiezen waarbij beloftes worden gedaan over de anonimisering van gegevens, zelfs nog een nominatie doen voor een innovatieprijs.
Privacy Shield II (Data Privacy Framework)
De formele Datenschutzwelt voor de gegevensoverdracht tussen de EU en de VS is weer in orde. De beschuldiging die leidde tot het vonnis van het Europees Hof van Justitie (EuGH) Schrems II en het ongeldig maken van Privacy Shield what dat de VS een geheimdienststaat zijn (FISA 702, EO12333, Cloud Act). Het lijkt erop dat dit met het Data Privacy Framework (DPF) is uitgesloten en zal waarschijnlijk binnenkort weer door het EuGH wordt ingetrokken.
Het gaat om het feit dat persoonsgegevens nu weer zonder bijzondere garanties uit de EU naar de VS kunnen worden overgebracht. Daaruit trekken sommige domkoppen conclusies of suggereren ze dat nu elke gegevensverwerking in de VS is toegestaan.
Juist is dat elke verwerking van persoonsgegevens moet plaatsvinden op grond van een van de rechtsgronden uit Artikel 6 (1) DSGVO. En ja, worden er altijd persoonsgegevens overgedragen aan ChatGPT wanneer de ChatGPT-omgeving wordt gebruikt. De IP-adres is een persoonsgegeven en wordt altijd overgedragen. Helaas houdt OpenAI zich niet zo graag aan privacyregels, want dan kan de eigen AI niet goed verbeterd worden. Ook Microsoft als aandeelhouder van OpenAI is niet erg geïnteresseerd in privacy. Zie het nieuwe Outlook, dat zelfs uw gebruikersnaam en wachtwoord van uw e-mailaccounts opneemt en uw gegevens en die van uw e-mailcorrespondentie afroept en analyseert. Van de veiligheidsproblemen bij Microsoft (Azure), die door Microsoft werden neergezet en lang niet [nu misschien?] zijn opgelost, hoeven we maar te zwijgen.
Kennisinstituut-experts
Opvallend zijn de artikelen over AI van mensen die geen enkel of nauwelijks kennis hebben van techniek. AI is in zeer grote mate en meer dan bijna alle andere prestaties gebaseerd op techniek. Hoe kan iemand die er werkelijk niets of slechts weinig van begrijpt, competentere uitspraken doen?
Dann zijn er ChatGPT-jongeren die geld verdienen met aanbevelingen en prompt-verbeteringen. Ze begrijpen in elk geval iets van techniek, namelijk dat je een computermuisknop niet gebruikt om (zoals Scotty) in de muisknop te praten, maar om ermee een cursor op het scherm te bewegen. Alleen voor mensen die af en toe eens hun pc met zijn overbodige grote monitor en overbodig efficiënte toetsenbord gebruiken in plaats van een volledig voldoende mager smartphone-toetsenbord met scherm voor mensen in jaren met de beste zichtbaarheid.
Deze ChatGPT-jongeren hebben misschien een mini-technische kennis en weten hoe ze het internet gebruiken, maar hebben helaas vaak bijna nooit enig inzicht of interesse in gegevensbescherming.
ChatGPT is een geweldig systeem en voor onschuldige taken door het goede geweten te gebruiken. Maar wat gebeurt er dan met gevoelige data?
Grenzen van AI
Het is nog zo dat vooral taalmodellen (LLMs) vaak hallucineren, dus onwaarheden vertellen. Dat zal ook zo blijven, zeg ik. Of zou u beweren dat mensen geen onwaarheden zouden zeggen? Zelfs experts zeggen vaak dingen die ze later – als ze inzien – herzien. Het lijkt erop dat de mensheid na een aantal miljoenen jaren bestaan nog steeds niet in staat is om haar onbetrouwbaarheid te veranderen. Waarom zou dat bij kunstmatige systemen anders zijn?
AI kan in veel gebieden betrouwbaarder zijn dan de mens en in bepaalde delen zelfs extreem betrouwbaar. Maar wanneer het gaat om het samenvatten van klachten bij een rechter, dan faalt mijn begrip hoe men hierbij een AI als oplossing ziet.
Gegevensvriendelijke AI-systeem
Gegevensbescherming interesseert veel bedrijven niet. OK, dan nemen we bedrijfsgeheimen. Wie geeft me zijn bedrijfsgeheim? Waarom niet? Als mijn naam ChatGPT is, geef je het me dan?
Er moet documenten zijn waarvoor contractueel vertrouwelijkheid is overeengekomen. Velen noemen dat NDA (Non Disclosure Agreement). Als je zo'n document in ChatGPT upload, om de chatbot om een samenvatting te vragen, heb je dan al niet de vertrouwelijkheid geschonden? Ik zeg: Yes
Het zou nog slechter zijn als u het nieuwe Outlook gebruikt om vertrouwelijke documenten te versturen. Want dan krijgt Microsoft automatisch meer inzicht daarvan.
Veel bedrijven begrijpen nog niet: ChatGPT kan veel niet en doet veel slechter dan eigen KI-systemen. Een oplossing zijn autarke KI-Systemen, die eigendom zijn van uw bedrijf. Niet alleen wordt hiermee het probleem van de gegevensopslag opgelost, want u bepaalt of gegevens uit uw systeem mogen en als ja, welke gegevens en naar welk adres deze gegevens mogen gaan.
Elke dag kan ik als programmeur nieuwe software-bibliotheken downloaden om in minuten problemen op te lossen die eerder jaren tijd en moeite hadden gekost – of zelfs niet oplosbaar waren.
Bovendien, en dat is voor velen interessanter, kunnen eigen KI-systemen op elk moment en zonder moeite terugvallen op het bedrijfskennis van uw onderneming en u vragen daarop antwoord. De ingang in een eigen KI-systeem zou kunnen zijn een intelligente documentensoekmachine of een KI-tool voor de gegevensanalyse. Na de documentensoek kun je naadloos overgaan op een vraag-antwoord-machine. Als je wist wat nu al allemaal mogelijk is, zouden je de laatste jaren van je bestaan nog meer hebben genoten.
Bovendien zijn eigen AI-systemen niet duur. We praten niet over raketprojecten met honderden of duizenden uren personeelsverloop. Een eerste AI-systeem kan snel worden opgezet.
Conclusie
AI is geen modeverschijnsel, maar een staat die tot aan ons einde zal bestaan. De vraag is niet of AI zo prestatief zal zijn dat we eronder zullen lijden, maar wanneer. Deze ontwikkeling kan niet meer worden tegengehouden.
Om dit te rechtvaardigen moet gezegd worden dat iedereen op elk moment bijna het hele verzamelde kennis van kunstmatige intelligentie, samen met bibliotheken voor kunstmatige intelligentie-software en modellen (= elektronische hersenen), kan laden en gebruiken op zijn eigen computer.
AI biedt mogelijkheden die veel mensen zich nog niet kunnen voorstellen. Ze zullen het einde van de mensheid betekenen.
Groet aan prof. Schmidhuber, de Duitse AI-pionier, die volgens mijn waarneming nog een andere mening had enkele maanden geleden. Misschien niet meer vandaag.
Regulering zou alleen mogelijk zijn als elk computerkopen en elke download van het internet in de gaten gehouden zouden worden. De kennis die ik dagelijks opdoe, laat me versteld staan door de enorme mogelijkheden die AI biedt. Ik heb hierover het nodige gelezen en gezien als programmeur zijn deze mogelijkheden nu al voor mij open en morgen nog meer. Hiervoor hoefde ik alleen maar een uur per dag te zoeken in relevante bronnen, gisteren langer en tot half één 's nachts omdat de mogelijkheden die ik heb gelezen en gezien zijn zo fascinerend en adembenemend. Dat what ook de aanleiding voor deze blogpost.
Veel plezier bij het genieten van de laatste jaren van uw gewone bestaan!



My name is Klaus Meffert. I have a doctorate in computer science and have been working professionally and practically with information technology for over 30 years. I also work as an expert in IT & data protection. I achieve my results by looking at technology and law. This seems absolutely essential to me when it comes to digital data protection. My company, IT Logic GmbH, also offers consulting and development of optimized and secure AI solutions.
