Veel mensen schrijven dat kunstmatige intelligentie niets meer is dan statistiek en dat het door waarschijnlijkheden wordt bepaald welk woord in een tekstreactie als volgende moet worden uitgebracht. Dat is onzin. Maar wat is kunstmatige intelligentie nou eigenlijk met betrekking tot statistiek?
Een veelgehoorde uitspraak over hedendaagse AI-systemen is dat deze hun resultaten behalen door statistische berekeningen. Daarmee willen sommigen, zo mijn indruk, de capaciteiten van AI Verontrusten. Meiner mening en tot op heden bekende kennis na is dit Ongepast.
Onlangs werd mijn mening bevestigd door uitspraken van de Duitse AI-pionier Prof. Jürgen Schmidhuber. Hij wordt gezien als vader van talrijke wiskundige modellen die verantwoordelijk zijn voor het huidige succes van de AI. Hierbij moet vooral worden genoemd de Transformer-methode en Long-Short Term Memory (langdurig kortetermijngeheugen). Zonder deze methoden, in het bijzonder zonder Transformer, zou er geen ChatGPT zijn (en als dat wel zo what, dan zou het "T" voor "Transformer" staan).
De net genoemde Duitse AI-pionier zei bij Markus Lanz precies hetzelfde als wat ik een paar weken geleden ook al geschreven heb en waarvan ik graag nog steeds herhaal. Hij zei namelijk dat de werking van AI heel erg lijkt op hoe een menselijk brein functioneert.
Er zijn geen essentiële verschillen tussen een elektrisch en een menselijk brein.
Betrekking tot de werking.
Net als Prof. Schmidhuber ben ik van mening dat AI-robots binnenkort (in 10 tot 20 jaar zou ik schatten) betere algemene vaardigheden zullen hebben dan de mens. Voor deze uitspraak hoef je geen profet te zijn. Ze volgt al uit de huidige mogelijkheden en de eenvoudige aanname dat rekenkracht steeds goedkoper zal worden, net als de laatste 50 jaar.
Wat heeft het met de statistiek te maken?
Het is zeker juist dat AI-algoritmen op statistische berekeningen berusten. Deze uitspraak is echter zeer onderscheidend en niet informatief. Hier zijn drie voorbeelden:
Een automobil is duidelijk een hoopje materiaal. Deze uitspraak is eveneens juist, als ongespecificeerd.
Koekjes zijn geen tekstbestanden. Ik probeer dat al lang duidelijk te maken. Toch zeggen sommigen: Cookies worden wel in bestanden opgeslagen. Dan zeg ik: Ja, maar dat zijn (in de huidige tijd en over alle browsers beschouwd) geen tekstbestanden. Dan zegt iemand: Ja, maar dan kun je deze (binair-)bestanden toch met een teksteditor openen. Richtig, je kunt elke bestand met een teksteditor openen, ook al worden dan de binairgegevens onvoorzien en niet gebruikelijk verkeerd weergegeven. Alles als bestand te noemen, betekent een informatie-inhoud van precies nul (= Entropie = maat voor het gemiddelde informatieve inhoud van een bericht).
Quantumtheorie is naar mijn weten de meest juiste en het beste bewezenste theorie in de geschiedenis van de mensheid. Het gaat over de kleinste deeltjes. Alle materie op aarde (en waarschijnlijk ook elders in het universum) bestaat uit deeltjes die gehoorzamen aan de quantumtheorie. Jammer genoeg is de quantumtheorie gebaseerd op toeval. De quantumtheorie berust dus op statistische processen. In zoverre berust onze hele bestaanswijze op toeval. Ons dagelijks leven wordt dus bepaald door statistische processen. Toch heb ik nog nooit iemand horen zeggen dat ons alledaagse leven gehoorzaamt aan statistische processen.
Waarom zouden sommigen dan ook beweren dat de resultaten die door een AI zijn gegenereerd op statistische algoritmen berusten? Omdat ze AI niet begrijpen en willen afdoen, is mijn stelling. Wie iets niet kan of wil begrijpen, doet alsof dit iets niet relevant of niet zo belangrijk is of dergelijks.
Waarom is er geen echte statistiek in AI?
Als boven beschreven speelt statistiek overal een rol. Men hoeft dit niet apart te noemen als statistiek geen overheersende factor is. In de kunstmatige intelligentie zijn andere concepten overheersend. Daarbij te noemen:
- Neuronale netwerken (KNN) –>> zoals bij mensen
- Transformators en inbeddingen -> Zoals bij de mens
- Structuren herkennen -> Zoals bij mensen
Ten slotte, het herkennen van patronen, een voorbeeld. De Duitse taal kent veel uitdrukkingen die zich hebben ingeburgerd. Als een buitenlander Duits spreekt, komt het vaak voor dat hij een uitdrukking niet zo gebruikt als wij dat voor juist houden. Hetzelfde kan men zeggen over de Duitse grammatica in het algemeen. Uit duidelijke redenen zijn er dus taalkundige regels. Deze hebben te maken met welk woord in onze verwachtingen op het vorige woord of meerdere vorige woorden zou moeten volgen. Dat heeft te maken met statistiek.
De kern zit echter in het feit dat wij als moedertaalsprekers de context van de Duitse taal en een tekst kunnen begrijpen. Precies dit doen moderne AI-algoritmen ook.
Gevolgen voor gegevensbeveiliging
Gegevensbescherming heeft hier betrekking op persoonsgegevens, dus de bescherming van persoonsgegevens, op bedrijfsgeheimen en op auteursrechtelijke aspecten.
Net als bij mensen worden informatie niet exact opgeslagen in een kunstmatig brein dat AI-Model heet, maar in de vorm van gewichten die het neurale netwerk afstemmen. AI-systemen zoals ChatGPT zijn bekend om Feiten correct weer te geven. Hoe Hallucinaties ontstaan, beschrijf ik nader in een volgend artikel.
Daomdat grote bedrijven die zelf leidend zijn in kunstmatige intelligentie waarschuwen voor medewerkers om geen gevoelige data in de kunstmatige intelligentie te stoppen, want een derde die onbevoegd is bepaalde informatie te krijgen, kan deze informatie door slimme vragen aan de chatbot verkrijgen.
Het is maar een kwestie van tijd (hardware-ontwikkeling), voordat een kunstmatige intelligentie de mens nog verder overtreft, dan dat nu al het geval is (zie uitgerezen chatbots, die vaak aanzienlijk betere antwoorden geven dan gemiddeld intelligente mensen).
Mijn these. Ik wed graag met u op dat.
Zinvolle informatie is zowel bij het initiële trainen („pre-training“ genoemd) relevant, als bij het verdere aanleren („fine-tuning“ genoemd). Gebruikersingangen kunnen echter gemakkelijk worden geregeld, mits ze niet worden opgeslagen en ook niet worden gebruikt om de AI-modellen te verbeteren.
Viele Artikel in PDF-Form · Kompakte Kernaussagen für Beiträge · Offline-KI · Freikontingent+ für Website-Checks



My name is Klaus Meffert. I have a doctorate in computer science and have been working professionally and practically with information technology for over 30 years. I also work as an expert in IT & data protection. I achieve my results by looking at technology and law. This seems absolutely essential to me when it comes to digital data protection. My company, IT Logic GmbH, also offers consulting and development of optimized and secure AI solutions.
