Mange skriver, at kunstig intelligens blot er statistik og at det ved hjælp af sandsynlighed bestemmes, hvilket ord i en tekstrespons der skal udtales næste gang. Det er fuldstændigt latterligt. Men hvad er så kunstig intelligens i forhold til statistik?
En almindelig påstand om nutidens AI-systemer er, at disse får deres resultater ved statistiske beregninger. Med det vil nogle, så vidt jeg kan se, entmystificere AIs evne. Ifølge min mening og mine hidtidige kendsgerninger er dette uholdbart.
Nyligt blev min mening bekræftet, og det var på grund af udtalelser fra den tyske AI-pioner Prof. Jürgen Schmidhuber. Han regnes for far til en række matematiske modeller, der er med til at gøre AI til sejren i dag. Der kan nævnes især Transformer-tilgangen og Langsomt modnet neuralt net (langt korttidshukommelse). Uden disse tilgange, særligt uden Transformer, ville der ikke være en ChatGPT (og hvis det var tilfældet, så ville den hedde ChatGP, fordi „T“ står for „Transformer“).
Den tyske AI-pioner sagde på Markus Lanz, hvad jeg skrev for et par uger siden, og hvad jeg gerne vil gentage. Han sagde, at den måde, AI fungerer på, minder meget om den menneskelige hjerne.
Der er ingen væsentlige forskelle mellem et elektrontisk og et menneskeligt hjerne.
Angående funktionsevnen.
Ligesom professor Schmidhuber er jeg af den opfattelse, at AI-robotter snart (i 10 til 20 år ville jeg gætte) vil have bedre almenne evner end mennesket. For denne udtalelse behøver man ikke at være en profet. Den følger allerede af de nuværende muligheder og den simple antagelse, at beregningskraft altid bliver billigere, lige så meget som de sidste 50 år har været.
Hvad har det med statistik at gøre?
Det er sikkert rigtigt, at AI-algoritmer bygger på statistiske beregninger. Men denne udtalelse er meget uklar og ikke oplysende. Her til tre eksempler:
Et Bil er tydeligvis en Masse af Stof. Denne udtalelse er lige så korrekt, som uddybet.
Kiks er ikke tekstfiler. Jeg har forsøgt at klargøre dette i lang tid for at gøre det klart. Selvom nogle mennesker siger: Kiks bliver dog lagret på filer. Så siger jeg: Ja, men det er (i dag og over alle browsere set generelt) ikke tekstfiler. Så kommer nogen og siger: Ja, men man kan åbne disse (binære-)filer med en teksteditor. Rigtig, man kan åbne enhver fil med en teksteditor, selv om sådan da vil binærdatabladet blive vist i usandsynlige og ikke sædvanligt forkerte former. Alt at betegne som en fil, betyder et informationsindhold på præcis nul (= Entropie = Maade for middelinformationen indhold af en besked).
Quantenteorien er ifølge min viden den bedste tilpassede og bedste bevisede teori i menneskehistorien. Den beskæftiger sig med de mindste partikler. Enhver materie på jorden (og sandsynligvis også andre steder i universet) består af partikler, der følger Quantenteorien. Desværre er Quantenteorien baseret på tilfælde. Quantenteorien er således baseret på statistiske processer. I den forstand er vores hele eksistens baseret på tilfælde. Vores daglige liv er derfor bestemt af statistiske processer. Alligevel har jeg aldrig hørt nogen sige, at vores hverdag følger statistiske processer.
Hvorfor siger nogle så, at de af en AI genererede resultater ville være baseret på statistiske algoritmer? Fordi du ikke forstår AI og vil nedskue det, er min teori. Hvis du ikke kan eller vil forstå noget, gør du som om det ikke er relevant eller ikke så vigtigt eller lignende.
Hvorfor bygger AI ikke rigtig på statistik?
Som ovenover er fremstillet, spiller statistik overalt en rolle. Man behøver ikke at nævne det særligt, hvis statistik ikke er den dominerende faktor. I kognitiv it (AI) er andre koncepter dominerende. Dette kan nævnes:
- Neuronale netværk (KNN) –>> som hos mennesket
- Transformatorer og indbetydelser -> Sådan som hos mennesket
- Strukturer kende – > Som hos mennesket
Til sidst, når det gælder om at kende strukturer, et eksempel. Den tyske sprogform kender mange udtryk, der er blevet indarbejdet. Når en fremmed taler tysk, kommer det ofte for, at han bruger et udtryk på en måde, som vi ikke finder rigtig. Det samme kan man sige om den tyske grammatik i almindelighed. Tydeligtvis findes der således sprogregler. Disse har med at gøre, hvilket ord i vores forventningsfællesskab skal følge det foregående ord eller flere foregående ord. Det har med statistik at gøre.
Kernen er dog, at vi som modersmålssprogligt menneske kan forstå kontexten af den tyske sprog og en tekst. Præcis det gør moderne AI-algoritmer også.
Indvirkninger på datasekretessen
Persondata sikkerhed henvender sig her til persondata, altså privatlivssikring, til erhvervssekretesse og til opfindersretlige aspekter.
Præcis som hos mennesker bliver informationer ikke i exakt form gemt på en kunstig hjerne, der kaldes Ki-modellen, men i stedet gemmes de i form af vægt, der afgør det neuronale net. Selvom AI-systemer som ChatGPT er kendte for at kunne give Fakta korrekt igen, så opstår Halluzinationer på en måde, som jeg beskriver mere detaljeret i et andet indlæg.
Derfor får man i store koncerner, som selv er førende inden for AI, besked til medarbejderne om ikke at indsætte følsomme data i AI-systemerne. For en tredje part, der uden ret har adgang til visse oplysninger, kunne disse oplysninger blive afsløret ved at spørge chatboten på den rigtige måde.
Det er kun en spørgsmål af tid (hardware-udvikling), inden en Kunstig Intellighed overgår mennesket endnu mere, end det allerede er tilfældet (se udviklede chat-bots, der ofte giver meget bedre svar end gennemsnitlig intelligente mennesker).
Min afhandling. Jeg vil gerne satse på det med dig.
Sensibel information er både ved det første træning („pre-træning“ kaldet) relevant, og ved videre træning („fine-tuning“ kaldet). Brugerindgange kan dog let kontrolleres, hvis de ikke gemmes og heller ikke bruges til at forbedre AI-modellerne.
Jeg anbefaler stærkt virksomheder at tage fat på deres egne AI-systemer, hvis virksomhedens data kommer med i billedet. Disse lokale systemer er både mulige og betalbare. Kom til mig, hvis du har brug for en udtalelse om Mulighed. Det, der fungerer, er især:
- Søg i dokumenter
- Svar på spørgsmål fra egne dokumenter
- Lydklippetranskription
- Billeddanmærkning (forskere har nyligt med hjælp af AI opdaget nye hieroglyffer)
- Billedskabning
- USA.
Til billedskabning et ord: Det er en enorm forskel, om I
a) i DALL-E eller Midjourney skal manuelt en instruktion indtastes i en prompt, betale afhængigt af brug, (eller være opmærksom på sin frie kontingent), og når resultaterne ikke er tilfredsstillende, skal man udføre mange forsøg, og desuden ved ikke hvad der sker med dine indtastede data og det modtagne billede Bestilling
b) eigen server at have, hvor en egen AI-applikation kører, med hvilken billeder "gratis" kan genereres til en anvisning 20, 50 eller også 1000 eller 5000 billeder. Derudover kan de genererede billeder afprøves på relevans ved hjælp af en AI. Dertil kan for eksempel dine tidligere beslutninger, hvilke billeder du har fundet godt til dine markedsføringskanaler, være medtaget. Så bliver der ud fra 1000 genererede billeder en liste over de 20 bedste billeder. Ud af disse søger du så mange frem, som du behøver.
Automatik mod manuel, fastkost mod usikkerhedsomkostninger, datakvalitet mod tilfældighed, individuel designmulighed mod generel løsning, datasekretesse mod spil. Det er din beslutning.
Det er vigtigt at vide: Hvis du ønsker lokale AI-løsninger til dit firma, skal du vide hvad de skal bruges til. Der findes ikke en AI-løsning til alt. ChatGPT kan du få aktuel ikke i en datavenlig udgave! Se ovenstående anvendelsessammenhænge for muligheder, der kan løses med AI-systemer, der kører på en lokal server.
Konklusion
Den ydeevne, der udføres af AI-algoritmer på basis af Transformer-tilgangen, har med statistik så meget eller så lidt at gøre som menneskets arbejdende hjerne.
Hovedegenskaberne ved moderne AI ligger snarere i arkitekturen af kunstige neurale netværk, Transformer-tilgangen og forening af enhver slags data.
Præcis som mennesket er en AI usikker og producerer konstant falske resultater (jeg gentager: præcis som mennesket). Dog kan AI-systemer også gøre fantastiske ting. Man skal blot vide, at genererede svar i tekstform ikke repræsenterer et troværdigt resultat. Søgningen efter dokumenter eller også billedproduktion er mægtige værktøjer, der åbner mange muligheder.
Yderligere bidrag til kunstig intelligens:
Try Offline-AI now
Optimizable and with full data control. Economical even in continuous operation.
Fully-controlled data center, no third-parties.



My name is Klaus Meffert. I have a doctorate in computer science and have been working professionally and practically with information technology for over 30 years. I also work as an expert in IT & data protection. I achieve my results by looking at technology and law. This seems absolutely essential to me when it comes to digital data protection. My company, IT Logic GmbH, also offers consulting and development of optimized and secure AI solutions.
