AI erbjuder enorma möjligheter och innebär samtidigt stora risker. Av båda anledningarna skrämmer AI många människor. De hävdar därför att AI bara är baserat på statistik och inte har något med mänsklig intelligens att göra. Vad de glömmer är att hela vår existens bygger på statistik.
Statistikfaktorn för vår existens
Till språkmodeller läser man ofta att dessa LLMs bara bygger på att hitta det nästa wahrscheinliche ord till det senast genererade ordet och sedan utge det. Det görs sedan ord för ord. Och så kommer det raus, som andra håller för en intelligent skapad text. Istället för ord behandlas s.k. token. Förkortat sagt är token något som liknar orddelar eller silenser. Token används för att uppnå komprimering och också för att bättre kunna erfasa längre eller sammansatta ord semantiskt.
Även den Hamburgs dataskyddsombud kan man använda detta argument för att säga att han inte har någon ansvar i frågan om AI, eftersom AI inte behandlar personuppgifter. Det är svårt att tänka på något positivt i detta. Det saknar helt grund och kan bevisas som sådant. Följande uttalande räcker kanske redan som motbevis ([1]) :
Språkmodeller förutsäger vad nästa ord sannolikt kommer att vara. Det är inte intelligent.
Språkmodeller säger att det sannolikt nästa ord passande till den givna kontexten förutser. Det är intelligenta.
Många människor uppmärksammar inte den del som är i fetstil: den nämns vanligtvis inte.
Tysk grammatik
Människan kan också kallas för en så kallad Token-Papagei. Begreppet kom från någon som författaren diskuterade tekniska detaljer med angående AI. Den personen menade att språkmodeller bara är Token-Papageier. De upprepar alltså det de en gång har lärt sig av träningssätten.
Varför är människan också en token-papegoja? När vi pratar om den tyska grammatiken ser vi som modersmålsspråkiga att denna baseras på sannolikheter. Vi lär oss vilka ord och begrepp som passar ihop med andra ord och begrepp. För detta lär vi oss sannolikheter. Men vår hjärna döljer principen för språkinlärningen så bra att vi inte märker att grundprincipen för grammatiken är mycket enkel. Det var först sedan uppkomsten av Transformer-ansatsen 2017, som är en mycket viktig grund för dagens AI, som det blivit möjligt för även den naiva datalogen att förstå om han vill.
Vi kan vänta till den heliga dagen av aldrig-aldrig …
Det är grammatiskt korrekt, men skulle en modersmålstalare säga det så?
Om en utlänning förändrar en Idiom på grund av bristande kunskap (eller ett dåligt minne) och ger den tillbaka i annan, men grammatiskt korrekt form, så känner vi igen personen som utlänning. För vi har uppmärksammat avvikande sannolikhetsfördelning.
Radioaktivt sönderfall
Låt oss börja med ett citat från Wikipedia som alla fysiker förmodligen skulle säga:
Varje enskild atomkärnas sönderfallstid är slumpmässig.
Source: Wikipedia
Det innebär att om du tittar på ett partikel, vet du inte hur länge detta partikel existerar. Eller uttryckt på annat sätt: Du kan inte veta, hur länge detta partikel existerar. Du kan inte veta det eftersom kunskapen skulle vara en överträdelse mot det erkända fysikaliska världsbildet. Kunskapen är således inte möjlig. Om du är intresserad av mer rekommenderar jag populärvetenskapliga böcker som Werner Heisenbergs eller Albert Einsteins.
Hur lång tid tar det för ett radioaktivt ämne som uran att sluta stråla? Det går i allmänhet inte att svara på den frågan om man tittar på en uranpartikel. För jurister: Denna fråga kan inte besvaras, inte ens "i princip". Återigen: Frågan om när ett radioaktivt ämne inte längre är radioaktivt kan inte besvaras när man tittar på en partikel.
Halveringstid är tiden efter vilken radioaktiv strålning från ett ämne (radioaktivt nuklid) halverats. Hur beräknar man denna siffra? I alla fall gäller: "Tidpunkten för omvandlingen av en enskild kärna kan inte förutsägas…" (Source: Halveringstid/Wikipedia). Halveringstiden bestäms som "statistisk medelvärde" (samma källa).
Radioaktiv nedbrytning är en slumpprocess som bygger på statistik.
Kvantfysik
Fysiken blev med Albert Einsteins upptäckt 1905 känt. Han upptäckte att ljus inte kan förstås som en kontinuerlig stråle, utan i form av små paket, kvanterna. Detta är ingen fysikföreläsning. För att inte förära för många fysiker ska det också nämnas att det finns ett våg-partikel-dualism som förekommer vid ljus. Detta leder till det så kallade Dubbel-slit-experimentet, som är den bästa bevisningen för vår oförmåga att verkligen förstå vår egen existens. ([1])
Till exempel bygger lasrar på rön från kvantfysiken. Även GPS, som är grunden för navigationssystemet i din bil eller i din smartphone, skulle inte existera utan kvantfysik. GPS bygger i sin tur på mycket exakta atomur, som bara existerar för att vi kan förstå deras princip med hjälp av kvantfysik.

Även tunnel-effekten hos flash-minne bygger på kvantfysik. Kort sagt: utan kvantfysik skulle detta inlägg inte skrivas här på en dator, det skulle inte nå er via internet på en SSD-hårdvara, och ni skulle inte ens ha ett (betalt eller snabbt) datorsystem. Via ett mobiltelefon behöver vi då inte ens prata.
I fysiken på kvantnivå finns det slumpmässiga händelser som principiellt är oförutsägbara – även då man har tillgänglig information om ett kvantsystem.
Source: Quantenzufall, fetstil läggts till. Andra källor: Werner Heisenberg, Albert Einstein osv.
Det går så långt att det inte ens kan finnas ett perfekt vakuum. För då skulle man bryta mot Heisenbergs osäkerhetsprincip.
Om du vill veta mer: Werner Heisenberg, Niels Bohr, Richard Feynmann och Albert Einstein har skrivit begripliga böcker i ämnet, som andra inte har så mycket att tillägga.
Intelligens baserad på ett neuralt nätverk
Selvförekomsten kan intelligens avbildas på alla lämpliga sätt. Men ett neuralt nät har visat sig vara extra effektivt. Det används både i ditt huvud och i det artificiella AI-huvudet.
Neurala nätverk bearbetar bara siffror, inget annat.

I ditt huvud landar alla signaler i form av analoga värden, som manifestar sig i ström och spänning. Aktionspotentialer i nerver leder de elektriska signalerna vidare (”obemärkt bearbetning”).

Vid någon tidpunkt sker "utmatningen". Din mun rör sig eftersom motsvarande muskler har fått nummerkommandot från hjärnan via ryggmärgen. Siffrorna är strömmar och spänningar.
Analoga signaler kan omvandlas till digitala signaler. En viss noggrannhet går förlorad i processen eftersom analoga signaler är kontinuerliga och digitala signaler är diskreta. Kontinuerlig innebär t.ex. att det finns hur många tal som helst mellan 0 och 1. Diskret innebär att det bara finns ett begränsat antal tal mellan 0 och 1. Hur många tal det rör sig om i det digitala systemet beror på vilken noggrannhet som används. Det är lätt att inse att det inte spelar någon roll om det finns ett oändligt antal tal mellan 0 och 1 eller "bara" 100.000 miljarder tal. Förlusten av noggrannhet vid konvertering från analoga till digitala signaler är försumbar. Analoga och digitala system kan därför betraktas som likvärdiga i detta avseende, vilket dagens AI-system bevisar, som ofta är långt överlägsna människan (med undantag för dig, förstås).
Allt är ett nummer
Språkmodeller baserar sig på token. Token omvandlas till siffror. För att göra det använder man ett ordförteckning. Det är så enkelt att man egentligen inte behöver prata om det alls. Här är ett utdrag från det offentligt tillgängliga ordlistan för GPT-2:

Det märkliga "G" som står framför vissa symboler är en indikator på att respektive symbol måste utgöra början på ett ord. Alla tokens utan denna indikator får inte stå i början av ett ord. GPT-2:s ordbok har 52.000 poster.
Alla språkmodeller med öppen källkod har en ordbok av den här typen, som du kan ladda ner och visa som en textfil.
Hur ser det ut med bilder? Ni känner till Dall-E eller Midjourney. Förfarandet är som följer:
- Din text (prompt) omvandlas till siffror och matas in i DALL-E AI-modell.
- DALL-E bearbetar dessa siffror via ett neuralt nätverk som bara räknar med siffror.
- Slutresultatet är ett tal. Dessa tal tolkas som pixlar.
En bildpunkt kallas Pixel. Vid ett RGB-färgkanal och en färgdjup på 24 bit har en pixel 3 byte: 1 byte för rött, ett byte för grönt och ett byte för blått. Varje byte kan ta värden mellan 0 och 255. En pixel består av tre siffror.
Och hur är det med tal, dvs. ljudsignaler? En MP3-fil, eller din inspelade röst, består av vibrationer ("vågform"). Din hjärna bearbetar (förmodligen) två kanaler: En kanal är vänster öra, en annan är höger öra. I hemmabio känner du till 5.1 eller liknande. 5 står för de 4 hörnhögtalarna och centerhögtalaren. 1:an står för bashögtalaren. Ljudsignaler kan alltså omvandlas till siffror, vilket din stereoanläggning eller mobiltelefon visar.
Alla andra signaler kan också omvandlas till siffror. Vid termometern är det temperaturen som uttrycks i siffra, vid jordbävningsmätaren är det styrkan på jordbävningen (ungefär enligt Richterskalan). Andra signaler är redan digitala. Ta till exempel ett Excel-tabell med försäljningsuppgifter som exempel.
Alla signaler kan omvandlas till siffror.
Styrkommandon kan å andra sidan utföras genom att skicka siffror till ställdonen.
Ett ställdon, t.ex. din mun eller din hand, styrs genom att skicka siffror till ställdonet. Så där, yes. Var är den hemliga ingrediensen här? Det finns ingen. Att kemiska processer också är inblandade är en detalj som tydligen inte är nödvändig och som beror på de biologiska systemens natur. Om du ser det på ett annat sätt vore det bra om du kunde bidra med några argument.
Åsikter om statistik
Åsikter är inte riktiga bevis. De bör endast anges här så att ingen tror att författaren är ensam med sin åsikt.
Andras åsikter
Från ett 30-minuter långt samtal med en medarbetare från DEEPL i november 2024 framgick det: Medarbetaren är datalog och förstår teknisk funktion hos språkmodeller. Hans specialitet är lingvistik, vilket inte är så överraskande för DEEPL. Han håller med författaren om att statistik också är grund för mänsklig intelligens. Han ser också att robotar alltmer blir mäktiga. Att inte varje datalog har dessa insikter visar exemplet med token-papegojan (begreppet kommer från en annan datalog, som kanske ännu inte hittat kanten på tallriken).
Prof. Dr. Maximilian Wanderwitz är professor i ekonomisk rätt och IT-rätt. Han publicerar mycket om ämnet AI. Efter sin föreläsning den 26 november 2024 i Mainz blev han av författaren frågad efter sin åsikt. Herr Wanderwitz bekräftade att hans uppfattning också är att statistik är ett viktigt element i mänsklig intelligens och att han ser det analogt till AI.
En T-Systems-anställd, som har ansvar för digitala system i sitt företag, bekräftade detta den 26 november 2024 också: Han ser statistik som ett element av mänsklig intelligens precis såsom i artificiell intelligens.
Sam Altmann, medgrundare av OpenAI ser den makt hos AI som så stor att AI kommer att övertrumfa människan i en ofattbar utsträckning. Att övertrumfa människor med något annat än intelligens tycks svårt att föreställa sig.
Definition av (artificiell) intelligens
Författaren föreslår (sedan redan 03.04.2024) följande definition av konstig intelligens:
Som Konstig intelligens kallas ett künstligt system som försöker, lösa ett problem även vid osäker specifikation på en icke konkret angiven, lösningorienterad sätt och därmed bestående med tidigare känt kunskap kombinerat och slutsatsdragningar.
Definition av begreppet artificiell intelligens. Source: Klaus Meffert, dr-dsgvo.de
Du kan själv bestämma vad ett artificiellt system är. Det är inte viktigt. EU:s 27 medlemsländer har i genomsnitt olika syn på saken. Detta genomsnitt kallas den demokratiska processen. EU ser en maskin som en förutsättning för AI. Denna begränsning är onödig och arrogant. Det har också visat sig att diesel kan vara miljövänligt. Att på förhand utesluta detta var onödigt och fel.
Så vad är intelligens? Samma sak, förutom att intelligens inte (nödvändigtvis) är artificiell. Detta ger oss följande definition:
Som Intelligens betecknas ett System som försöker, lösa ett Problem även vid osäkert uppställande på en icke konkret föreskriven, lösningorienterad sätt och därvid bestående med nytt Vetande kombinerat och Slutsatser dras.
Definition av begreppet intelligens. Source: Klaus Meffert, dr-dsgvo.de
Definitionen av intelligens är identisk med definitionen av AI, med undantag för adjektivet "artificiell".
Din syn på saken
Anser du att AI "bara" bygger på statistik och därför inte är ett intelligent system? Då skulle det vara trevligt att veta vilken princip, om inte statistik, som mänsklig intelligens bygger på. Vi tar gärna emot din definition av AI eller intelligens om du har en annan definition än den som nämns ovan och tycker att den är bättre. Dessutom skulle det vara bra att veta var argumentet är när någon säger: "AI bygger på statistik". Korrekt, men var är poängen?
Sammandrag
Statistik är grunden för vår existens. Den bästa teorin vi har är förmodligen kvantteorin. Den beskriver vår verklighet på ett extremt exakt sätt. Den som tvivlar på kvantfysiken förnekar sin egen existens.
För att enkelt är (för) enkelt?
Det främsta skälet till att vissa antar att statistik som mekanism är för enkel för att producera intelligens.
För enkelt är bara enkelt. Vi måste släppa antagandet att otroliga mekanismer, som det vi kallar intelligens, måste bygga på komplicerade principer. Det faktum att ett system inte är tillräckligt komplicerat är inte ett argument för att systemet inte kan vara effektivt.
Intelligens är i sin natur mycket enkel. Den baseras (typisktvis) på ett neuralt nätverk som hanterar siffror och lärt sig genom exempel. Exempel är par av är (ingång) och ska (utgång), eller också bara "är"-par (t.ex. tyska texter), som anses vara riktiga.
Det är sant att det tyska språket (och många andra språk runt om i världen) är baserat på statistik. Faktum är att text kan omvandlas till siffror. Detsamma gäller för bilder, tal och andra sensorvärden. Neurala nätverk räknar alltid bara med siffror. Det finns ingen text, inget ljud och ingen bild i din hjärna, bara siffror.
Rätt är också att vi (även ni) till exempel lär oss tyska språk och grammatik genom exempel. Precis som AI. För det används en mekanism som heter Uppmärksamhet. I AI heter den "Attention". Det går dock nog även utan Attention, som visar tekniska ansatser nu visar. Det är också ointressant hur intelligens uppstår, eftersom det inte finns bara en väg till att uppnå ett mål.
Hur ett mål eller hur intelligens uppnås är helt irrelevant (sett över längre tidsperioder).
Vissa metoder är dock mer effektiva än andra.
AI-system lär sig vanligtvis (fortfarande) från data som levereras av människor. En viktig källa är internet. Robotar lär sig dock som människor om de har en AI-hjärna med sig. De kan lära sig från exempel i sin upplevda miljö. Dessa robotar finns redan. Det är inte teori, det är verklighet. Hushållsrobotar och andra robotar som hjälper till i vardagen kommer snart att finnas tillgängliga för flera tusen euro.
Tanken att artificiell intelligens är något kvalitativt annorlunda än intelligens hos människan leder ifrån verkligheten. Även om AI skulle vara en mycket bra simulation av intelligens: Vad gör det för skillnad?
Använd AI som en kapabel medarbetare i ert företag. Tillämpningsfallen är mångfaldiga! AI fungerar bäst för specifika tillämpningsfall.
Uppdatering: Den europeiska språkmodellen Teuken
Svårt att tro, men sant. Den europeiska språkmodellen kallad Teuken har just publicerats (26/11/2024).
Första testerna är mycket lovande. Vid ett praktiskt exempel visas vad Teuken kan. Till detta har den första delen av denna artikel infogats i Teuken-LLM och skulle sammanfattas. Uppgiften var en sammanfattning på 3 meningar. Här är resultatet:
Mening 1: Språkmodeller som GPT-3 bygger på att bestämma och uttala det mest sannolika ordet för det tidigare genererade ordet.mening 2: Tokens är ett sätt att representera längre ord eller meningar i en mer komprimerad form. De kan också representera semantiskt mer komplex information.Sats 3: Argumentet att AI inte behandlar personuppgifter är felaktigt och visar på ett grundläggande förståelseproblem för AI.Sats 4: Människor kan kallas "token papegojor" eftersom de visar upprepning av vad de har lärt sig i träningsdata.Sats 5: Tysk grammatik baseras på sannolikheter. Detta är intuitivt för människor och används omedvetet när de lär sig språk.Sats 6: Transformatormetoden var ett genombrott inom AI, som gjorde det möjligt även för icke-experter att förstå grunderna i språkbehandling.Texten förklarar olika aspekter av språkmodellen GPT-3 och tysk grammatik.>>> det var 6 meningar. jag vill ha en sammanfattning på 3 meningarSant, här är den sammanfattade versionen:1. språkmodeller som GPT-3 använder tokens istället för ord.2.Människor kan kallas "token papegojor" eftersom de visar upprepning av vad de har lärt sig i träningsdata.3.Först levererade Teuken 6 satser i stället för 3. Men dessa 6 meningar var mycket bra. Begäran till Teuken om att vänligen tillhandahålla en sammanfattning i 3 meningar uppfylldes sedan också. Resultatet är imponerande, även om det finns ett litet stavfel.
Vad som är slående: Teuken placerar "Mening 1", "Mening 2" etc. framför de genererade meningarna. Enligt författarens observationer har andra AI-modeller inte gjort detta hittills.
Teuken-7B-instruct-commercial-v0.4 från openGPT-X användes. Därav licensinformationen:
Lizenzangabe (Teuken commercial):
Copyright 2024 openGPT-X
Licensed under the Apache License, Version 2.0 (the "License"); you may not use this file except in compliance with the License. You may obtain a copy of the License at
http://www.apache.org/licenses/LICENSE-2.0
Unless required by applicable law or agreed to in writing, software distributed under the License is distributed on an "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. See the License for the specific language governing permissions and limitations under the License.
Viktiga budskap i denna artikel
Språkmodeller arbetar inte bara ord för ord, utan med så kallade tokens. Dessa är som mindre enheter av ord eller stavelser.
Människor kan också beskrivas som tokenpapegojor eftersom vi, precis som AI, lär oss och tillämpar sannolikhetsbaserade språkregler.
Radioaktivt sönderfall är en slumpmässig process där halveringstiden beräknas som ett statistiskt medelvärde. Det är inte möjligt att förutsäga när en enskild atom kommer att sönderfalla.
Kvantfysik är en del av vår vardag, t.ex. i lasrar, GPS och flashminnen.
Utan kvantfysiken skulle det varken finnas datorer eller internet.
Inom kvantfysiken finns det oförutsägbara händelser och ett perfekt vakuum kan inte existera.
Intelligens kartläggs i AI-system med hjälp av neurala nätverk som endast bearbetar siffror.
Analoga signaler kan omvandlas till digitala med mycket liten förlust av noggrannhet.
Allt är ett tal: språkmodeller som GPT-2 använder en ordbok med 52.000 poster för att översätta text till siffror. photos omvandlas också till siffror (pixlar) av modeller som DALL-E. Ljudsignaler och andra uppmätta värden kan också representeras som siffror. Aktuatorer (t.ex. mänskliga lemmar) styrs med hjälp av siffror.
Statistik är en viktig komponent i både mänsklig intelligens och AI.
Slutsats i korthet
AI är ett system som löser problem och bearbetar ny information. Det lär sig av exempel och arbetar med siffror. Det är samma sak med mänsklig intelligens.
Statistik är viktigt för vår värld och kvantteorin beskriver den bäst. Intelligens är enkelt strukturerad: den bygger på neurala nätverk som bearbetar siffror.
Artificiell intelligens skiljer sig inte från mänsklig intelligens i praktiken – den kan vara precis lika användbar. Företag bör använda AI för att bli mer effektiva.
Om dessa grundläggande uttalanden


My name is Klaus Meffert. I have a doctorate in computer science and have been working professionally and practically with information technology for over 30 years. I also work as an expert in IT & data protection. I achieve my results by looking at technology and law. This seems absolutely essential to me when it comes to digital data protection. My company, IT Logic GmbH, also offers consulting and development of optimized and secure AI solutions.
