AI är ett brinnande ämne som redan har förändrat vår vardag och kommer att förändra den betydligt mer. Många har plötsligt blivit experter på AI. Många kräver reglering av AI. Många förminskar AI och säger att AI-språkmodeller inte hanterar personuppgifter. Här följer en översikt som syftar till att klargöra missförstånden.
Inledning
AI underskattas och överskattas lika mycket. De flesta människor, ibland även jag själv, förstår inte vilka möjligheter AI-systemen erbjuder. I går såg jag igenom revolutionerande AI-ansatser som bara var okända i förra veckan. Så är det med mig som har en mycket intensiv kontakt med artificiell intelligens nästan varje dag.
Många tror att AI är en hype som redan har lagt sig tillrätta. Fel! Med transformeransatsen från 2017 har vi mänsklig intelligens kryptiserad, säger jag. Istället för att programmera ett program för att lösa ett problem måste jag bara lägga in noggra Beispel i mitt AI-system som ligger under skrivbordet. Så även ovanliga hieroglyfer har upptäckts och kryptiserats.
Från den riktiga fruktan för de negativa konsekvenserna av allt mäktigare AI-system kräver många en reglering. De säger dock inte hur.
Då finns det förnedrare, som vill profilera sig som KI-experter eller rättsliga möjliggörare. De säger andra hur de kan använda ChatGPT på ett vinstgivande sätt. Även på DSRI:s (Deutsche Stiftung für Recht und Informatik) konferens hävdades det i en presentation att KI-modeller inte behandlar personuppgifter.
Andra tröstar sig med att hänvisa till det nya informella avtalet om dataskydd mellan Europa och USA. Bara för att man nu får skicka data utan ytterligare garantier till USA, tycker vissa att all form av datahantering därmed är tillåten.
Till varje punkt följer några detaljer.
Möjligheter hos AI-system
En AI kan allt som en människa kan och ännu mycket mer. Kanske inte nu, men potentiellt (i ett visst användningsområde X) redan nästa vecka. Snart kommer robotar med AI-huvuden att gå runt i gatan och lära sig om miljön. Det kommer att vara precis lika som barn lär sig. Vem som tar platsen till föräldrarna, det kommer man att se. Det kan vara mänskliga tränare, men också andra robotar eller algoritmer.
Ett exempel på den snabba utvecklingen: AI-språkmodeller kunde bara hantera mycket få tecken i texten samtidigt. Denna textmängd kallas Kontextlängd. Före några månader hade alla de AI-språkmodeller jag känner till en kontextlängd på 1024 tecken, alltså ett kilobyte.
I veckofrekvensen ökade kontextlängden, först till 2048, sedan till 4096, sedan till 8192, sedan till 16.000 tecken, senare till 32.000 tecken. ChatGPT hävdade nyligen en kontextlängd på 128.000 tecken.
Igår hörde jag talas om en metod som redan i några månader har varit känd inom forskningen. Med den kan man bearbeta en kontextlängd på en miljard tecken (= 1.000.000.000) samtidigt. Snart räknat: tidigare = 128.000 tecken, ett ögonblick senare = 1.000.000.000 tecken. Det är en förbättring med faktorn 7800. Enkelt så.
Moore's lag gäller inte för konstig intelligens. Istället för en ständigt ökande prestation eller andra faktorer var 12 till 24 månader, sker en betydande förbättring av relevanta AI-egenskaper nästan månatligen.
Baserat på mina konkreta observationer och egna AI-programmeringar.
Ett annat exempel: Den transformeransats som nämndes tidigare har några svagheter. Den är mycket resurskrävande. Även högpresterande datorer eller grafikkort behöver några sekunder för att generera en svar på en fråga till chatboten. Varje ChatGPT-användare vet vad jag pratar om. Nu finns det en metod som ger samma svars kvalitet, men svarar åtta gånger snabbare och bara ett tredjedel av den dyra och knappa grafikkortets minneskapacitet för sina beräkningar behövs.
Om du är över 50 år gammal har jag en gott nyheter för dig: Chansen finns att du kan dö av naturliga orsaker och i fred. Alla betydligt yngre kommer att uppleva slutet på mänskligheten, eftersom AI-systemen kommer att massivt övertrumfa, underkasta eller utplåna oss. Möjligen inträffar en annan katastrof innan dess, men det handlar inte om det i den här artikeln.
Är AI bara statistik?
Frågan är irrelevanta. Det spelar ju ingen roll om människans hjärna bygger på statistiska processer. Viktig är vad som slutligen kommer ut. Tydligt är att vår hela existens baseras på statistiska processer. Jämför detta med kvantfysiken, en mycket grundläggande och effektiv teori. Kvantfysikens grundläggande princip är att beteendet hos ett litet partikel inte kan förutsagas i verkligheten. Istället kan endast en uttalande om partiklar göras när många betraktats och medelvärdet från observationerna dragits.
Det tydligt är att den tyska grammatiken bygger på att vi lär oss vilka ord som vanligen förekommer i en viss ordning och som passar ihop. Det är också statistik. Men om det pratas sällan.
Regleringen av AI
AI:s förmågor skrämmer många eller orsakar dem oro. Utifrån deras känslomässiga Hjälplöshet kräver vissa en reglering av AI-systemen. Vad exakt som menas med det, sägs oftast inte. De enda krav som har fastnat i mitt huvud är följande:
- Märkning av AI- genererade verk: photos, videor, texter…
- Öppna upp källorna som ett AI-system har tränats med
- Inget mer? Det som plötsligt faller mig in kommer inte att vara något värt att nämna
Till första punkten: geschenkt. Att märka upp verk är en bra idé, ändrar så gott som ingenting. Brottslingar kommer inte att börja märka upp sina fake-videor och fake-nyheter som künstligt genererade falska verk. Alla andra håller sig lugnt till märkningen. Därmed räddas inte mänskligheten, men man kan göra det. Nyttan är där, men det är bara ett punkuellt ingripande som kvalitativt inte uppnår mycket.
Öppna upp källorna, alltså träningsdata: Den som kräver detta har helt enkelt ingen aning om hur AI-modeller är uppbyggda. Denna begäran kommer för sent. Källorna är oftast redan kända:
- The Pile (Text)
- Common Crawl (Text)
- LAION-databasen (bilder, tysk förening!)
I dessa textdata finns särskilt Wikipedia, nyhetsidor och populära webbplatser innehåll.
Om jag säger till dig att mitt KI-modell har läst in ett kemileksikon, vad gör du då? Teoretiskt kan min KI sedan utveckla stridsgaser. I praktiken har detta redan skett, men som ett experiment av gottmöttiga forskare som hade genererat effekter med hjälp av KI och testvis tagit en "minus ett" från "en". De farorna är därför betydande.
Exempel med egen AI Meine Frage an meine AI am 01.12.2023: Berätta om specifika evenemang eller tillfällen för utgående under dagen den 02.12.2023 i närheten av Idstein (nära Wiesbaden)! Endast evenemang som äger rum inom byggnader och endast evenemang som ligger mer än 10 kilometer från Idstein. Antwort meiner AI (einige Teile weggelassen): Den 2 december 2023 äger evenemang rum i Wiesbaden och dess omgivningar, bland annat cellokonserten med Roger Morelló på Burgfestspelen i Wiesbaden samt deras Veckomarknad i Wiesbaden från kl 11:00. Alla evenemang är mer än 10 kilometer från Idstein borta. Jag har sökt efter evenemang för "imorgon" i närheten, men de måste inte ligga precis utanför min dörr (annars blir det för tråkigt/altbekant) Fyndet visar att det finns evenemang i närheten för i morgon som inte är direkt utanför min dörr. --> Uppdraget är utfört. Allt detta utan någon form av optimering, som säkerligen fortfarande är möjlig och som förmodligen ger ännu bättre resultat. Början med att programmera denna lösning (lokal språkmodell redan från början): 01.12.2023 --> Ende Programmierung: 01.12.2023

Kort sagt, måste jag avsluta här: KI kan inte regleras. En KI kan allt som en människa kan (se ovan). Hur reglerar man människor? Så länge de inte har gjort något ont, alls inte. Efter att något dåligt inträffat (tyg, mördare, terrorist, folkförförare etc.) utredes. Då är det dock för sent. Såvitt jag vet lyckades man i demokratier aldrig och lyckas nu heller inte att förbjuda en människa att tänka. En KI kan emellertid tänka snabbare, längre och (snart) bättre än en människa.
Jag tycker att frågan om en AI kan vara upphovsman till ett verk är ganska meningslös. För om jag låter min egen AI (utan vattenstämpel) skapa ett bild och sedan påstår att det är mitt eget arbete, så kommer ni inte att kunna bevisa motsatsen eller bara med största möda. Framför allt kan bilder eller musikstycken som genererats av en AI ändå bearbetas och utökas manuellt.
Bearbetar språkmodeller personuppgifter?
Yes, oft nog. Och just då och då, när
Personuppgifter förekommer i utbildningsdata eller
a) användaren använder i sin inmatning (prompt) till chattroboten personuppgifter.
Punkt a) är given för alla språkmodeller jag känner till. Se till exempel de enorma träningssätten The Pile och C4 (Collosal Cleaned Common Crawl), som används i samtliga vanliga chattrobotmodeller.
Det synes som att vissa önskar att KI-system inte hanterar personuppgifter. Verkligheten ser ut så här: KI-språkmodeller hanterar personuppgifter och sparar dessa också.
Många accepterar det och hävdar sedan att personuppgifter kunde automatiskt identifieras och anonymiseras. Det är Bullshit. Varje som hävdar detta har ingen aning om artificiell intelligens eller dataskydd. Tyvärr finns det särskilt naiva människor och organisationer som för angebli lösningar, som gör löften utan grund vad gäller anonymisering av uppgifter, även utnämner sig till en innovationspris.
Privacy Shield II (Data Privacy Framework)
Formellt är dataskyddsvärlden för överföringen av data mellan EU och USA igen i balans. Anklagelserna som ledde till domen Schrems II och den ogiltigförklarade Privacy Shield var att USA är en underrättelsestat (FISA 702, EO12333, Cloud Act). Det verkar ha diskuterats bort med Data Privacy Framework (DPF) och kommer sannolikt snart att återupprättas av EU-domstolen.
Det handlar om att personuppgifter nu kan överföras från EU till USA utan särskilda garantier. Därav drar vissa dumma människor slutsatsen eller antyder att alla datahantering i USA nu är tillåten.
Rätt är att alla behandlingar av personuppgifter enligt någon av de rättsliga grunderna från Artikel 6 (1) DSGVO måste ske. Och ja, det överförs alltid personuppgifter till ChatGPT när den ChatGPT-gränssnittet används. Den IP-adressen är en personuppgift och överförs alltid. Tyvärr håller sig OpenAI inte så bra på att följa dataskyddsförordningen, för då kan ju deras egen AI inte bli så bra. Även Microsoft som ägare av OpenAI är inte särskilt intresserade av dataskydd. Se till exempel det nya Outlook som även tar in och analyserar användarnamn och lösenord från mailkonton, samt data och korrespondens från e-posten. Och säga ingenting om de säkerhetsproblemen hos Microsoft (Azure) som Microsoft har nedtonat och inte (nu kanske?) löst.
Kemiexperter
Det är anmärkningsvärt att många med AI-artiklar har ingen eller mycket liten förståelse för teknik. AI bygger i stor utsträckning och mer än nästan alla andra framsteg på teknik. Hur kan då någon som verkligen inte förstår det eller bara lite om detta kunna göra kompetenta uttalanden?
Då finns det ChatGPT-följare, som vill tjäna pengar på att ge rekommendationer och förbättra prompts. De förstår åtminstone något om teknik, nämligen att man inte använder en datormus för att (som Scotty) tala in i musen, utan för att med den röra en peksåg på skärmen. Gäller bara för alla som ibland använder PC med sitt onödigt stora skärm och onödigt effektiv tangentbord istället för ett fullt tillräckligt litet mobil tangentbord samt skärm för människor i åldrarna med den bästa synförmågan.
Dessa ChatGPT-följare som kanske har ett litet tekniskt kunnande och vet hur man använder internet, har dock ofta till nästan alltid ingen aning om eller intresse för dataskydd.
ChatGPT är ett bra system och för opåkallade uppgifter kan man använda det med gott samvete. Men vad händer då med känsliga data?
Gränser för AI
Det är fortfarande så att särskilt språkmodeller (LLMs) ofta hallucinera, alltså ge falska uppgifter. Det kommer också att vara så, säger jag. Eller skulle ni hävda att människor inte ger falska uppgifter? Även experter säger ofta saker som de senare – med insikt – reviderar. Tydligen har mänskligheten under några miljoner år av existens inte lyckats ändra på sin osäkerhet. Varför ska det vara annorlunda för konstgjorda system?
AI kan vara säkert i många områden och till och med extremt säkert i vissa delar. Men när det gäller att sammanfatta klagomål inför domstolen förblir jag förvånad över hur man ser på AI som en lösning.
Datorvänliga kisystem
Dataskydd intresserar många företag inte. OK, då tar vi företagssekretess. Vem ger mig sitt företagssekretess? Varför inte? Om mitt namn är ChatGPT så ger ni det till mig då?
Det ska finnas dokument som har avtalats att vara konfidentiella. Många kallar det för NDA (Non Disclosure Agreement). Om du laddar upp ett sådant dokument i ChatGPT och ber chatboten om en sammanfattning, har du då redan brutit mot sekretessen? Jag säger: Yes
Det vore ännu värre om ni använder det nya Outlook för att skicka hemliga dokument. För då skulle Microsoft automatiskt få djupare insikt i detta.
Många företag förstår inte att ChatGPT kan mycket lite och mycket sämre än egna KI-system. En lösning är autarka KI-system, som tillhör ert företag. Inte bara löser det dataproblemet, eftersom ni bestämmer om data ska lämna systemet och om ja, vilka data och till vem de ska gå.
Varje dag kan jag som programmerare ladda ner nya programbibliotek för att i minuter lösa problem som tidigare skulle ha tagit år av arbete – eller varken kunnat lösas alls.
Utöver det och det är nog för många intressant kan era egna KI-systemer när som helst och utan besvär ta tillgång till er företagskunskap och svara på frågor om den. Inledningen i ett eget KI-system kunde vara en intelligent dokumenthittarsökare eller ett KI-verktyg för dataanalys. Efter dokumenthittaren kan ni smärtfritt gå över till en fråga-svar-maskin. Om ni visste vad som redan är möjligt, skulle ni njuta ännu mer av de senaste åren av era liv.
Övrigt är egna kärnartificiella system inte dyra. Vi talar inte om raketprojekt med hundratals eller tusentals personstimmars arbete. Ett första kärnartificiellt system kan snart uppföras.
Sammandrag
AI är inte en modeerskenhet utan ett tillstånd som kommer att existera ända fram till vår död. Frågan är inte om AI kommer att vara så kapabelt att vi lider av det, utan när. Denna utveckling kan inte längre hejdas.
För att stödja detta kan sägas att varje person i princip kan ladda ned och använda hela den samlade kunskapen inom AI, samt bibliotek av AI-software och modeller (= elektroniska hjärnor), på sin egen dator.
AI erbjuder möjligheter som många inte kan föreställa sig än. De kommer att betyda slutet för mänskligheten.
Hälsning till professor Schmidhuber, den tyska AI-pionjären som enligt min uppfattning såg på saken annorlunda för några månader sedan. Han ser kanske inte lika på det nu.
Regleringen skulle bara vara möjlig om varje datorinköp och varje nedladdning från internet övervakades. De upptäckter jag dagligen gör, låter mig skrämmas av de enorma möjligheter som AI erbjuder. Jag talar här om att dessa möjligheter är tillgängliga för mig som programmerare just nu och "imorgon" ännu mer. För det räcker en undersökning i relevanta källor, som jag dagligen bedriver under en timme, igår längre och till halv ett på natten, eftersom de möjligheter jag läst om och sett programkod för är så fängslande och andetagshämnande. Det var också utlösaren för detta inlägg.
Ha mycket nöje med att njuta av de senaste åren av din vanliga tillvaro!



My name is Klaus Meffert. I have a doctorate in computer science and have been working professionally and practically with information technology for over 30 years. I also work as an expert in IT & data protection. I achieve my results by looking at technology and law. This seems absolutely essential to me when it comes to digital data protection. My company, IT Logic GmbH, also offers consulting and development of optimized and secure AI solutions.
