Hur fungerar artificiell intelligens (AI) i grunden?

AI-system som ChatGPT bygger på artificiella neurala nätverk som efterliknar mänskliga hjärnor. Dessa nätverk bearbetar information i numeriska serier (vektorer) och använder beräkningsoperationer för att lösa uppgifter.

Vilken roll spelar grafikkort (GPUs) i AI?

GPU:er är avgörande för AI-applikationer eftersom de är särskilt väl lämpade för den parallella utförandet av beräkningsoperationer som används i AI-algoritmer. De möjliggör en betydligt snabbare bearbetning jämfört med traditionella CPU:er.

Hur fungerar bildgeneratorer som DALL-E eller Midjourney?

Dessa generator arbetar med vektorer som representerar bilder, text eller video. De jämför dessa vektorer för att skapa nya bilder eller video baserat på den angivna informationen.

Vilka utmaningar finns det med att beräkna AI-modeller?

Beräkningen av modeller som BloombergGPT kräver enorma beräkningsresurser, till exempel genom 512 kraftfulla grafikkort med vardera 40 GB grafikkortminne. Detta leder till höga kostnader och utgör en betydande teknisk utmaning.

Vad är LAION 5B-datasetet?

LAION 5B-datasetet är en globalt populär databas som sammanställts av LAION och innehåller över 5 miljarder bilder. Dessa bilder laddades ner från offentligt tillgängliga källor och används för KI-bildapplikationer.

Vilka juridiska aspekter är relevanta i samband med AI-genererade bilder?

AI-genererade bilder omfattas både av upphovsrätt och dataskydd, eftersom de innefattar en automatiserad behandling av personuppgifter (som bilder). Det är avgörande att beakta de rättsliga ramverken för att undvika upphovsrättsintrång och dataskyddsproblem.

Hur svarar LAION på en raderingsbegäran från fotografer?

LAION svarar ofta på raderingskrav från fotografer med en faktura från en advokat och en skadeståndsansökan, eftersom den kortsiktiga lagringen och analysen av bilder anses vara tillåten och det inte finns någon omedelbar kränkning av upphovsrätten.

Varför är det fördelaktigt att använda offentligt tillgängliga data i AI-applikationer?

Användningen av offentligt tillgängliga data minimerar juridiska risker eftersom de är fritt tillgängliga och inte innehåller personuppgifter. Det är viktigt att undvika användaruppgifter eftersom dessa kan innehålla känslig information.

Konstgjord intelligens: tekniska och rättsliga grunder

Hur fungerar artificiell intelligens (AI) och varför är AI nu revolutionerande och världsomspännande? Vilka rättsliga villkor gäller för behandlingen av stordata för att träna ett elektroniskt hjärn? Och hur ser det ut med lagringen av användarinput och utgivningen av bilder och texter? Utdrag från en av mina föreläsningar.

Inledning

Den som inte förstår mycket om AI, använder ofta begrepp som ChatGPT som ett ställe att fylla i, för att verka intressant. Många tror att ChatGPT är en sökmotor. Spoiler: Det är fullständigt nonsens. ChatGPT har en med dagens mått mätt uråldrig databas. Det är avsikt och valt. För det är just ChatGPT som fungerar som ett svarssystem, och inte för att hitta aktuell kunskap.

Den som förstår mer om artificiell intelligens och hade Aktienmarknaden i sikte, har köpt Nvidia-aktier på senare tid och sedan dess kunnat uppmärksamma en enorm kursökning. För Nvidia är det tillverkaren av grafikkort som anses vara absoluta toppfavoriter när det gäller artificiell intelligens-användningar.

Jag säger att aktiebörsen kommer att gå under i sin nuvarande form, eftersom snart vem som helst kan förutsäga aktiekurser med en sannolikhet på över 50%.
Min teori tillsammans med antagandet att jag själv kommer att lyckas med det snart.

Vad är orsaken till detta? Enkelt uttryckt: En Gräffarbortare som Nvidia Geforce RTX 3070 har 5888 kärnor i sin GPU. Den GPU är processorn på grafikkortet. I motsats till det står CPU, den klassiska processorn på en dator. Bästa dagens Intel-processorer har 10 eller ett par fler kärnor.

En Intel-kärna är matematiskt något som en Albert Einstein (som som fysiker kunde räkna väldigt bra). En Nvidia GPU-kärna är en medelmåttig matematiker. AI-algoritmer baserar sig slumpvis på beräkningsoperationer som särskilt väl fungerar på grafikkortsprocessorer (GPUs). Medan den Albert Einstein-kärnan utför en multiplikation med förtjusning och är halva tiden trött, är den GPU-matematikern starkt belastad men klarar av denna enkla beräkningsoperation lika snabbt.

5888 parallell arbetande genomsnittliga matematiker skulle behöva betydligt mindre tid för att utföra 100.000 enkla multiplikationer än vad 10 lika vredefulla Einsteins skulle behöva. Medan PC:n redan länge har klarat sig med K-berekeningen, trodde man att den endast Intel-drivna PC:en hade fastnat. Man kan räkna med en prestandainhickling av faktorn 50 eller mer hos grafikkortet. Grafikkortet används inte för att visa bilder eller videor eller spela spel, utan bara för beräkningar. Detta hörs också i det höga ljudet från korts ventilator, som kan övertrumma alla PC-ventilatorer.

Medan i Villariba fortfarande CPU:n är varm och bara 20 procent av varorna har packats ut, glänser allt redan i Villabaj.
Begär ni ursäkt för den saliga jämförelsen med dessa två fiktiva byar, som är kända från reklam och därmed mer känt än aktuell AI-algoritmer.

Den grafikkortet gör redan en väldigt stor skillnad vid algoritmer som för mer krävande uppgifter gärna vill 10 dagar i sträck tränas eller som för att skapa ett bild behöver 10 sekunder på en GPU men tar 8 minuter på en vanlig – suck- CPU. Säkert har ni redan hört talas om DALL-E eller Midjourney och vet att ni inte måste vänta 10 minuter på ett bild.

Funktionssättning hos en modern AI

System för artificiell intelligens som ChatGPT baserar på künstliga neuronnätverk. Ett neuronnätverk finns också i människans huvud respektive hjärna. Det fungerar ungefär så:

Mänsklig intelligens grundläggande funktion. (bilden översattes automatiskt).

Bilden visar hur människor hanterar information och hur intelligens uppstår. Nästan lika mycket som man ser i bilden förstår vi varför det överhuvudtaget finns någon intelligens alls. Jag påstår att vi vet ingenting om detta, utan bara undrar varför nerver med sina anslutningar är kapabla att få till stånd något som liknar intelligens. Spoiler: Det har ingenting med Gud att göra, som jag snart visar.

I det översta bilden syns till vänster en rad av Umwelteinflüsse, alltså signaler. Det kan vara ljud, toner, stillbilder, rörelsebilder, dofter, luftströmmar m.m. Fledermöss känner ju också ultraljud mycket bra. I mitten syns vårt hjärna, som tar in och bearbetar alla dessa signaler. Till höger syns det neuronala nätet, där signalerna bearbetas och lagras.

Ett Nervcell är jämförbart med en enkel processorkärna. Mellan neuronerna finns anslutningar, och det är många miljarder. Om ett neuron skickar ut signal, dvs är aktivt, bestäms av aktionspotentialen som från andra anslutna neuron till ett målneuron skapas.

Nu kommer vi till tekniska genomförande av dagens AI-algoritmer.

Struktur av en modern AI-algoritm. (bilden översattes automatiskt).

Länkar i bilden ser ni likadant som ovan hos människan.

I mitten ser du det elektriska hjärnan, högre upp var det människans.

I högra delen av bilden ser du det neurala nätverket i digital form, som hos människor finns på ett biologiskt och därmed mer analogt sätt.

Så långt, så likartat. Men det går ännu mer likartat. Elektronhjärnorna omvandlar tack vare transformeransatsen (bekant sedan 2017) alla signaler till rad av siffror, vektorer som kallas. Precis likadant gör det mänskliga hjärnan. I varje fall är det kvalitativt detsamma. Att det i den allmänna implementeringen av biologi och elektronik finns fina skillnader, är nästan oväsentligt och orsakar bara att biologin presterar något bättre än elektronik. Säkert känner ni till Moores lag: Varje 12-24 månader dubblar sig beräkningsförmågan hos en processor, ofta med samtidigt sjunkande pris. Därmed är prestandavinnaren maskinen, och det är nu (ca. år 2023).

Därför är AI revolutionerande

Dessa vektorer, alltså sifferuppsättningar som representerar bilder, texter eller videor eller vad det nu är, kan nu jämföras med varandra. Nu kan alltså texter jämföras med texter, bilder med bilder, videor med videor, texter med bilder, bilder med videor, texter och ljudsignaler med bilder eller videor osv. Nu vet ni hur bildgeneratörer som Dall-E eller Midjourney fungerar. Nu vet ni att detta schnellstens och einfachstens kan användas för att tidigare exklusiva tillämpningar som SoundHound, som identifierar musikstycken på några sekunder, kan programmeras.

Att det går snabbt och enkelt att programmera fantastiska program har jag själv bevisat:

Ljudtranskription av mina podcaster: Ljud till text, i oanade bra kvalitet. För 30 minuter tal kommer automatiskt ett transkript fram som är genererat med hjälp av en AI, där jag kanske måste manuellt korrigera fem ord. Satsdelar och okända ord som "allt tutti", "Hömmele" (yes, det heter så!) eller "Megafail från Microsoft, som hade ett Twitter-AI-verktyg" upptäcks lätt.
Videoinspelning från ett bild- och ljudinmatning: Mitt tvådimensionella foto i utomordentligt dålig kvalitet plus en röst av en amerikansk president som den enda ingången ger min tre dimensionella animerade huvud och min mun som rör sig synkroniserat med rösten som videoanimation.
image generator: Känd från andra tillämpningar. Men det gör en skillnad, vet tekniker om man låter något beräknas i en molnplats av Microsoft, Dall-E eller någon annan plats, eller på ett lokalt system. Skillnaderna är nämligen: Lokalt betalar jag ingenting. I molnet kan jag med fel programmering förstöra 100.000 euro på ett månad (exempel: oavsiktlig obegränsad recursive anrop). Lokalt har jag fullständig kontroll över alla data. Vid Microsoft och Google hjälper även att be till Gud ingenting, utan högst ett narkotikum eller ren alkohol för att glömma bort eller helt bli av med oron med dataskuggorna i en kort stund eller rentav helt från förståndet.
Objekterkännande: Vilka objekt finns på en bild? Vad är konturerna för varje enskilt objekt? Vad heter det objektet? Hur skulle det vara med att "markera alla teekoppar på bilden" eller "hitta bilder där två eller fler människor diskuterar i ett kontor och sitter på stolar" eller "ersätt ansiktet på bilden med Norman Reedus" mitt dubblegängare, säger många…).
Semantisk sökning: Istället för att leta efter sökord eller kryptiska SQL-kommandon söker man nu över naturliga språksatser eller jämför hela dokument med varandra.

Jag har en gång låtit några tusentals bilder beräknas på min dator. Här är resultatet i form av ett mosaik (varje mosaikkvadrat är faktiskt ett bild med upplösning 512 x 512 pixlar):

Ett mosaik av cirka 400 bilder som har genererats. Varje bild har skapats på min lokala hårdvara med hjälp av en AI. Det totala bilden har för att förbättra laddningstiden minskats i storlek. (bilden översattes automatiskt).

Bilderna i mosaiken skapades genom en AI-berechning. Bilderna från två kända konstnärer blandades ihop. Förändringars mångfald är här ännu inte optimal, eftersom det var första försöken. Det går betydligt bättre, som jag upptäckte dagen därpå. Vad som på AI-marknaden är en halv evighet är för vissa dataskyddsmyndigheter en tidsenhet de inte känner till (Vad är ett dygn? Vissa myndigheter känner bara till tidstyperna "år", "decennium" och "aldrig"?)

Lokala system som lösning

Som tidigare visats kan många krävande beräkningar utföras på egna datorer. Vänligen, var inte så snabba att springa till Microsoft, AWS eller Google bara för att någon vill spela Bullshit Bingo och med hjälp av engelska ord och märken försöker dölja sitt okunskap.

Den som nu för varje litet problem bokar en Cloud-tjänst är ett fattigt vurm och vet ännu mindre om AI än om dataskydd och internetapplikationer. Det vore inte så illa, man behöver inte veta allt. De felaktiga rådgivarna är dock dåliga.

En kognitionsvetenskaplig modell är inte lämplig för exakta uttalanden. Den är lika tillförlitlig som en över snitt intelligente människa.

Vissa problem är dock så komplexa att de inte kan lökas på vanlig hårdvara. Till exempel ChatGPT-version 4. Detta system finns inte ens som Open-Source, så ingen kan lockas till att göra allt rätt.

Några är dock nog tillräckligt vettiga och kastar inte sina Handelssekretess i en chattbot från Microsoft eller Google. Med dem vill jag personligen ingenting att göra.

Som ett särskilt plastiskt exempel på beräkningsinsats ska BloombergGPT nämnas. Det är en Large Language Model (LLM) från den finansiella TV-kanalen Bloomberg. Den är så kraftfull att det tog 1,3 miljoner rekenstunder innan modellen var färdigberäknad. Ett modell är ett elektroniskt hjärna.

Bloomberg-datorn var dock bara färdig efter 148 rekningsår tack vare att 512 högpresterande grafikkort med 40 GB grafikminne (inte: dators minne) användes. Varje en av dessa 512 grafikkort kostar cirka 14 000 euro. Den som vill uppgradera sin PC från 16 till 32 GB RAM betalar det ur egen ficka. Den som vill öka sin grafikkartas lagringsutrymme från 8 till 16 GB betalar ett litet förmögenhet (lite överdrivet).

Juridiska överväganden

Jag begränsar mig i huvudsak till några punkter som jag hämtat från Rechtsanwalts Jonas Breyers utläggningar. Det är ingen slump att hans efternamn kan kännas igen hos er (Stichwort: "IP-adresser är personuppgifter"). ([1])

Upphovsrätt

Bra och dåligt samtidigt för oss alla när det gäller AI. Det finns en risk att Europa blir världsmästare i regleringar. Då kommer det sannolikt att knappt något företag i Europa kan lyckas med AI i vissa områden (bildenhantering?). Istället köper vi då av amerikanarna som gör vad de vill men inte blir straffade (kan inte bli straffade).

Huvudsakliga antagande: Vad jag som människa får och inte får, får en AI lika mycket eller lite.

Att måla efter en bild som man har i huvudet är lika tillåtet för människor som för krigssystem. Om resultatet liknar ett verk som skyddas av upphovsrätt så är det inte tillåtet. Alla verk med en viss skapande nivå är skyddade, vilket gäller nästan alla bilder eller foton där man ser mer än bara ett kvadrat eller en cirkel.

Avsikten är att enligt § 44b UrhG vara tillåtet att förvara verk från andra under kort tid för att analysera dem efter mönster. Precis det gör AI vanligen.

Fallet LAION

Här kommer vi till fallet LAION e.V., en tysk förening, som har blivit stämd av en tysk fotograf. LAION har samlat ihop över 5 miljarder bilder i ett träningsmaterialet för AI-bildapplikationer och gjort det tillgängligt för allmänheten. Datamaterialet innehåller bara länken till de offentligt tillgängliga originalbilderna.

LAION 5B-datatypen är världsberömd och grund för varannan bildgenererare som faktiskt fungerar.
Min egen observation efter att ha undersökt ett antal Stable Diffusion-algoritmer.

LAION hade laddat ner dessa bilder en gång för att beräkna ett elektroniskt hjärna. Därefter har LAION, enligt egen uppgift, raderat bilderna. Med hjärnan kan sedan bilder som ovan eller nedanför denna rad beräknas.

Daryl Dixon i origamistil, genererad av en AI på min lokale dator.

En fotograf har nu hittat några av sina bilder i LAIOn-datatäcket. Som sagt, bara länken och inte originalen. Fotografen begärde att LAION skulle radera hans material från utbildningsdatan. Vad det exakt handlar om kunde jag ännu inte ta reda på. Kanske gäller det för fotografen att de insikter som härrör från hans bilder ska raderas från den elektroniska hjärnan.

Här är LAION Bild-databasen som schema och med ursprungsuppgifter (utdrag):

Bilden till vänster nedan kommer från https://www.outdoorphotographer.com/images/gallery/full/131/417131.jpg (bild och domän inte längre åtkomlig sedan den 30.07.2023). Bilden till höger nedan är genererad från detta och nyttypig. (bilden översattes automatiskt).

Frågan är nu om LAION måste radera de insikter som härrör från kortvarigt sparade och analyserade bilder eller inte. LAION menar "nej" och har svarat på fotografens begäran att radera med en advokatskilling med skadeståndskrav om cirka 850 euro.

Dataskyddslagstiftning

Personuppgifter omfattas av skyddet enligt GDPR. AI-användningar kräver alltid en automatiserad hantering. Därför omfattas de alltid av GDPR, när personuppgifter är inblandade i spelet.

Personuppgifter kan inte bara vara texter utan även bilder. Jag tycker att allmänna uppgifter har endast ett litet eller inget stort skydd för personuppgifts integritet. Falska uttalanden som genereras av en AI har ingenting med personuppgifts integriteten att göra. Även upphovsrätten är något annat än personuppgifts integriteten.

Så ser jag på dataskydd som underordnat problem, när det gäller kognitivt artificiell intelligensapplikationer. Det har här sin mycket goda giltighet och förhindrar inte, utan skyddar. Annars ser jag det mer så vid Urupphovsrätten eller varumärkesrätten.

Övriga rättsliga föreskrifter

Varumärkesrätten skyddar uttryckligen (§ 3 varumärkeslagen) och underförstått skyddade varumärken (§ 4 nr 2 varumärkeslagen o.s.v.).

Det finns även ord-, bild-, luktsignaler, ljud och former, och sannolikt några fler.

Patent, mönster och några design är lika skyddade. Även en flaskaform kan vara skyddad.

Data Act ligger för närvarande bara i kommissionens utkast. Den föreskriver att större företag ska lämna ut sina data om någon begär det. Det låter konstigt och är också det.

Det finns också en kommittédiskussion om en AI-förordning. Frågan är om det ska vara en beviskrävande omvändelse, om någon använder ett verk som har genererats av AI. Har detta verk skapats lagligt? För att bevisa detta skulle man till exempel behöva spara den aktuella statusen för AI-systemet som backup, så att man senare kan säkerställa beviset. Detta hindrar AI och gör det inte möjligt.

Regleringen skyddar stora företag som kan ta sig en rådgivare och personal för omfattande processer. Mindre företag blir därmed undertryckta.

Bättre än reglering som jag för faktiskt inte tror är möjlig, tycker jag om avskräckning och sanktionering. Två ord, som dataskyddsförvaltningar som den i Hessen (och några domstolar där) helt saknar kännedom om. Där parkerar mindre bilar fel? Där, där även på gatan parkera med 800 euro straffas (men aldrig får en biljett) eller där, där var femte som parkerar fel skrivs upp?

Rekommendationer

Använd lokala AI-system. Världen kan ju vara så enkel. Inga problem mer med Google och Microsoft. Vad var det för Privacy Shield? Finns den fortfarande? Nej, finns den inte längre. USA är ute.

Byt inte ihop ChatBots med Sökmotorer. Men man kan via en semantisk sökning, helt utan ChatGPT, hitta varje dokument eller bild bättre än tidigare. Helt utan OpenAI eller Microsoft.

Kontrollera övningsdata: Bara egna eller handplockade data är skyddade mot rättsliga problem. Svårt, eftersom AI bygger på massdata. Lyckligtvis finns det utvägar. Det bästa är att (vanligtvis) bara använda offentlig tillgängliga data om man inte har sina egna.

Användarengångar ska inte sparas utan anledning. De kan innehålla personuppgifter. Anledningen bör, om den sparades, välja och legitimeras noggrant. I själva verket förbjöds ChatGPT i Italien tillfälligt därför.

Utgifterna, som en AI producerar, är beroende på form olika att hantera. Textutgångarna är inte vetenskapliga uppsatser. Se till fallet med den newyorkiska advokaten, som lät sig underkännas 12 domar av ChatGPT, trots att de aldrig existerade. Dumm, om man sedan presenterar dessa resultat i rättssalen och påstår det som sanning.

Jag höll ett föredrag till en dataskyddskonferens hos Deutsche Flugsicherung i slutet av maj 2023.