Hvordan fungerer kunstig intelligens (AI) grundlæggende set?

KI-systemer som ChatGPT er baseret på kunstige neurale netværk, der efterligner menneskelige hjerner. Disse netværk behandler information i rækker af tal (vektorer) og bruger beregninger til at løse opgaver.

Hvilken rolle spiller grafikkort (GPUs) i AI?

GPU'er er spiller en afgørende rolle i AI-applikationer, da de er særligt velegnede til den parallelle udførelse af beregninger, der anvendes i AI-algoritmer. De muliggør en markant hurtigere behandling sammenlignet med traditionelle CPU'er.

Hvordan fungerer billedgeneratorer som DALL-E eller Midjourney?

Disse generatorer arbejder med vektorer, der repræsenterer billeder, tekst eller videoer. De sammenligner disse vektorer for at skabe nye billeder eller videoer baseret på de indførte oplysninger.

Hvilke udfordringer er der ved beregningen af AI-modeller?

Beregningen af modeller som BloombergGPT kræver enorme mængder computerkraft, f.eks. via 512 kraftfulde grafikkort med hver 40 GB grafikkortshukommelse. Dette medfører høje omkostninger og udgør en betydelig teknisk udfordring.

Hvad er LAION 5B datasættet?

LAION 5B-datasettet er en globalt populær database, der er samlet af LAION og indeholder over 5 milliarder billeder. Disse billeder er blevet downloadet fra offentligt tilgængelige kilder og bruges til AI-billedapplikationer.

Hvilke juridiske aspekter er relevante i forbindelse med AI-genererede billeder?

KI-genererede billeder er underlagt både ophavsret og databeskyttelsesforordningen, da de indebærer en automatiseret behandling af personfølsomme data (såsom billeder). Det er afgørende at overholde de juridiske rammer for at undgå krænkelser af ophavsret og databeskyttelsesproblemer.

Hvordan reagerer LAION på en anmodning om sletning fra fotografer?

LAION svarer ofte på sletkrav fra fotografer med en regning og et krav om erstatning, da den midlertidige lagring og analyse af billeder anses for at være tilladelig og der ikke er sket en umiddelbar krænkelse af ophavsretten.

Hvorfor er det fordelagtigt at bruge offentligt tilgængelige data i AI-applikationer?

Brug af offentligt tilgængelige data minimerer juridiske risici, da de er frit tilgængelige og ikke indeholder personfølsomme data. Det er vigtigt at undgå brugerdata, da disse kan indeholde følsomme oplysninger.

Kunstig intelligens: tekniske og retlige grundlag

Hvordan fungerer kunstig intelligens (AI) og hvorfor er AI nu revolutionær og verdensomspændende? Hvilke retlige betingelser gælder for behandlingen af store datamængder til at træne et elektronisk hoved? Og hvordan ser det ud med lagringen af brugerinput og udsendelsen af billeder og tekster? Uddrag fra en af mine foredrag.

Indledning

Der, der ikke meget om AI forstår, bruger ofte begreber som ChatGPT som en placeholder, for at virke interessant. Mange mener, ChatGPT er en søgemaskine. Spoiler: Det er fuldstændig latterlig. ChatGPT har en efter nutidens målestok uralden database. Det er intention og ønsket. Fordi ChatGPT tjener som svarmaskine og ikke til at finde aktuel viden.

Den, der har mere forståelse af kunstig intelligens og havde Aktienmarkedet i blikket, købte Nvidia-aktier for nogen tid siden og kunne siden da se en gigantisk kursstigning. Fordi Nvidia er producenten af grafikkortene, der anses som de absolutte topplaceringer, når det kommer til AI-anvendelser.

Jeg siger markedets fald i sin nuværende form forud, fordi snart hverken kan nogen foretage sig prædiktioner om aktiekurser med en sandsynlighed på mere end 50 %.
Min teori sammen med antagelsen, at det selv vil lykkes mig snart.

Hvad ligger i det? Ganske enkelt: En Grafikskærm som Nvidia Geforce RTX 3070 har 5888 kerne i sin GPU. Den GPU er den processeur af grafikkortet. I modsætning til det står CPU, den klassiske processeur af et computer. Godtgående Intel-processeure har 10 eller en håndfuld flere kerne.

En Intel-kern er matematiske ligesom en Albert Einstein (der som fysiker kunne regne meget godt). En Nvidia GPU-kern er en middelmådig matematiker. AI-algoritmer bygger tilfældigvis på beregningsoperationer, der særligt godt kan udføres på grafikkort-procesorer (GPUs). Mens den Albert Einstein-kern en multiplikation spillelegende let gennemfører og langt om længe bliver ked af det, er den GPU-matematiker stærkt belastet, men kommer næsten lige så hurtigt tilbage med denne lette beregningsoperation.

5888 parallel arbejdende gennemsnitsmatematikere ville kræve langt færre timer til at udføre, siger f.eks. 100.000 enkle multiplikationer end hvad 10 samtidigt rasende Einsteins ville kunne. Mens den PC med en grafikkort allerede er færdig med K-beregningerne, mente man, at den PC kun med Intel skulle være blevet hængende. Man må regne med en opgradering af grafikkortets ydeevne på 50 eller flere faktorer. Grafikkortet bruges ikke til at vise billeder eller videoer eller spil, men blot til at beregne. Det kan også høres i den store ventilator på grafikkortet, der kan overtrumfe enhver PC-ventilator.

Samtidig med at CPU'en i Villariba stadig var varm og kun 20 procent af varerne var pakket, glimtede hele Villabaj allerede.
Undskynd, at jeg må sammenligne med disse to fiktive landsbyer, som er kendt fra reklame og hvor der er mere kendt end om aktuelle AI-algoritmer.

Den grafikprocesseur gør allerede en meget stor forskel ved algoritmer, der gerne 10 dage i træk skal trænes til mere krævende opgaver eller, der for at producere et billede tager 10 sekunder på en GPU, men 8 minutter på en – gähn- CPU. Sikkert har I allerede hørt om DALL-E eller Midjourney og ved, at I ikke skal vente 10 minutter på et billede.

Funktionering af en moderne AI

Systemer for kunstig intelligens som ChatGPT bygger på künstlige neurale net. Et neuralt net findes også i menneskehovedet/ hjernen. Det fungerer lidt sådan:

Menneskets grundlæggende funktionsevne. (billedet blev automatisk oversat).

Dargestellt er den måde, på hvilken mennesker behandler informationer og hvordan intelligens opstår. Præcis så meget som man kan se i billedet, forstår vi ikke, hvorfor der overhovedet er intelligens. Jeg påstår, at vi ved intet om det, men blot undrer os over, hvordan neuroner med deres forbindelser er i stand til at opstå til noget sådant som intelligens. Spoiler: Det har ikke noget med Gud at gøre, som jeg snart vil vise.

I det ovenstående billede ses til venstre en række af Umwelteinflüster, altså signaler. Det kan være lyde, toner, stillbilleder, film, lugt, luftbevægelse osv. Fledhøns kender jo også ultralyd meget godt. I midten kommer vores hjerne, der tager alle disse signaler til sig og behandler dem. Til højre ses det neuronale net, hvor signalerne behandles og gemmes.

Et Nervecelle ligner en simpel procesorkern. Mellem neuronernes eksisterer forbindelser, og der er i alt meget mange. Der er mange milliarder af dem. Hvis et neuron skriger, altså er aktivt, bliver det bestemt ved aktionspotentialet, som oprettes af andre forbundne neuroner til et mål-neuron.

Nu kommer vi til tekniske realisering af nutidige AI-algoritmer.

Struktur af en moderne AI-algoritme. (billedet blev automatisk oversat).

Ligninger i billedet ser du det samme som ovenover hos mennesket.

I midten ser du det elektriske hjerne, oppe var det menneskeligt.

Til højre i billedet ser du det neurale netværk i digital form, der hos mennesket er biologisk og således mere analog.

Så langt, så godt. Men det går endnu bedre. Elektroniske hjerter omvandler takket være den Transformer-metode (bekendt siden 2017) alle signaler til rækker af tal, vektorer kaldet. Præcis ligeså gør det menneskelige hjerne. I hvert fald er det kvalitativt det samme. At der i den almindelige implementering af biologi og elektronik er fine forskelle, er næsten uden betydning og sørger kun for en mulig opgradering af biologiens ydeevne overfor elektronikken. Sikkert kender du Moores lov: Alle 12 til 24 måneder dobles den beregningskraft af en processor, ofte sammen med faldende pris. Dermed er vinderen i henseende til ydeevne maskinen, og det fra nu af (ca. år 2023).

AI er en revolutionær ting

Disse vektorer, dvs. talserier, der repræsenterer billeder, tekster eller videoer eller hvad som helst andet, kan nu sammenlignes. Nu kan således tekster sammenlignes med tekster, billeder med billeder, videoer med videoer, tekster med billeder, billeder med videoer, tekster og lydsignaler med billeder eller videoer osv. Nu ved I, hvordan billedgeneratore som Dall-E eller Midjourney fungerer. Nu ved I, at dette kan schnellstens og einfachstens tidligere eksklusive anvendelser såsom SoundHound, der kan identificere musiknumre efter få sekunder, programmeres.

At det går hurtigt og enkelt til at skrive fantastiske programmer, har jeg selv bevist:

Tidsskrift til min podcast: Lyd til tekst, i usædvanligt god kvalitet. For 30 minutters tale kommer automatisk et transkript frem, der er genereret af en AI, hvor jeg måske kun skal korrigere fem ord manuelt. Sætter og ukendte ord som "alles tutti", "Hömmele" (yes, det hedder så!) eller "Megafail fra Microsoft, der havde et Twitter-AI-Tool" bliver let anerkendt.
Opgørelse af videoer fra et billed- og lyd-input: Mit to-dimensionale billede i meget dårlig kvalitet plus en stemme af en amerikansk præsident som den eneste indgang giver mit tre-dimensionale animerede hoved og min mund, der bevæger sig synkron med stemmen som videoanimation.
image generator: Bekendt fra andre anvendelser. Det gør dog en forskel, hvis tekniker ved, om man i en Microsoft-cloud, Dall-E eller et andet sted lader beregne noget eller på et lokal system. Forskellene er nemlig: Lokalt betaler jeg intet. I cloud kan jeg ved fejlprogrammering i en måned af uheld 100.000 kr. ødelægge (eksempel: uforsigtig uendelig recursive opkald). Lokalt har jeg fuld kontrol over alle data. Ved Microsoft og Google hjælper også at bede intet, men i stedet et bedøvelsesmiddel eller ren alkohol, for at glemme bekymringerne med de datakrabber en kort tid eller helt afstande hovedet fra forstanden.
Objektigenkendelse: Hvilke objekter kan man på et billede identificere? Hvad er konturerne af hver enkelt objekt? Hvad hedder det ene eller det andet objekt? Fx "Marker alle teekopper på billedet" eller "Find billeder, hvor to eller flere mennesker diskuterer i et kontor og sidder på stole" eller "Erstat ansigtet på billedet med Norman Reedus" min doppelgänger, siger mange…).
Semantiske søgning: I stedet for at søge efter søger man nu over naturligt sprog eller sammenligner hele dokumenter med hinanden.

Jeg har engang ladet en del tusind billeder på min computer til at beregne. Her er resultatet i form af et mosaik (hvert mosaiksten er i virkeligheden et billede med en opløsning på 512 x 512 billedpunkter):

Et mosaik af ca. 400 billeder, hvor hver enkelt blev genereret på min lokale hardware ved hjælp af en AI. Billederne er blevet forstoringsfrit mindsket til at reducere lasttid. (billedet blev automatisk oversat).

Billederne fra mosaikken blev oprettet ved hjælp af en AI-beregning. Billederne fra to kunstnere, som jeg kender godt, er blandet sammen. Artskiferie er her endnu ikke optimal, fordi det var første forsøg. Det går meget bedre, som jeg opdagede en dag senere. Noget, der på AI-markedet kan være en halv evighed, er for nogle dataskyddsmyndigheder blot en enhed i tiden, som de ikke kender (Hvad er en dag? Nogle myndigheder kender kun tidsperspektiverne "år", "århundrede" og "aldrig"?)

Lokale systemer som løsning

Som netop er vist, kan mange krævende beregninger udføres på egne computere. Beder jer venligst ikke igen at skynde jer til Microsoft, AWS eller Google, blot fordi nogen ønsker at spille Bullshit Bingo og med engelske ord og mærkenavne om sig selv, for at skjule sin manglende viden.

Den der nu stadig køber en Cloud-Tjeneste til hver lille problem, er et elendigt menneske og har mindre fornemmelse af AI end om dataskydd og internetapplikationer. Det ville ikke være så slemt, hvis man ikke skulle vide alt om det. Men de forkerte rådgivere er dårlige.

En AI er ikke egnet til præcise udtalelser. Den er lige så pålidelig som en overgående intelligent menneske.

Nogle problemer er dog så komplekse, at de ikke kan løses på almindelig hardware. Eksempelvis ChatGPT Version 4. Dette system findes ikke engang som Open-Source, så ingen kan komme i tanker om at gøre det hele rigtigt.

Nogle er dog så fornuftige og kasser ikke deres Handelsgehemmeligheder ind i en chatbot fra Microsoft eller Google. Jeg har ingen interesse i at have noget med nogen, som gør det.

Som et særligt plastisk eksempel på regnearbejde kan BloombergGPT nævnes. Det er en Large Language Model (LLM) fra den finansielle sender Bloomberg. Den er så kraftfuld, at det krævede 1,3 millioner regnearbejds timer, før modellen var færdig beregnet. Et modell er et elektronisk hoved.

Bloomberg-hjernen var dog allerede efter 148 rechningsår færdig, fordi 512 af de mest avancerede grafikkort med hver 40 GB grafikminde (IKKE: computerens hovedminde) blev beskæftiget. Hvert eneste af disse 512 grafikkort koster ca. 14.000 euro. Den, der ønsker at opgraderer sin PC fra 16 til 32 GB RAM, betaler selv ud af lommen. Den, der ønsker at forøge sin grafikkartes lagring fra 8 til 16 GB, skal betale en formue (noget overdriveligt).

Juridiske overvejelser

Jeg begrænser mig i hovedsagen til nogle få punkter, som jeg har taget fra Rechtsanwalts Jonas Breyers uddybelse bekannt vorkommen kunne være (Stichwort: „IP-adresser er personlige oplysninger“).

Ophavsret

Onkel og ond på samme tid for os alle, når det kommer til AI. Der er risiko for, at Europa bliver verdensmester i regulering. Så vil der være få virksomheder i Europa, som kan lykkes med AI i visse områder (billedbehandling?). I stedet køber vi så hos vennerne over på den anden side af Atlanten, de gør, hvad de vil, men bliver ikke straffet.

Hovedpræmisser: Hva jeg som menneske må og ikke må, må en AI lige så meget eller lidt.

Et billede fra hovedet efter at have malet er mennesker lige så tilladt som en kI. Hvis resultatet har for meget tilfælles med et værk, der er beskyttet af ophavsret, er det ikke tilladt. Sådanne beskyttede værker er næsten alle billeder eller billeder, hvor ikke kun et firkant eller cirkel ses.

Desuden er det ifølge § 44b UrhG tilladt at lagre værker fra andre i kort tid, for at kunne analysere disse efter mønstre. Præcis det gør AI som regel.

Sagen om LAION

Her kommer vi til sagen LAION e.V., en tysk forening, der er blevet anklaget af en tysk fotograf. LAION har samlet og offentliggjort over 5 milliarder billeder i et træningsmateriale for AI-billedeapplikationer. Materiet indeholder kun links til de offentligt tilgængelige oprindelige billeder.

LAION 5B-datasettet er verdensomspændende og grundlaget for hver anden billedergenerering, som har noget værdi.
Min egen observation efter at have undersøgt en række Stable Diffusion-algoritmer.

LAION havde downloadet og brugt disse billeder til at beregne et elektronisk hjerne. Efterfølgende har LAION ifølge deres egen udtalelse slettet billederne igen. Med hjernen kan så billeder som ovenstående eller det følgende beregnes.

Daryl Dixon i origamistil, genereret af en AI på min lokale computer.

En fotograf har nu fundet nogle af sine billeder igen i LAIOn-databasen. Som sagt, kun de linkede billeder og ikke de originale. Fotografen krævede fra LAION at slette hans materiale fra træningsdataene. Det, der præcis er meningen med det, kunne jeg endnu ikke finde ud af. Måske handler det om, at fotografens billeder skal slettes fra det elektriske hjernecelle.

Her er LAION billed-databasen som schema og med originaloplysninger (uddrag):

Billedet til venstre nede kommer fra https://www.outdoorphotographer.com/images/gallery/full/131/417131.jpg (billede og domæne ikke længere tilgængelig siden 30.07.2023). Billedet til højre nede er genereret herfra og nyttigt. (billedet blev automatisk oversat).

Spørgsmålet er nu, om LAION skal slette erkendelserne fra kortlagte og analyserede billeder senere eller ej. LAION mener "nej" og har sendt fotografen en advokatregning med krav på skadeerstatning i omfang af ca. 850 euro som svar på hans opfordring til sletning.

Persondataskaberecht

Persondata underlægger beskyttelse af GDPR. AI-applikationer kræver altid en automatiseret behandling. Derfor underlægger de altid GDPR, hvis persondata er involveret i spillet.

Personlige sager kan ikke kun være tekst, men også billeder. Jeg synes, at offentlige oplysninger kun har en meget lille eller ingen væsentlig privatlivssag. Falske påstande, der er genereret af en AI, har først og fremmest ikke noget med privatlivssagen at gøre. Også ophavsretten er noget andet end privatlivssagen.

Så ser jeg den personlige integritet som underordnet problem, når det drejer sig om AI-anvendelser. Den har her sin meget gode ret og forhinder ikke, men beskytter. Andre ser jeg det mere ved ophavsret eller varemærkeretten.

Andre retlige bestemmelser

Varumærkeloven beskytter udtrykkeligt (§ 3 Varumærke-loven) og implisit beskyttede varumærker (§ 4 Nr. 2 Varumærke-loven o.sv.).

Der er ved ord- og billedmærker også lugtesmærker, lyde, former og måske flere.

Patent, design og nogle designs er lige så beskyttet. Selv en flaskehals kan være beskyttet.

Data Act ligger så vidt kun som en kommissionsforslag frem. Den forpligter større selskaber til at udlevere deres data, hvis nogen spørger efter dem. Det lyder mærkeligt og er det også.

Der er også en kommissionsforslag til en AI-ordning. I spørgsmålet står, om der skal være en bevisbyrdskendelse, hvis nogen bruger et AI-oprettet værk. Var dette værk oprettet i overensstemmelse med loven? For at bevise det ville man for eksempel ved en billedgenerator skulle gemme den aktuelle tilstand af AI-systemet som backup, så man senere kunne sikre beviset. Det forhinderer AI og gør dem ikke mulige.

Regulering beskytter store virksomheder, der kan tillade sig advokater og personale til omfattende processer. Lille virksomheder bliver hermed undertrykt.

Bedre end reguleringsforslaget, som jeg for praktisk ikke finder muligt, synes jeg abschreckning og sanktionering er bedre. To ord, der er ukendte for dataskyddsmyndighederne i Hessen (og nogle dertilhørende domstole) her. Hvor parkerer færre biler forkert? Der, hvor selv på gaden at parkere med 800 kroner bliver straffet (men aldrig får et billet), eller der, hvor hver femte person, der parkerer forkert, bliver opskrevet?

Anbefalinger

Brug lokale AI-systemer. Verden kan jo være så enkel. Ingen problemer mere med Google og Microsoft. Hva' var det nu for et Privacy Shield? Er der endnu? Nej, der er ikke længere. USA er ude.

Omgående chatbots med søgemaskiner. Men man kan via en semantisk søgning, uden at bruge ChatGPT, finde hverken dokument eller billed bedre end tidligere. Uden OpenAI eller Microsoft.

Kontrollér øvelsesdata: Kun egen eller håndplukkede data er immun overfor retlige problemer. Svært, fordi AI bygger på massedata. Heldigvis findes der udveje. Det bedste ville være (almindeligvis) kun at bruge offentligt tilgængelige data, hvis det ikke er egen data.

Brugerindgaver skal ikke lagres uden grund. De kunne indeholde personlige oplysninger. Grunden skal, hvis den lagres, vælges meget omhyggeligt og legitimeres. Derfor blev ChatGPT i Italien forbudt i en kort periode.

Udgifterne, som en AI producerer, er efter formen forskellige at håndtere. Tekstudgivelser er ikke videnskabelige afhandlinger. Se f.eks. tilfældet med den newyorkanske advokat, der lod ChatGPT tildele ham 12 domme, som aldrig eksisterede. Dumt, hvis man således søger at indlægge disse resultater i retten og gør det ud for, som om det var sandheden.

Talen til dette foredrag holdt jeg på en privatlivskonference hos Deutsche Flugsicherung i slutningen af maj 2023.