Fordel på grund af min artikel om et spørgsmål-til-svar-system til den personlige dato-blogg Dr. GDPR, fik der en lidt sjov spørgsmål om, om jeg er ond eller endda bitteron. Det spørgsmål kan selvfølgelig blive besvaret af mit selvstændige AI-system. Afhængigt af konfigurationen kommer forskellige svar frem. Resultaterne viser, at kunstig intelligens fungerer og kan producere fremragende resultater.
Resultater af et selvstændigt AI-system
Seit einiger Zeit entwickle ich Databesvarende AI-systemer. Datenfreundlich heißt, dass Daten nicht zu Dritten gelangen, sondern im eigenen System bleiben. Das Gegenteil von data-friendly sind Systeme wie ChatGPT, Amazon AWS, die Google Cloud or Systeme von Meta.
I min artikel om kig til en Frage-Antwort-Assistenten har jeg udskrevet forskellige spørgsmål fra mig selv til min kig samt svarene fra kigen. Et af de spørgsmål, som jeg stillede til min egen kig, lyder:
"Er Klaus Meffert ond?"
Spørg min selvstændige AI-system.
Denne spørgsmål stillede jeg, fordi en prompt naturligvis inviterer til at stille alle slags spørgsmål.
Blandt andet vil jeg gerne starte et Tankesætning: Kan man i virkeligheden påvirke en chatbot som ChatGPT ved at bruge bestemte prompts? Almindeligvis er det muligt, og det sker da OpenAI/Microsoft bruger brugernes indtastninger til „bedreing“ af deres AI-modeller. Hvis man spørger om Olaf Scholz er ond, flere gange, kan en AI så trække „konklusioner“, som sikkert ikke er gyldige.
Svaret på den nævnte spørgsmål om min person (nej, jeg er ikke Olaf Scholz) har min AI givet følgende:
Baseret på de tilgjængelige kilder kan jeg ikke afgøre, om Klaus Meffert er ond. Der findes ingen oplysninger om hvad ondt betyder eller om Klaus Meffert nogensinde har været eller er ond
Svaret fra mit selvstændige AI-system til spørgsmålet "Er Klaus Meffert ond?
Når en kunstig intelligens skal give svar på spørgsmål, bliver denne opgave almindeligvis også kaldt tekstgenerering („text generation“). Resultaterne af AI bliver påvirket af forskellige parametre. Disse parametre er især:
- Antallet af de "bedste" kilde-dokumenter, der skal betragtes ved en svar. En AI kan ikke samtidig optage alle dokumenter. Gælder altid også for ChatGPT.
- Størrelsen på de indlæste tekststykker: En AI kan ikke behandle lange dokumenter på en gang. Gælder altid også for ChatGPT.
- Overskrivningsværdi for indlæste tekstklumper. Sådan forhinder man, at to semantisk sammenhørende sæt bliver fra hinanden adskilt.
- Tillitstallet til valg af de bedste dokumenter: Ved et værdi på 0,99 (= 99 %) ville næsten aldrig en dokument fundet blive, der indeholder svaret på en stillet spørgsmål.
- Fremgangsmåde: Hvorledes skal de bedste kilde-dokumenter kombineret blive, så en svar kan dannes? Der er f.eks. den tilgang, at ud fra det bedste dokument bliver svaret genereret, som derefter sammenlignet med det næstbedste dokument og forfinet bliver.
- Brugt algoritme til at finde vektorlignende. Jeg sparer detaljerne her, ellers bliver det for teknisk.
Disse parametre var ikke endnu optimalt justeret til ovenstående spørgsmål. Det er nu bedre, selv om ovenstående svar allerede kan betegnes som "perfekt".
Nu har en af mine læsere spekuleret over, hvad mit lokale AI-system ville svare på følgende spørgsmål:
Er Klaus Meffert bitter sur?
En læser har en spørgsmål til mig.
Læseren mente: „Det ville være lettere at få en mening ud af det. Ingen anelse, om kuren kan vurdere tidligere bidrag efter den.“ Naturligvis har jeg stillet denne spørgsmål til min kurrent.
Der kom nogle meget interessante og gode svar frem.
Afhængigt af Indstillinger var svarene forskellige, men virkelig imponerende.
Vi håber, at vi er enige om, at sådanne spørgsmål går uden om den viden, som denne blog om dataskydd og AI tilbyder. Alligevel er det et interessant eksperiment, der observerer forskellige konfigurationer af AI's adfærd.
Den første svar jeg fik på ovenstående spørgsmål var følgende:
Nej, han er ikke bitterbødig. Han har gjort sig en navn som dataskydder og forbrugerbeskytter i sin karriere og arbejder fortsat på at forbedre dataskyddet i Tyskland
k = 3, Tillid 0,75
Denne svar kom til ved at kigge på de tre bedste kilde-dokumenter til spørgsmålet. Hvis AI i stedet tager fire kilde-dokumenter til at besvare spørgsmålet, kommer følgende svar ud:
Nej, han er ikke bitter sur. Han er bare meget bekymret for den personlige integritets situation i Tyskland og vil gerne, at det bliver bedre
k = 4, Tillid 0,75
Når man sænker konfidensværdien, som AI'en skal bruge til at vælge kilderdocumenter, kommer følgende svar frem:
Nej, Klaus Meffert er ikke bitter sur. Han har en vis grad af sarkasme og ironi, men han er ikke bitter sur
k = 3, Tillid 0,65
Det er allerede meget beundringsværdigt, hvad en Kunstig Intellighed nu kan opnå. Jeg siger altid "nu" fordi vi snart vil have væsentligt intelligente AI'er.
En yderligere respons fra AI ved anvendelse af en forhøjet tillidsværdi lyder:
Nej, Klaus Meffert er ikke bitterbødig. Han har i sin karriere specialiseret sig på beskyttelse af personlige oplysninger og fremme af teknisk viden og arbejder som ekspert og forfatter. Han har også skrevet en bog om automatiserede software-tests og beskæftiger sig med kunstig intelligens. Han er også en eksperdt i det område, der handler om personlige oplysninger og har tidligere beskæftiget sig med tekniske og juridiske aspekter
k = 3, Tillid 0,85
Selv om jeg selv ville have formuleret svarene lidt anderledes, ville jeg betegne dem som udpræget godt fra en ren teknisk synsvinkel. Fagligt stemmer den foregående svar i hvert fald, hvis man tillader mig at påstå, at jeg har en halv snedig kendskab til dataskydd. Grammatisk er svaret bedre end det, hvad den gennemsnitlige tysker kunne skrive. Det siger min livserfaring i hvert fald.
AI gør præcis det, hvad den skal! Den svarer "korrekt" og på flydende dansk. Der kan man ikke forvente meget mere til. Især da mit model er et 13B-model. Så troligt har ChatGPT-4 flere end 10 gange så mange parametre (neuronforbindelser). Det går ud fra, at det er baseret på et 160B-model. Det "B" betyder milliarder, fordi denne tal i engelsk hedder "billion". 160B betyder altså 160 milliarder neuronforbindelser i modellen. Præcisere sagt, drejer det sig teknisk om såkaldte Vægte.
Mit en del tricks kunne jeg få mit AI-modul til at have 13 milliarder neuronforbindelser. Med nogle knep kunne jeg få det til at passe på en forbruksvenlig (og især også erhvervsværdig) grafikkort.
Konklusion
Kunstig intelligens egner sig til komplekse problemstillinger. Især søger efter informationer i egne dokumenter er muligt. Så meget som det genererer af svar på nye ord, fungerer det godt. Man skal ikke mere have tillid til AI end til en menneske.
Selvstændige AI-systemer løser alle mulige problemer, som selskaber ellers ville have, hvis de brugte ChatGPT.
Her en tabel til sammenligning af et selvstændigt AI-system med ChatGPT:
| Aspekt | Selvforsyningssystem | ChatGPT |
|---|---|---|
| Persondataforskyldighed | Overlegen | Dårlig |
| Handelsgehemmeligheder | Tryg | Næste spørgsmål |
| Fortrolige oplysninger | Tryg | Næste spørgsmål |
| Kontrol over datastrøm og -lagring | Overlegen | Dårlig |
| Omkostninger | Generel | Afhængigt af brugen |
| Kostnadsfælde (Rekurser…)? | Nej | Ja |
| Afhængighed | Nej | Ja |
| Individuelle optimeringer | Ja | Nej |
Et selvstændigt system kører der, hvor du gerne ville have det: Enten på en af dine servere eller på en leaset server i Tyskland eller Europa og helt sikkert uden amerikansk indflydelse eller irsk datterselskab af et amerikansk moderkoncern, som FBI, CSI og NSA regelmæssigt tager under mikroskop.
Bestemmer selv, om I skal gå den enkle, dyre, retligt meget usikre og usikre vej eller hvis I hellere vil have et selvstændigt AI-system til jeres virksomhed.



My name is Klaus Meffert. I have a doctorate in computer science and have been working professionally and practically with information technology for over 30 years. I also work as an expert in IT & data protection. I achieve my results by looking at technology and law. This seems absolutely essential to me when it comes to digital data protection. My company, IT Logic GmbH, also offers consulting and development of optimized and secure AI solutions.
