Denne AI-showcase viser, at med åbent kildeskrifts AI-modeller kan fantastiske og hurtige resultater opnås med minimal indsats på en tilgængelig laptop. Et billede siger mere end tusind ord. Derfor er det første AI-showcase fra området af billedgenerering.
Indledning
Serien af AI-showcases her på Dr. DSGVO-bloggen begynder med billedgenerering. Følgende skal vist blive:
- Sehr gode resultater i kort tid på egen hardware
- En meget kort programmeringstid, takket være ekstremt gode open-source frameworks
- Egen laptop og ikke en desktop pc, en server eller blot et kommersielt kI-modt
- Med fuld datakontrol (alt fungerer også uden internettet)
- Brug af åbent kildeskrift AI-modeller (herunder billedgenerering, snart i showcase: tekstapplikationer, lydapplikationer osv.)
Et større, kvalitetsstærkt billede på en laptop i 1,4 sekunder oprette.
Programmeringen derfor tog 5 minutter.
Hvad fungerer godt på en laptop, fungerer endnu bedre på en server (især løber beregningen herefter endnu hurtigere).
Glem ikke dine fordomme over Open-Source, der måske kan være udenfor AI retfærdiggjort. Det er da ikke tilfældet, når det kommer til AI. Der er ingen bedre marked end Open-Source. De frie tilgængelige værktøjer er meget magtfulde og overtrumfer alt hvad der tidligere har været muligt.
Showcase'et
Til en prompt (tekstindgang) skal billeder genereres. Mange kender det fra DALL-E, Midjourney eller også fra Stable Diffusion i almindelighed.
image generatoren programmeres fra 0 til 100. Den kører på en egen laptop, der blev købt i slutningen af 2023. Laptopens operativsystem: Ubuntu (ingen Microsoft, Apple, Google eller Meta). Ubuntu er et populært operativsystem baseret på Linux. Licensomkostningerne kan nævnes hurtigt: null.
Programmet køre fuldstændigt uden internettet, efter at alle downloads til opbygning af programmet er blevet afsluttet. Selvfølgelig bliver der ikke brugt nogen service fra OpenAI, Microsoft, Google osv. Alt foregår lokal.
Formålet med dette showcase
Det skal vise, at billedgenerering i høj kvalitet med høj hastighed på egen hardware og helt uden tredjepartsservice er muligt.
Det skal også vises, at programmering inden for minutter er mulig. Tidligere tog software-projekter af denne art måneder, hvis de overhovedet var mulige. Jeg taler ud fra erfaringerne de sidste 30 år.
Der showcase skal videre demonstrere, at en hardware under "hvem kan sig selv det?" kan producere resultater i Lysehastighed.
Full optimeringsmuligheder med hensyn til ophavsret for billeder, der er genereret. Full data control Full uafhængighed.
Nogle af de karakteristika ved den præsenterede løsning.
For denne artikel blev en lille demo programmeret. Den genererer 20 billeder og måler tiden for billedets oprettelse. Som prompt blev "Albert Einstein" plus én af fire tilfældigt fastsatte stilarter (ingen anvisning, svart-hvid-anvisning osv.) anvendt. Andre prompts blev også prøvet.
Tid til demonstrationen
Tidsforbruget i alt var kortere end det, der er gået til at skrive denne artikel her. Yes, dette tekst blev manuelt skrevet. I en fremtidig AI-showcase vises, hvordan en applikation for at skrive tekster på få minutter kan programmeres og køres selvstændigt på egen hardware. Desværre for Microsoft, Google osv., der så ikke længere får adgang til dataene.
Tidens forbrug i detalje:
- Download Open-Source AI-Modell: Wenige Minuten
- Programmering Demo-Applicering: 5 Minutter
Det var det. Det skal bemærkes, at et sådant AI-model har flere gigabyte data. Ved købet af hardware anbefales der store hårddiskker. Disse hårddiskker koster ikke meget. Et terabyte er 1024 gigabyte. Den nævnte laptop har en 1,5 terabyte hårddisk. Det er stor nok til at kunne eksperimentere i nogen tid uden at skulle slette AI-modeller, der ikke længere er nødvendige.
Resultater
Den hurtigt skrevne demo-applikation har genereret 20 billeder i under 29 sekunder. Og det på en laptop. På en kvalitetsmæssig sammenlignelig desktop-computer ville det være gået to gange så hurtigt.
For hver billed blev der således brugt omkring 1,45 sekunders tid.
Hvert billede har en opløsning på 1024 × 1024 pixler. Selv mennesker uden erfaring med grafik ved, at dette er over "lille".
Her er resultaterne i brikkesammenhæng:

Et af disse billeder i detalje:

Billederne er for det meste brugbare. Enkelte få har små fejl, som fx en brille der er afbrudt. Det kunne man have rettet, men blev ikke gjort til demoformål.
Demonstrationen bruger kun halvdelen af den mulige kvalitet til at generere billeder. Kvaliteten er også ansvarlig for billedkompositionen. En højere kvalitet ville øge beregnings-tiden per billede, men også reducere ovennævnte "brillenproblem".
En endnu højere genereringskvalitet og endnu højere billedopløsning kan lige så hurtigt programmeres. Genereringshastigheden pr. billede går derefter op på ca. 7 til 10 sekunder (på mit laptop, afhængig af billedopløsningen).
AI for your company
- Powerful and optimizable
- Full data control
- Fast proof of concept
- Inexpensive
Meget høje billedopløsninger opnås jeg selv ved at opskalere billeder. Opkaldning af billedopløsningen betyder, at man øger billedets opløsning. Dette sker også med et kognitivt modell, der naturligvis igen køres på mit kognitivt laptop. Ved opskalering kan billedopløsningen fordobles eller tredobles, og det gør jeg bedre end hvad de allerbedste billedbehandlingssystemer kunne opnå ved at arbejde på den traditionelle måde.
Fordelene
De fordele blot i korte træk:
- Enhver fleksibilitet
- Maksimal optimerbarhed
- Eget aktiv tilgång i stedet for at låne af nogen anden
- Full data control
- 24 timer i døgnet drift = samme omkostninger
- Mulighed for at altid at kunne trække fordel af de nyeste teknologier
Hvis man tænker videre, kommer man til urheberretsproblemet ved billedgenereringen. Dette kan opklare med AI-Showcase. Hvert genereret billede kan automatisk undersøges på urheberretsproblemer. Ligeledes kan genererede billeder automatisk justeres i kontrast eller skærhed. Når pipeline'en er opbygget, kan den blive automatisk udvidet og kombineret med andre egne AI-pipelines.
De ovennævnte forbedringer er ikke mulige ved brug af kommercielle tjenester. Og hvis de alligevel er det, gennem efterfølgende tilgang, så ville kendskabet være til rådighed for en egen løsning. Hvorfor ikke bruge egne løsninger fra starten, som ingen kan tage fra én?
Konklusion
Resultater, der for et halvt år siden var uovertruffelige, er nu let mulige.
Virksomheder, der ønsker at være uafhængige af tredje part, får gratis strategisk anvendelige løsninger til rådighed.
Ingen skal mere bruge Midjourney eller DALL-E. Mens privatpersoner kan nyde gratis- eller billige tilbud, der kun betales med data, er denne vej ofte ikke meningsfuld for virksomheder. Enten på grund af retlige problemer, på grund af de høje omkostninger, på grund af manglende mulighed for optimering eller på grund af manglende fleksibilitet. At tale om den stadig større afhængighed siger blot ikke noget.
Der er hver uge nye åbne kilder til AI-feltet, der er bedre end noget som har været før.
Egne observationer de sidste 9 måneder.
De næste AI-showcases vil vise, at dagsene for Google eller Microsoft/OpenAI snart er tilbage. Deres produktsortiment kan i store træk erstattes af AI-tilpassede anvendelser, som selskaber selv kan køre på deres egen hardware.
Eksempelvis viser det den åbent kildekode-sprogmodel, der blev offentliggjort d. 18. april 2024 under navnet Llama 3. Modellen kører på min AI-laptop. Den behersker f.eks. logisk slutkonklusion så godt, at man kan drive effektive virksomhedsapplikationer med den, som for få måneder siden var usandsynlige.




My name is Klaus Meffert. I have a doctorate in computer science and have been working professionally and practically with information technology for over 30 years. I also work as an expert in IT & data protection. I achieve my results by looking at technology and law. This seems absolutely essential to me when it comes to digital data protection. My company, IT Logic GmbH, also offers consulting and development of optimized and secure AI solutions.
