Jak w zasadzie działa Sztuczna Inteligencja (SI)?

Systemy sztucznej inteligencji, takie jak ChatGPT, opierają się na sztucznych sieciach neuronowych, które naśladują ludzki mózg. Te sieci przetwarzają informacje w postaci ciągów numerycznych (wektorów) i wykorzystują operacje obliczeniowe do rozwiązywania zadań.

Jaką rolę odgrywają karty graficzne (GPU) w obszarze sztucznej inteligencji?

GPU są kluczowe dla aplikacji AI, ponieważ dzięki swojej architekturze szczególnie dobrze nadają się do wykonywania równoległych operacji obliczeniowych, które są używane w algorytmach AI. Umożliwiają znacznie szybszą obróbkę w porównaniu z tradycyjnymi CPU.

Jak działają generatory obrazów, takie jak DALL-E lub Midjourney?

Te generatory działają z wykorzystaniem wektorów, które reprezentują obrazy, tekst lub wideo. Porównują te wektory, aby tworzyć nowe obrazy lub wideo, na podstawie podanych informacji.

Jakie wyzwania istnieją przy obliczaniu modeli AI?

Obliczenia modeli takich jak BloombergGPT wymagają ogromnej mocy obliczeniowej, na przykład poprzez 512 potężnych kart graficznych, każda z 40 GB pamięci karty graficznej. Powoduje to wysokie koszty i stanowi znaczący wyzwanie techniczne.

Co to jest zbiór danych LAION-5B?

Zestaw danych LAION 5B to popularna na całym świecie baza danych, skomponowana przez LAION, zawierająca ponad 5 miliardów obrazów. Obrazy te zostały pobrane z publicznie dostępnych źródeł i wykorzystywane w aplikacjach AI do obrazów.

Jakie aspekty prawne są istotne w odniesieniu do obrazów generowanych przez sztuczną inteligencję?

Obrazy generowane przez sztuczną inteligencję podlegają zarówno prawom autorskim, jak i ochronie danych osobowych, ponieważ obejmują one zautomatyzowaną obróbkę danych osobowych (takich jak obrazy). Kluczowe jest przestrzeganie ram prawnych w celu uniknięcia naruszeń praw autorskich i problemów z ochroną danych.

Jak LAION reaguje na wezwanie usunięcia ze strony fotografów?

LAION często odpowiada na wezwania do usunięcia zdjęć rachunkiem prawnym i roszczeniem o odszkodowanie, ponieważ krótkotrwałe przechowywanie i analiza obrazów jest uważane za dopuszczalne i nie ma ona bezpośredniego naruszenia praw autorskich.

Dlaczego korzystanie z publicznie dostępnych danych jest zalecane w aplikacjach sztucznej inteligencji?

Wykorzystanie publicznie dostępnych danych minimalizuje ryzyko prawne, ponieważ są one swobodnie dostępne i nie zawierają danych osobowych. Ważne jest unikanie danych użytkowników, ponieważ mogą one zawierać wrażliwe informacje.

Inteligencja sztuczna: podstawy techniczne i prawne

Jak działa sztuczna inteligencja (SI) i dlaczego jest teraz rewolucyjną i globalnie ważną technologią? Jakie są warunki prawne dotyczące przetwarzania dużych ilości danych do uczenia się elektronicznego mózgu? A jak wygląda przechowywanie wpisów użytkowników oraz wyświetlanie obrazów i tekstów? Wybrane fragmenty jednego z moich wystąpień.

Wprowadzenie

Ktoś, kto ma niewiele do czynienia z AI, często używa słów kluczowych takich jak ChatGPT, aby wydawać się interesującym. Wielu uważa, że ChatGPT jest szukającą maszyną. Spoiler: To kompletny nonsens. ChatGPT posiada archiwum danych o wiele starsze niż współczesne standardy. To jest zamiar i cel. Bo ChatGPT służy jako odpowiedzialna maszyna, a nie do odnajdywania wiedzy na bieżąco.

Ktoś, kto lepiej zrozumiał AI i miał na uwadze Rynek akcji, kupił akcje Nvidia i od tego czasu może obserwować ogromny wzrost kursu. Gdyż Nvidia jest producentem kart graficznych, które uchodzą za najbardziej wybitne w przypadku aplikacji opartych na AI.

Przewiduję upadek rynku akcji w jego obecnej formie, ponieważ niedługo każdy będzie mógł przewidzieć kursy akcji z prawdopodobieństwem powyżej 50%.
Moja teoria wraz z założeniem, że sam sobie to niedługo uda się.

Co jest przyczyną tego? Wszystko jest bardzo proste:Karta graficzna* takiej jak Nvidia Geforce RTX 3070 ma w swojej GPU 5888 rdzeni. GPU to procesor karty graficznej. W przeciwieństwie do tego, klasyczny procesor komputera to CPU. Dziś dobry Intel-Procesor ma 10 lub kilka więcej rdzeni.

Jeden Intelowy rdzeń jest matematycznie takim Albertem Einsteinem (który jako fizyk bardzo dobrze radził sobie). Jeden rdzeń procesora graficznego Nvidia to taki mniej lub bardziej utalentowany matematyk. Algorytmy AI opierają się przypadkowo na operacjach obliczeniowych, które są szczególnie dobrze wykonywane przez procesory graficzne (GPUs). Podczas gdy rdzeń Alberta Einsteina wykonuje mnożenie z niebywałą łatwością i spędza połowę czasu na nudzie, matematyk GPU jest bardzo obciążony, ale w końcu ukończył tę prostacką operację obliczeniową.

5888 równolegle pracujących matematyków średniego poziomu potrzebowałoby znacznie mniej czasu, aby wykonać 100.000 prostych mnożeń niż 10 wściekłych Einsteina. Podczas gdy komputer z kartą graficzną już dawno skończył obliczenia K, uważa się, że komputer opierający się tylko na procesorze Intel byłby wstrzymany. Można spodziewać się wzrostu mocy o czynnik 50 lub więcej. Karta graficzna nie jest używana do wyświetlania obrazków czy filmów, ani do gier, ale tylko do obliczeń. To słychać z hałaśliwym wentylem karty, który może przewyższyć każdy inny wentylator komputera.

Podczas gdy w Villaribie jeszcze rdzawa się nie skończyła i CPU jest gorąca, a tylko 20% towaru zostało rozładowane, w Villabaj już wszystko świeci.
Proszę wybaczyć, że porównanie to jest tak banalne, jak te dwa fikcyjne wioski, które są znane z reklam i o których wiadomo więcej niż o aktualnych algorytmach sztucznej inteligencji.

Karta graficzna już od razu robi ogromną różnicę przy algorytmach, które dla bardziej wymagających zadań są często 10 dni na sztywno trenowane, lub te, które potrzebują 10 sekund na GPU do generowania obrazka, ale na – gähn- CPU potrzebują 8 minut. Pewnie już kiedyś słyszeliście o DALL-E czy Midjourney i wiedzieliście, że nie muszą czekać 10 minut na zdjęcie.

Funkcjonowanie współczesnej AI

Systemy sztucznej inteligencji, takie jak ChatGPT, opierają się na sztucznych sieciach neuronowych. Sieć neuronalna można również znaleźć w ludzkim mózgu. Działa ono podobnie:

Podstawowa funkcjonowanie ludzkiej inteligencji. (obraz został przetłumaczony automatycznie).

Opisuje się tu sposób, w jaki ludzie przetwarzają informacje i jak powstaje inteligencja. Tak dokładnie jak na zdjęciu, zrozumieliśmy dlaczego istnieje inteligencja w ogóle. Uważam, że nic o tym nie wiemy, ale tylko się dziwimy, dlaczego neurony z ich połączeniami są w stanie powodować coś takiego jak inteligencja. Spoiler: Nie ma to nic wspólnego z Bogiem, o czym będę mówić za chwilę.

W powyższym zdjęciu z lewej strony widzimy Umwelteinflüsse, czyli sygnały. Mogą to być dźwięki, tonalności, statyczne i ruchome obrazy, zapachy, ruchy powietrza itp. Fledermy znają również ultradźwięki bardzo dobrze. W środku widzimy nasz mózg, który wszystkie te sygnały odbiera i przetwarza. Z prawej strony jest neuronowe sieć, w której sygnały są przetwarzane i przechowywane.

Neuron jest porównywalny z prostym rdzeniem procesorowym. Pomiędzy neuronami istnieją połączenia, a mówimy tu o bardzo wielu. Są one w liczbie miliardów. Czy neuron wyzwala się, czyli jest aktywny, decyduje potencjał czynny, który powstaje od innych połączonych neuronów do celowego neuronu.

Teraz przyjdzie nam do realizacji technicznej dzisiejszych algorytmów AI.

Podstawowa budowa współczesnego algorytmu AI. (obraz został przetłumaczony automatycznie).

W linkach widać to samo, co wyżej u ludzi.

W środku widzicie elektroniczne mózg, wyżej było ludzkie.

W prawej części zdjęcia widzisz sieć neuronalną w formie cyfrowej, która u ludzi istnieje biologicznie i jest zatem bardziej analogowa.

Tak długo, tak blisko. Ale jest jeszcze bliżej. Elektronowe mózgi zamieniają dzięki podejściu Transformer (znane od roku 2017) wszystkie sygnały w ciągi liczb, wektory nazywane. Tak samo robi to mózg ludzki. W każdym razie jest to tak samo. To, że w ogólnej implementacji biologii i elektroniki są drobne różnice, jest prawie nieistotne i sprawia tylko o tym, że biologia przewyższa elektronikę pod względem wydajności. Prawdopodobnie znacie Prawo Mooresa: Każde 12-24 miesiące zdolność obliczeniowa procesora sięga dwukrotności, często przy jednoczesnym spadku ceny. Zatem zwycięzcą jest maszyna, a mianowicie od teraz (ok. roku 2023).

Dlatego AI jest rewolucyjna

Tej wektorach, czyli ciągach liczbowych, które reprezentują obrazy, teksty lub filmy lub coś innego, można teraz porównać ze sobą. Teraz można więc porównać teksty z tekstami, obrazy z obrazami, filmy z filmami, teksty z obrazami, obrazy z filmami, teksty i sygnały dźwiękowe z obrazami lub filmami itd. Teraz wiesz, jak działają generatory obrazów takie jak Dall-E czy Midjourney. Teraz wiesz, że tym sposobem najwyżej i najłatwiej można przeprogramować dotychczas wyjątkowo ekskluzywne aplikacje takie jak SoundHound, które mogą rozpoznać utwory muzyczne po kilku sekundach.

Samemu udowodniłem, że można szybko i łatwo programować wspaniałe aplikacje:

Transkrypcja audio mojego podcastu: Audio do tekstu, w niezmiernie dobrych warunkach. Za 30 minut mowy automatycznie wydaje się transkrypcja generowana przez AI, przy której mogę jeszcze ręcznie poprawić pięć słów. Słowa i nieznane słowa jak „wszystko tutti“, „Hömmele“ (tak, tak brzmi!) lub „Megafail Microsofta, który miał narzędzie AI Twittera” są łatwo rozpoznawane.
Generowanie wideo z wejścia obrazowego i dźwiękowego: Moje dwuwymiarowe zdjęcie o wyraźnie złej jakości plus głos amerykańskiego prezydenta jako jedyny wpływ na moją trójwymiarową animację głowy i synchronicznie poruszający się usta wraz z głosem wideoanimacja.
image generator: Znany z innych aplikacji. Ale robi różnicę, gdy technik wie, czy daje się obliczyć coś w chmurze Microsoft, Dall-E lub gdzie indziej albo na lokalnym systemie. Różnice są następujące: Lokalnie nie płacę nic. W chmurze mogę za złe programowanie w ciągu miesiąca przypadkowo zniszczyć 100.000 Euro (przykład: niezamierzone nieskończenie rekurencyjny wywołanie). Lokalnie mam pełną kontrolę nad wszystkimi danymi. W Microsoft i Google pomaga modlitwa nic, a najwyżej środek nasenny lub czysty alkohol, aby zapomnieć o troskom z danymi krabami na krótki czas albo w ogóle uwolnić głowę od myśli.
Obiektywyzacja: Jakie obiekty są na zdjęciu do rozpoznania? Jaki kształt mają granice każdego z nich? Co to za obiekt? Czy byłoby możliwe np. „Oznacz na zdjęciu wszystkie filiżanki” lub „Szukaj mi zdjęć, na których dwa lub więcej osób dyskutują w biurze i siedzą na krzesłach” lub „Zastąp twarz na zdjęciu twarzą Normana Reedusa, mojego klonu, mówią wielu…).
Semantyczna wyszukiwarka: Zamiast szukać po słowach kluczowych lub tajemniczych poleceniach SQL, teraz szukamy po naturalnych zdaniach albo porównujemy całe dokumenty ze sobą.

Miałem kiedyś obliczone kilka tysięcy zdjęć na moim komputerze. Oto wynik w postaci mozaiki (każdy kamień mozaiki jest w rzeczywistości zdjęciem o rozdzielczości 512 x 512 pikseli):

Zestawienie z około 400 zdjęć, które zostały wygenerowane przez moją lokalną maszynę za pomocą AI. Całe zdjęcie zostało pomniejszone aby ułatwić szybsze ładowanie. (obraz został przetłumaczony automatycznie).

Tekst pojedynczych zdjęć mosaiku powstał z obliczeń AI. Zmieszałem zdjęcia dwóch znanych mi artystów. Zróżnicowanie jest tu jeszcze niezbyt dobre, bo były to pierwsze próby. Idzie jeszcze lepiej, jak się okazało dzień później. Co na rynku AI jest od wieków, dla niektórych organów ds. ochrony danych to jednostka czasu, którą one nie znają (Co to jest dzień? Niektóre organa znają tylko terminy „rok”, „dziecięństwo” i „niekiedy”?

Systemy lokalne jako rozwiązanie

Jak już zostało pokazane, wiele skomplikowanych obliczeń można wykonać na własnych komputerach. Proszę, nie biegnij ponownie do Microsoftu, AWS czy Google, tylko dlatego że ktoś chce zagrać w Bullshit Bingo i ukrywa swoją niewiedzę za angielskimi słowami i markami.

Kto teraz jeszcze za każdy problemek zarezerwuje usługę w chmurze, jest biednym Würstchen i ma mniej pojęcia o AI niż o ochronie danych i aplikacjach internetowych. Nie byłoby to tak źle, gdyby nie musiał być na wszystko ekspertem. Złe doradcy są jednak złym skutkiem.

Jedna z AI nie jest odpowiednia do dokładnych stwierdzeń. Jest tak wiarygodna jak przeciętnie inteligentny człowiek.

Niektóre problemy są jednak tak skomplikowane, że nie mogą być rozwiązane na standardowej aparaturze. Na przykład wersja ChatGPT 4. Ten system nie istnieje nawet jako open-source, więc nikt nie może próbować wszystkiego zrobić poprawnie.

Niektórzy są jednak wystarczająco rozsądni i nie wykopują swoich Prywatne sprawy biznesowe do chatbota Microsoftu lub Google'a. Z kimś takim nie chciałbym mieć nic wspólnego.

Jako szczególnie plastyczne przykład obciążenia licznikowego nazywa się BloombergGPT. Jest to Large Language Model (LLM) stacji telewizyjnej Bloomberg. Jest tak potężna, że potrzebowała 1,3 miliona godzin obliczeń, aby model był gotowy do użycia. Model jest elektronicznym mózgiem.

Bloomberg-Gehirno było gotowe już po 148 latach czasu obliczeń dlatego, że 512 najbardziej wydajnych kart graficznych z każdej 40 GB pamięci graficznej (NIE: głównego pamięci komputera) były zajęte. Każda z tych 512 kart kosztuje około 14 000 Euro. Kto chce uaktualnić swojego PC z 16 na 32 GB RAM, płaci to z własnej kieszeni. Kto chce podnieść kartę graficzną od 8 do 16 GB pamięci, płaci drogiego majątku (przezroczysto).

Prawne rozważania

Ograniczę się do kilku stwierdzeń, które wzięłam z wyjaśnień adwokata Jonas Breyera. Nieprzypadkowo jego nazwisko może Wam znikać (hasło: „adresy IP są danymi osobowymi”).

Prawo autorskie

Zły i dobry zarazem dla nas wszystkich, kiedy chodzi o AI. Istnieje ryzyko, że Europa pozostanie mistrzem świata w regulacjach. Wtedy w Europie w niektórych dziedzinach (przetwarzaniu obrazów?) prawdopodobnie niewiele firm z AI będzie miało sukces. Zamiast tego kupimy to u Amerykanów, którzy robią co chcą, ale nie są karani (można).

Adwokat prawa autorskiego w polu poszukiwań. Promp dla tego obrazu generowany był również automatycznie. Dzięki temu można tworzyć setki tysięcy zdjęć nawet o wysokiej rozdzielczości na jednym komputerze lokalnym.

Najważniejsza założka: To, co yes jako człowiek mogę i nie mogę robić, tak samo dotyczy AI.

Malowanie obrazu z głowy jest człowiekowi tak dozwolone jak i komputerowi. Jeśli wynik przypomina zbyt wiele o pracy chronionej prawem autorskim, nie jest on dozwolony. Takie prawa chronią wszystkie prace, które mają pewien poziom twórczości. Są to niemal wszystkie obrazy lub zdjęcia, na których widnieje coś więcej niż prosty kwadrat czy krąg.

Przypominam, że zgodnie z § 44b Urządzenia Prawa Autorskiego, jest dozwolone krótkotrwale przechowywanie utworów innych osób w celu ich analizy według wzorców. To właśnie robią komputery uczone.

Sprawa LAION

Przykładem jest LAION e.V., niemiecki związek, który został pozwany przez niemieckiego fotografa. LAION zgromadził i udostępnił ponad 5 miliardów zdjęć w zestawie danych szkoleniowych dla aplikacji AI do obróbki obrazu. Zestaw danych zawiera tylko linki na oryginalne, publicznie dostępne zdjęcia.

Zbiór danych LAION 5B jest na całym świecie popularny i stanowi podstawę dla każdego drugiego generatore obrazów, który ma coś do powiedzenia.
Moje własne obserwacje po zbadaniu wielu algorytmów Stable Diffusion.

LAION pobrał te zdjęcia i wykorzystał je do obliczenia elektronicznego mózgu. Następnie, według własnych oświadczeń LAION usunął te zdjęcia. Z pomocą mózgu można następnie obliczyć zdjęcia takie jak powyżej lub poniższe.

Daryla Dixona w stylu origami, wygenerowanego przez AI na moim lokalnym systemie.

Fotograf odnalazł swoje zdjęcia w LAIOn Data Set. Jak mówiłem, tylko linki i nie oryginały. Fotograf poprosił o usunięcie jego materiału z danych szkoleniowych. Nie wiem dokładnie czego chodzi mu o tym. Może chodzi mu o to, że wyniki z jego zdjęć zostaną usunięte z elektronicznego mózgu.

Oto LAION bazę danych obrazów jako schemat i z oryginalnymi informacjami (wybór):

Obraz po lewej stronie dolnej pochodzi od https://www.outdoorphotographer.com/images/gallery/full/131/417131.jpg (obraz i domena nie są dostępne od 30.07.2023). Obraz po prawej stronie dolnej został stworzony na podstawie tego i jest nowatorski. (obraz został przetłumaczony automatycznie).

Teraz pytanie brzmi, czy LAION musi usunąć wyniki z analizy krótko przechowywanych zdjęć lub nie. LAION odrzuca tę możliwość i wysłał fotografowi fakturę za opłatę adwokacką wraz z roszczeniem o odszkodowanie w wysokości około 850 euro.

Prawo ochrony danych osobowych

Dane osobowe podlegają ochronie przepisów RODO. Aplikacje AI zawsze wymagają automatyzacji procesu. Dlatego też zawsze podlegają przepisom RODO, gdy w grze są dane osobowe.

Osobiste dane mogą dotyczyć nie tylko tekstów, ale również zdjęć. Uważam, że informacje publiczne mogą mieć niewielki lub żaden istotny ochronę prywatności. Fałszywe oświadczenia generowane przez AI nie mają nic wspólnego z ochroną danych osobowych. Prawo autorskie jest czymś innym niż ochrona danych osobowych.

Zatem uważam ochronę danych osobowych za problem drugorzędnego, kiedy chodzi o aplikacje AI. Ma tu swoje uzasadnienie i nie powstrzymuje, ale chroni. Inaczej patrzę na to w przypadku prawa autorskiego lub prawa do marek.

Inne przepisy prawne

Prawo o znakach towarowych chroni wyraźnie (§ 3 Prawa o znakach towarowych) i niejawnie chronione znaki towarowe (§ 4 pkt 2 Prawa o znakach towarowych itd.).

Obok znaków słownych i wizualnych istnieją także smaki, dźwięki, formy i być może jeszcze kilka innych.

Prawa patentowe, wzory użytkowe i niektóre projekty są chronione. Nawet forma butelki może być chroniona.

Data Act jest dotychczas tylko projektem Komisji. Zobowiązuje on większe firmy do ujawnienia danych, jeśli ktoś o nie zapyta. To brzmi dziwnie i tak jest.

Także is dostępny projekt komisji dotyczący regulacji AI. W grę wchodzi kwestia, czy powinna wystąpić odwrotna ciężar dowodu, jeśli ktoś używa utworu generowanego przez AI. Czy został on prawidłowo wygenerowany? Aby to udowodnić, należałoby np. przy generatorze obrazów zapisywać stan systemu AI jako kopię zapasową, aby później można było przeprowadzić bezpieczne dowody. To uniemożliwia i nie pozwala na to.

Regulacja chroni duże przedsiębiorstwa, które mogą sobie pozwolić na obsługę prawnych doradców i personelu w długich procesach. Małe firmy są przez to uciskane.

Lepsza od regulacji, którą uważam za przez co prawda niemożliwą, jest odstraszanie i karanie. Dwie słowa, które są zupełnie nieznane władzom ds. ochrony danych takim jak te w Hesji (i kilku sądach tamtejszych). Gdzie parkują mniej samochodów źle? Tam, gdzie nawet na ulicy prostytucyjnej parkowanie z karą 800 euro jest karane (ale ktoś nigdy nie otrzymał mandatu), lub tam, gdzie każdy piąty kierowca, który parkuje źle, zostaje odnotowany?

Zalecenia

Używaj lokalnych systemów AI. Świat może być tak prosty. Nie ma już problemów z Google i Microsoftem. Co to było za Privacy Shield? Czy nadal istnieje? Nie, nie istnieje. USA wyszły.

Zmieńcie ChatBots nie z Szybkimi wyszukiwarkami. Jednakże można znaleźć każde dokument lub zdjęcie lepiej niż kiedykolwiek, używając semantycznej wyszukiwarki, zupełnie bez ChatGPT, zupełnie bez OpenAI czy Microsoftu.

Sprawdź Dane do ćwiczeń: tylko własne lub wybrane dane są bezpieczne przed problemami prawnymi. Trudno, bo AI opiera się na dużych danych. Na szczęście istnieją sposoby obejścia. Najlepszym rozwiązaniem (zwykle) jest użycie danych publicznych dostępnych, jeśli nie własnych.

Dane użytkownika nie powinny być przechowywane bez przyczyny. Mogą one zawierać dane osobowe. Powód, jeśli zostanie zapisany, powinien być wybierany i uzasadniany bardzo starannie. W końcu ChatGPT zostało w ten sposób na krótko zakazane we Włoszech.

Wydatki, które generuje AI, są różne w zależności od formy. Wydania tekstowe nie są opracowaniami naukowymi. Patrz na przykład na przypadku nowojorskiego adwokata, który pozwolił sobie wydać 12 orzeczeń, które nigdy nie istniały. Głupio, jeśli te wyniki następnie przedstawia się w sądzie i tak jakby to była prawda.

Wykład dotyczący tego przedstawiałem na kongresie ochrony danych osobowych w Deutsche Flugsicherung pod koniec maja 2023 roku.