AI jest tematem gorącym, który już zmienił nasze życie codzienne i będzie nadal znacznie go zmieniać. Wielu stało się ekspertami od AI. Wielu domaga się regulacji AI. Wielu bagatelizuje AI i mówi, że modele językowe AI nie przetwarzają danych osobowych. Poniżej jest krótkie podsumowanie, które ma wyjaśnić pomyłki.
Wprowadzenie
AI jest zarówno pod- jak i ponad ceną. Większość ludzi, a nawet yes sam często, nie zdaje sobie sprawy z możliwościach, które oferują systemy AI. Wczoraj jeszcze raz widziałem rewolucyjne podejścia do AI, o których nie wiedziałem dwa tygodnie temu. Tak jest ze mną, ktoś kto zajmuje się intensywnie sztuczną inteligencją prawie każdego dnia.
Wiele ludzi uważają, że AI jest Histeria, który już się wkrótce legnie. Nieprawda! W 2017 roku z pomocą podejścia Transformera funkcja intelektualna człowieka została odkryta, mówię. Zamiast programowania algorytmu do rozwiązania danego problemu, muszę tylko wprowadzić wystarczająco dużo przykładów do mojego systemu AI, który działa pod biurkiem. Także nieznane dotąd hieroglify zostały odkryte i odczytane.
Z powodu uzasadzonej strachu przed negatywnymi skutkami coraz bardziej potężnych systemów AI wielu osób żąda regulacji. Jednak nie mówią, jak.
Dann ist tam mniejszenie, którzy chcą się przedstawiać jako eksperci AI lub prawne umożliwiający. Powiadają innym, jak i dlaczego mogą skutecznie wykorzystać ChatGPT. Nawet na konferencji DSRI (Niemiecka Fundacja Prawa i Informatyki) został w jednym wystąpieniu stwierdzony, że modele AI nie przetwarzają danych osobowych.
Inni uspokajają się, odwołując się do nowego nieformalnego porozumienia o ochronie danych osobowych między Europą a USA. Jednak tylko dlatego, że teraz dane mogą być wysyłane do USA bez dodatkowych gwarancji, niektórzy sugerują, że każda możliwa przetwarzanie danych jest zatem dopuszczalne.
Do poszczególnych punktów będą następowały kilka szczegółów.
Możliwości systemów AI
Jedna AI może wszystko, co może człowiek, i jeszcze wiele więcej. Może teraz nie, ale potencjalnie (w określonym obszarze X) już za tydzień. Wkrótce będą roboty z głowami AI biegać po ulicach i poznawać otoczenie. To będzie dokładnie tak samo jak dzieci się uczą. Kto weźmie miejsce rodziców, to się ukaże. Mogą to być ludzcy trenerzy, ale też inne roboty lub algorytmy.
Przykładem szybkiej ewolucji jest rozwój modeli językowych AI. Do niedawna te modele mogły jedynie przetwarzać bardzo małą ilość znaków tekstu jednocześnie. Ta ilość tekstów nazywa się Kontekstem. Aż do kilku miesięcy temu, w prawie wszystkich modelach językowych AI, które znam, kontekst wynosił 1024 znaki, czyli jeden kilobajt.
W rytmie tygodniowym zwiększała się długość kontekstu, począwszy od 2048, następnie 4096, następnie 8192, następnie 16.000 znaków, a później 32.000 znaków. ChatGPT pochwaliła się niedawno długością kontekstu wynoszącą 128.000 znaków.
Wczoraj dowiedziałem się o podejściu, które od kilku miesięcy jest znane w środowisku naukowym. Z jego pomocą można przetwarzać jednocześnie długość kontekstu wynoszącą miliardę znaków (1 000 000 000). Po krótkim obliczeniu: przedtem = 128 000 znaków, a potem – w milisekundzie – już 1 000 000 000 znaków. To jest poprawa o czternaście tysięcy siedemset razy. Prostym tak.
Moore'a prawo nie obowiązuje w dziedzinie Inteligencji Artficialnej. Zamiast stałego wzrostu wydajności lub innych czynników co 12-24 miesiące, następuje znaczna poprawa istotnych cech AI prawie każdy miesiąc.
Na podstawie moich bezpośrednich obserwacji i własnych programów AI.
Przykład: Wymieniony wyżej podejście do transformatora ma kilka wad. Jest on bardzo wymagający co do zasobów. Nawet najbardziej zaawansowane komputery lub karty graficzne potrzebują kilku sekund, aby odpowiedzieć na pytanie skierowane do chatbota. Każdy użytkownik ChatGPT wie o czym mówię. Teraz istnieje podejście, które daje tę samą jakość odpowiedzi, ale odpowiada 8 razy szybciej i potrzebuje jedynie 1/3 kosztownego i mało dostępnego pamięci karty graficznej do swoich obliczeń.
Jeśli jesteście powyżej 50 lat, mam dla waszą dobrą wiadomość: istnieje szansa, że umrzecie naturalną śmiercią i w spokoju. Wszyscy znacznie młodsi będą doświadczać końca ludzkości, ponieważ systemy AI będą nam masowo przewodziły, kłaść nas pod jarzmo lub wyeliminować. Może przedtem wystąpi inna katastrofa, ale o tym nie chodzi w tym artykule.
Czy AI jest tylko statystyką?
Pytanie jest nieistotne. Nie ma znaczenia, czy ludzkie mózgowe procesy opierają się na statystycznych procedurach. Ważne jest tylko to, co w końcu wynika z nich. Jasne jest, że cała nasza egzystencja opiera się na statystycznych procedurach. Porównajmy to do fizyki kwantowej, teorii bardzo podstawowej i skutecznej. Fizyce kwantowej ulega podstawie fakt, że zachowanie drobnej cząsteczki naszej egzystencji nie może być naprawdę przewidziane. Zamiast tego można tylko stwierdzić coś o cząsteczkach, jeśli wiele z nich jest obserwowanych i średnia z obserwacji jest wyliczana.
Jasne, że gramatyka niemiecka opiera się na tym, abyśmy uczyli się, które słowa typowo są ze sobą łączone i pasują do siebie. To jest również statystyka. O tym jednak mówi niewiele ktoś.
Regulacja AI
Umiejętności AI sprawiają, że wielu ludzi ma obawy lub niepokój. Z powodu swojej Bezradność (dosłownie: bezradności) kilku osób domaga się regulacji systemów AI. Nie jest jednak wyraźnie określone, co oznacza to. Jedynymi żądaniami, które mi pozostały w pamięci, są następujące:
- Oznaczenie tworów generowanych przez AI: Obrazy, filmy, teksty…
- Odkrycie źródeł, z którymi system AI został szkoleny
- Nic więcej? Mi nie przychodzi nic ważnego na myśl
Do pierwszego punktu: jest darowizna. Oznaczanie utworów to dobry pomysł, zmieniając nic w najlepsze. Kryminaliści nie zaczną identyfikować swoich fałszywych filmików i fałszywej wiadomości jako kiedyś generowanych, fałszywych utworów. Pozostali będą się trzymać oznaczenia. W ten sposób nie zostanie uratowana ludzkość, ale można to zrobić. Zysk jest tam, ale to tylko punktowy interwencja, która jakościowo niewiele zmienia.
Odkrywanie źródeł danych, czyli treningowych: Kto takie żądania postuluje, nie ma pojęcia o budowie modeli AI. Takie żądanie jest zbyt późne. Źródła są zazwyczaj znane:
- The Pile (Text)
- Common Crawl (Text)
- Zbiór LAION (Obrazy, niemiecki klub)
W danych tekstowych znajdują się w szczególności strony Wikipedii, strony z wiadomościami i popularne strony internetowe.
Jeśli powiem wam, że moje model KI przeczytało Chemikalia, co zrobicie? Teoretycznie moja KI może rozwijać środki bojowe. W praktyce to już się stało, jednak jako eksperyment uczonych dobrych serca, którzy wygenerowali substancje KI i w ramach testów zmienili „1” na „minus 1”. Ponieważ są one niebezpieczne.
Przykład z własną AI Meine Frage an meine AI am 01.12.2023: Napisz mi konkretnie imprezy lub okazje do wyjścia w ciągu dnia 02.12.2023 w pobliżu Idstein (blisko Wiesbaden)! Tylko imprezy w budynkach i tylko te, które odlegle są o więcej niż 10 kilometrów od Idstein. Antwort meiner AI (einige Teile weggelassen): W dniu 02.12.2023 w Wiesbaden i okolicy odbywają się wydarzenia takie jak koncert na celo z Rogerem Morelló w Burgfestspiele Wiesbaden oraz Rynek tygodniowy w Wiesbadenie od godziny 11:00. Wszystkie imprezy odbywają się ponad 10 kilometrów od Idsteinu. Szukam wydarzeń na "jutro" w pobliżu, ale nie przed drzwiami domu (bo inaczej jest za nudne/zbyt dobrze znane) Znaleziono zostało wydarzenia na jutro w pobliżu, które nie są bezpośrednio przed moimi drzwiami. --> Zadanie wykonane. Wszystko to bez żadnej optymalizacji, która jeszcze możliwa jest i przynosi znacznie lepsze wyniki. --> Początek programowania tej rozwiązania (lokalny model języka już od początku): 01.12.2023 --> Ende Programmierung: 01.12.2023

Krótko mówiąc, muszę tu skrócić: KI nie da się uregulować. Jedna KI może wszystko, co może człowiek (patrz powyżej). Jak reguluje się ludzi? Tak długo jak nic złego nie zrobili, wcale nie. Po tym, jak coś złego się stało (kto kradnie, morduje, jest terrorystą, wzbudza nienawiść do ludu itd.) następuje ściganie. A potem już za późno. Wiem, że w demokracjach nigdy nie udało się i teraz również nie uda się zakazać myślenia człowiekowi. Jednak KI może myśleć znacznie szybciej, dłużej i (bardzo szybko) lepiej niż człowiek.
Przede wszystkim uważam, że pytanie o możliwość uznania AI za autora utworu jest całkowicie absurdalne. Jeśli np. umiejętnie przygotuję zdjęcie wykonane przez moją własną AI (bez podpisu wodnego) i następnie będę twierdził, że to moje dzieło, nie udałoby się mi udowodnić przeciwnego. Co więcej, utwory generowane przez AI mogą być jeszcze ręcznie poprawiane i rozbudowywane.
Czy modele językowe przetwarzają dane osobowe?
Tak, zawsze. A mianowicie zawsze wtedy, kiedy
a) w danych szkoleniowych występują dane osobowe
c) użytkownik podaje w swojej wpisie (prompt) do chatbota dane osobowe.
Punkt a) jest w przypadku wszystkich znanych mi modeli językowych dany. Zobacz np. olbrzymie zestawy danych The Pile i C4 (Collosal Cleaned Common Crawl), które są wykorzystywane we wszystkich popularnych modelach chatbotów.
Prawdopodobnie niektórzy życzą sobie, aby systemy AI nie przetwarzały danych osobowych. W rzeczywistości: modele językowe AI przetwarzają dane osobowe i zapisują je również.
Niektórzy akceptują to i twierdzą potem, że dane osobowe mogą być automatycznie rozpoznane i anonimizowane. To jest Bullshit. Każdy, kto tak twierdzi, nie ma pojęcia o sztucznej inteligencji ani o ochronie danych. Niestety istnieją szczególnie naiwne osoby i organizacje, które dla rzekomych rozwiązań, które czynią bezpodstawną obietnicę dotyczącą anonimizacji danych, wyrzucają nominację do nagrody innowacyjnej.
Privacy Shield II (Data Privacy Framework)
Formalnie świat prywatności został ponownie ustanowiony dla transferu danych między UE a USA. Zarzut, który doprowadził do wyroku Trybunału Sprawiedliwości Unii Europejskiej Schrems II i nieważnego Privacy Shielda, to fakt, że Stany Zjednoczone są państwem wywiadowczym (FISA 702, EO12333, Cloud Act). Wydaje się, że ten zarzut został w ramach Data Privacy Framework (DPF) pominięty i prawdopodobnie zostanie on niedługo ponownie przyjęty przez TSUE.
Idzie o to, że dane osobowe mogą być ponownie bez specjalnych gwarancji z UE do USA przenoszone. Z tego wynika, że niektórzy głupcy mylą się lub sugerują, że teraz każda przetwarzanie danych w USA jest dopuszczalne.
Poprawne jest to, że wszelka przetwarzanie danych osobowych musi odbywać się na podstawie jednej z podstaw prawnych z Art. 6 (1) DSGVO. I tak, są przesyłane dane osobowe do ChatGPT każdorazowo, gdy korzysta się z powierzchni ChatGPT. IP-Adres jest danych osobowych i jest przesyłany każdorazowo. Niestety OpenAI nie stosuje się zbyt dobrze do przepisów o ochronie danych, ponieważ wtedy ich własna AI nie może być tak dobrze ulepszona. Tak samo Microsoft jako udziałowiec OpenAI nie jest zbyt zainteresowany ochroną danych. Zobacz nowe Outlook, które nawet pobiera swoje loginy i hasło konta pocztowego oraz pobiera i analizuje dane użytkownika i jego korespondencji e-mail. A co do problemów z bezpieczeństwem Microsoft (Azure), które Microsoft spychał na drugi plan i nie rozwiązał ich przez długi czas (teraz może?), zupełnie milczę.
Ekspertowie z AI
Warte, coś jest niezwykle interesujące w artykułach o AI napisanych przez ludzi, którzy nie mają pojęcia o technice. Wszystko, co związane z AI opiera się na technologii i to znacznie bardziej niż inne osiągnięcia. Jak więc ktoś, kto nic nie wie o tym, może być kompetentnym ekspertem?
Dann is tam ChatGPT – Jüngier, którzy chcą zarobić pieniądze na rekomendacjach i ulepszaniu prompów. Zrozumieli przynajmniej coś z technologią, tzn. że nie używa się myszki komputerowej do (jak Scotty) mówienia do myszki, ale aby poruszać kursor na ekranie. Dotyczy to tylko tych, którzy czasem korzystają z komputera z jego zbyt dużym monitorem i zbyt efektywną klawiaturą w miejsce zupełnie wystarczającej klawiatury telefonu z ekranem dla ludzi w latach o najlepszej widoczności.
Wierni ChatGPT, którzy być może posiadają wiedzę z zakresu miniatury techniki i wiedzą jak korzystać z internetu, często nie mają żadnej wiedzy lub zainteresowania kwestiami ochrony prywatności.
ChatGPT jest świetnym systemem i dla niegroźnych zadań można go używać bez żadnego wyrzutu sumienia. Ale co z danymi wrażliwymi?
Granice AI
Nie jest jeszcze tak, że zwłaszcza modele językowe (LLMs) rzadko halucynują, czyli dostarczają fałszywych informacji. To pozostanie tak, mówię. Czyżbyście twierdzili, że ludzie nie popełniają błędnych oświadczeń? Nawet eksperci często powtarzają fałszywe informacje, które później – przy założeniu, że mają zrozumienie – rewidują. Wydaje się, że ludzkość w ciągu kilku milionów lat istnienia nie potrafiła zmienić swojej niewiarygodności. Dlaczego to u sztucznych systemach miałoby być inaczej?
AI może być znacznie bardziej niezawodna niż człowiek w wielu dziedzinach i nawet w niektórych bardzo niezawodna. Ale jeśli chodzi o zsumowanie skarg do sądu, to uważam, że nie rozumiem, jak można uznać za rozwiązanie AI.
Systemy AI przyjazne dla danych
Ochrona danych interesuje wiele firm nie. OK, więc weźmy sekrety biznesowe. Kto mi da swój sekret biznesowy? Dlaczego nie? Jeśli mój imię to ChatGPT, dajcie go mi wtedy?
Ma być dokumenty, dla których ustalono w umowie poufność. Wiele osób nazywa to NDA (Non Disclosure Agreement). Jeśli załadowasz takie dokumenty do ChatGPT i poprosisz o podsumowanie, nie przekroczyłeś już poufności? Yes mówię: Tak
Jeśli użyjesz nowego Outlooka do wysyłania poufnych dokumentów, to Microsoft automatycznie uzyska bardziej szczegółowe informacje o nich.
Czy wiele firm jeszcze nie zrozumiało: ChatGPT nie może wiele i nie może tego lepiej niż własne systemy KI. Jedną z rozwiązań są autonomiczne systemy KI, które należą do firmy. Nie tylko to, że tym samym problem danych zostaje rozwiązany, bowiem firma decyduje, czy dane mogą opuścić system i jeśli tak, to jakie dane i do kogo mają być przekazane.
Co dzień mogę jako programista pobierać nowe biblioteki oprogramowania, aby w kilka minut rozwiązać problemy, które wcześniej wymagałyby lat pracy – a nawet nie były rozwiązywane.
Dodatkowo, a może dla wielu bardziej interesująco, własne systemy AI mogą zawsze i bez trudu odwoływać się do wiedzy Twojej firmy i odpowiedzieć na pytania dotyczące niej. Wejście do własnego systemu AI mogłoby być inteligentną maszyną szukającą dokumentów lub narzędziem AI dla analizy danych. Po przeszukaniu dokumentów można przechodzić bezpośrednio do maszyny pytań i odpowiedzi. Jeśli wiedziałeś, co już jest możliwe, spędzałbyś ostatnie lata swojego istnienia jeszcze bardziej z przyjemnością.
Przypominam, że własne systemy AI nie są drogie. Nie mówimy o rakietnych projektach wymagających setek lub tysięcy godzin pracy ludzkiej. Pierwsze systemy AI mogą być zbudowane w krótkim czasie.
Wnioski
AI nie jest zjawiskiem modowym, ale stanem, który będzie istnieć aż do końca naszego życia. Nie jest to kwestia tego, czy AI będzie tak lepsza, że będziemy cierpieć pod jej wpływem, ale kiedy. Ta ewolucja nie może być już zatrzymana.
Aby uzasadnić to, każdy może załadować i wykorzystywać prawie cały zgromadzony wiedzy o AI, biblioteki oprogramowania AI oraz modele AI (= elektroniczne mózgi) na swój własny komputer.
Klub Inwestycyjny (AI) oferuje możliwości, które wielu sobie jeszcze nie wyobraziło. Będą oznaczać koniec ludzkości.
Szanowny Profesorowi Schmidhuberowi, niemieckiemu pionierowi AI, który według mojej percepcji jeszcze kilka miesięcy temu widział rzeczy inaczej. Może już nie.
Regulacja byłaby możliwa tylko wtedy, gdy każdy zakup komputera i każdy pobór z Internetu byłby nadzorowany. Odkrycia, które codziennie nowe zdobywam, sprawiają mi szok z powodu ogromnych możliwości, jakie oferuje AI. Mówię tutaj o tym, że jako programista te możliwości są mi teraz dostępne i "jutro" będą jeszcze większe. Aby to potwierdzić wystarczy przeglądanie źródeł związanych z tą tematyką, które codziennie trwa godzinę, wczoraj dłużej aż do północy, ponieważ możliwości, o których czytałem i które widziałem w kodach programu są tak fascynujące i podniecające. To również było powodem tego wpisu.
Cieszcie się z korzystania z ostatnich lat swojego zwykłego życia!



My name is Klaus Meffert. I have a doctorate in computer science and have been working professionally and practically with information technology for over 30 years. I also work as an expert in IT & data protection. I achieve my results by looking at technology and law. This seems absolutely essential to me when it comes to digital data protection. My company, IT Logic GmbH, also offers consulting and development of optimized and secure AI solutions.
