Pomoc dla firm i administracji, aby lepiej ocenić i planować projekty AI. W kilku seminariach dotyczących AI wyłoniły się pewne pytania zainteresowanych AI jako szczególnie istotne. W tym artykule wymieniane są pytania z praktyki i odpowiada na nie w sposób praktyczny.
Wprowadzenie
Ktoś, kto chce rozwiązać problem z AI, często nie wie, czy jest to możliwe i jak duży będzie koszt. Poniższy praktyczny zestaw odpowiedzi na pytania o rozwiązania oparte na AI pokazuje, co można osiągnąć.
Pytania pochodzą między innymi z niedawno odbytego webinarium, ale także z innych kontaktów z klientami i zainteresowanymi. Odpowiedzi opierają się na doświadczeniach z projektów, w których realizowano życzenia klientów.
Wiele przypadków zastosowań w firmach można doskonałym i ekonomicznym sposobem rozwiązać za pomocą własnej AI.
Projekty zawierały wszystkie istotny udział w programowaniu AI. Do użytku były wykorzystywane modele Open-Source AI oraz sporadycznie interfejsy do ChatGPT, Claude 3, Command R+ lub innych komercyjnych modeli językowych.
Odpowiedzi na wymienione pytania mają udostępnić orientację, aby lepiej rozpoznać, ocenić, zaplanować i przeprowadzić projekty związane z inteligencją artfycjalną.
Pytania z praktyki dotyczące AI i odpowiedzi
W druku ciągłym każda pytanie jest wymieniona, a pod nią następuje jako tekst zwykły odpowiedź.
Jaki przypadek zastosowania jest szczególnie dobry do wejścia w świat AI?
W związku z bardzo dobrymi wynikami i niskimi wymogami sprzętowymi, następujące przypadki zastosowania są idealne do wstąpienia w świat rozwiązań AI – pamiętajmy, że nie musimy używać ChatGPT!
- Wyszukiwanie wiedzy: Przejdź przez własne dokumenty lub biletów w systemie ticketowym.
- Funkcja wyszukiwania na stronie internetowej: Inteligentna funkcja wyszukiwania dla tekstów i plików PDF na własnej stronie internetowej.
- Zarządzanie skargami: Na podstawie wcześniejszych przypadków zalecenie pracownikowi, jak najlepiej obsłużyć aktualną skargę.
- Regulacja szkód: Analogicznie do zarządzania skargami.
- Inteligentna wyszukiwanie internetowe: Uzyskaj wyniki z serwisu wyszukiwawczego (przez interfejs API) i przeanalizuj je inteligentnie. Z 1000 wyników wyeliminuj nieistotne wyniki.
- System odpowiedzi na często zadawane pytania: Wymagane są albo pary pytań i odpowiedzi lub dokumenty, które zawierają odpowiedzi (pytania, do których te dokumenty odpowiadają, mogą być syntetycznie generowane).
- Klasyfikacja dokumentów, tekstów, nagłówek, zdjęć, sygnałów: Przypisywanie każdego dokumentu do jednej z kilku określonych kategorii. Automatyczne uczenie się odpowiednich kategorii. Możliwa wysoka stopa trafności.
Te aplikacje mogą działać na własnej infrastrukturze Twojej firmy lub organizacji bez konieczności wysyłania danych do stron trzecich.
Jaki rodzaj przypadków aplikacyjnych nadal jest odpowiedni dla rozwiązania z AI?
W szczególności należy wymienić:
- Chatbot / Asystent wiedzy: Rozmowa z pamięcią, odpowiedź własnymi słowami, wykorzystanie również wiedzy internetowej do znalezienia odpowiedzi…
- Tekstogeneracja: Generowanie wysokiej jakości tekstów kreatywnych, np. dla artykułów blogowych; Sformatowanie treści dokumentów
- Rozpoznawanie obiektów: Rozpoznawanie klas obiektów (osoba, dom, …) na zdjęciach i w filmach oraz inteligentna detekcja ruchu.
- Generacja obrazów: Generowanie zdjęć na podstawie opisu, generowanie zdjęć podobnych do wprowadzonego zdjęcia. Możliwa jest automatyczna weryfikacja praw autorskich.
- Tłumaczenie języka i tekstu: Transkrypcja, wypowiedź językowa, tłumaczenie z jednego języka na 100 innych języków.
Zapotrzebowanie w tym zakresie jest często niewielkie. Tylko wymagania sprzętowe są wyższe niż dla przypadków użycia, które zostały wymienione w poprzednim rozdziale.
Co to jest Offline-AI?
Technologia offline-AIjest zoptymalizowaną inteligencją sztuczną, która może działać bez połączenia z Internetem, ale w razie potrzeby może się skontaktować z otoczeniem.
Zalety:
- Pełna kontrola danych
- Często lepsze wyniki niż ChatGPT, Gemini itp
- Często taniej
Więcej informacji o offline-Inteligencji Użytelniczej
Jaki jest realny czasowy zakres dla projektu AI?
Dla prototypu i oceny możliwości koszt jest często bardzo niski. Gdy chodzi o przetwarzanie Twoich danych, muszą one (jak zawsze) zostać wczytane. Jest to zadanie konwencjonalne.
Czas działa dla What: Rozpoczęcie projektu AI pozwoli Wam na pewność, że postęp technologiczny w dziedzinie AI będzie Waszym sprzyjającym czynnikiem już za kilka miesięcy.
Jak łatwo można wymienić model językowy AI na inny
Krótko mówiąc: najczęściej jest to możliwe zaledwie na skutek zmiany kilku linijek kodu. Wiele modeli języka opiera się na tej samej architekturze systemowej. Nowe, lepsze modele języka mogą być więc wykorzystane jako Drop-In Replacement, by użyć technicznego terminu.
Jaki jest koszt licencji dla programów AI i modeli języka AI?
Rynek oprogramowania otwartego dostarcza w obszarze AI jakość i aktualność nieporównywalnie wyższą niż jakikolwiek inny rynek oprogramowania otwartego.
To dotyczy zarówno ram kiedy wie Frameworków, jak i modeli językowych AI (i innych modeli AI).
Koszty licencyjne są więc, krótko mówiąc, zero.
A oto tłumaczenie: "I Anders widzi to, jak API ChatGPT itp. jest wykorzystywane. Wtedy pojawiają się koszty zależne od intensywności użycia.
Czy można uruchomić AI na własnej maszynie?
Tak. Przykładowy przykład z praktyki: Ten tekst został napisany na laptopie, na którym działają modeli języka KI o 30 miliardach parametrów (modele 30B). Co jest możliwe na laptopie, działa jeszcze bardziej na serwerze KI.
Do AI-servera: Albo wynająć (od niemieckiego lub wyłącznie europejskiego dostawcy) albo kupić. Główne koszty przy zakupie wynikają z kosztów kart graficznych.
Dla wielu przypadków zastosowania, takich jak wyszukiwanie wiedzy lub generowanie rekomendacji do zgłoszeń szkód lub skarg klientów, wystarcza Ograniczony sprzęt.
Jaki jest koszt opieki nad aplikacją AI?
Zapotrzebowanie opiekuńcze jest raczej niż u innych systemów IT niższym, często nawet zerowym. Jeśli dostępne są nowe dokumenty wiedzy, mogą być automatycznie przeczytane i przetłumaczone. Koszt powstaje naturalnie, gdy zebrane zostanie nowe wiedza, aby poprawić jakość systemu lub dodać nowe informacje. Bez dodawania nowych informacji koszt jest raczej niż zero.
Czy aplikacji AI można po uruchomieniu dodać nowe wiadomości?
Tak, to jest możliwe w kilku aspektach.
Najłatwiejszym sposobem jest wybieranie nowych informacji, które pasują do pytania użytkownika, aby przedstawić je modelowi językowemu i ułatwić mu odpowiedź.
Większe znaczenie ma drobne uzupełnianie wiedzy modelu językowego. Model językowy jest tu w pewien sposób doskonalony.
Do rozwikłania AI potrzebne są przykłady.
Czy można wygenerować dane treningowe, jeśli jest za mało przykładów?
Tak, to jest możliwe. Dla tego tworzone są sztuczne przykłady. To nazywa się zestawami danych syntetycznymi. Aby stworzyć zestawy danych syntetycznych, używany jest model języka. Aby utworzyć publiczne dane można skorzystać z usług chmurowych takich jak ChatGPT, Command R+ itp., jeśli to się Tobie spodoba. Czasem lepiej, ponieważ również bez dodatkowych kosztów możliwe jest korzystanie z lokalnego modelu języka. Ten lokalny model może być także nauczony, aby szczególnie dobrze radzić sobie w generowaniu syntetycznych danych szkoleniowych.
Innym zaletą lokalnych modeli jest możliwość ich ciągłego (24/7) wykorzystania do generowania syntetycznych danych. Co kosztowałoby kilkadziesiąt tysięcy euro miesięcznie przy pomocy ChatGPT, może być wykonane przez lokalne AI-modeli za stałą opłatą. Ta stała opłata składa się z kosztów eksploatacji Twojej sprzętowej infrastruktury. Jeśli korzystasz z wynajmowanego sprzętu, te koszty wynoszą kilkaset euro miesięcznie. Jeśli kupisz system lub masz go już w swoim posiadaniu, to jedynym kosztem eksploatacji będą koszty energii elektrycznej.
Tu już można zobaczyć, że istotne korzyści strategiczne i możliwości wynikają z tego, kiedy się trochę więcej wysili niż inni, którzy ze względu na swawolność wybierają „ChatGPT” za najlepsze rozwiązanie.
Jaki jest stopień wiarygodności odpowiedzi modelu językowego / chatbota / systemu AI?
Jest tak samo jak u ludzi: nikt nie wie, poza tym ktoś już wcześniej wiedział odpowiedź.
Konkret: Modele języka często dostarczają w standardowym trybie pracy prawidłowych odpowiedzi, ale nie zdecyduj się na ich zaufanie. Nawet ChatGPT zawodzi przy bardziej szczegółowych pytańach, które nie odnoszą się bezpośrednio do wysokości wieży Eiffla.
Poszukiwanie wiedzy w dokumentach ma nawet wysoką wiarygodność.
Wiarygodność chatbotów znacznie można poprawić dzięki inteligentnym dodatkowym technikom, kosztem niewielkim.
Wynik: „Nie ma darmowej obiadów“. Trzeba się trochę wysilić, aby osiągnąć wysoką niezawodność. Koszt wysiłku jest często zrozumiały i ekonomicznie uzasadniony.
Jak można zapobiec przepływowi danych do ChatGPT lub innych dostawców AI?
Zapobieganie przepływowi danych do OpenAI lub Microsoft jest możliwe tylko wtedy, gdy nie korzystacie z ChatGPT.
Używając ChatGPT nie da się zatrzymać przepływu danych. Często ustawienia dotyczące ochrony prywatności są na szkodę klientów (Opt-Out w miejsce Opt-in). Przepływ Twoich danych może być tylko prawnie, czyli teoretycznie, zatrzymany.
Jakie problemy dotyczące ochrony danych osobowych mogą wystąpić przy użyciu aplikacji takiej jak HeyGen?
HeyGen jest tu jedynie jako zastępstwo wielu aplikacji AI tego rodzaju, które mogą generować syntetyczne treści.
HeyGen jest dostępnym online narzędziem do tworzenia filmów. W tym celu klonuje się własny głos, umieszcza na innym obliczu i synchronizuje usta z nim. Tekst wprowadzony zostaje wydany jako mowa w klonowanym głosie.
Jeśli marketingowy pracownik sam proponuje HeyGen i dobrowolnie pozwala na klonowanie swojego głosu, może nie mieć prawa do cofnięcia, ponieważ wcześniej nie wyraził zgody, którą mógłby później odwołać. W przeciwnym razie należy zwrócić uwagę na to, że dla użycia ludzkiej głosu może być wymagana zgoda posiadacza głosu.
Czy ChatGPT jest najlepszym modelem językowym?
Prawdopodobnie nie. ChatGPT dostarcza niesamowite wyniki, ale nie został specjalnie szkoleny na język niemiecki. Ponadto jest "stary", opiera się architekturze, która już teraz uważana jest za przestarzałą. Samo ogromne ilości danych i ogromna wielkość (liczba neuronów sztucznych i połączeń) sprawiają, że osiąga ona konkurencyjną wydajność.
Koszty ChatGPT są niekonkurencyjne, ponieważ w porównaniu są często więcej niż dwa razy wyższe niż u innych dostawców modeli języka. Mistral z Francji oferuje bardzo dobre modele, tak samo Cohere z USA. Dostawcy spoza Europy są bardziej odpowiedni dla aplikacji, w których nie chodzi o krytyczne dane i nie ma obawy przed przepływem informacji.
Modele otwarte źródłowo są już tak dobre, że są konkurujące. Są one również coraz lepsze i mogą być prowadzone samodzielnie.
Co należy uwzględnić przy eksploatacji automatycznego odbiornika głosowego z wykorzystaniem AI?
Oto tłumaczenie: Oczywiście chodzi tu o (statyczną) informację, która została utworzona przy pomocy aplikacji AI.
Syntetyczna głos powinien być nieco podobny do realnej osoby (z rozpoznawalną głosem). Do syntezowania głosu powinno być używane materiał źródłowy, który jest bezpieczny prawem autorskim.
Wszystko inne nie jest istotne do uwagi. W szczególności tu przez AI nie są przetwarzane dane osobowe.
Jaki wiedzy powinien dysponować programista AI?
Głębokie wiedza techniczna i doświadczenie programistyczne są bardzo przydatne. Kto nigdy nie pracował głębiej nad programowaniem AI, nie powinien zaczynać budowy systemu AI od zera.
AI jest bardzo skomplikowanym tematem z licznymi szybkimi rozwojami. W szczególności powinny być znane umiejętności w Python i Linux/Ubuntu (itp.). Jeśli są znane podstawowe zasady sztucznej inteligencji, nie szkodzi to. Również znajomość programowania interfejsów jest korzystna. Czy programista ten jest taki, który system po raz pierwszy ustawia i od podstaw instaluje go, to inna sprawa. Czasem jest sensowne, gdy ktoś inny to robi.
Co do tego, jest to w średnim terminie korzystne, jeśli techniczny odpowiedzialny (często programista/rozwiązujący) intensywnie śledzi i zna szybko rozwijające się rozwiązania AI na rynku technicznym.
Czy można również używać AI do innych zadań niż do redagowania tekstów?
Tak. Mówimy tu o modalnościach. Modalnością są typy danych, czyli tekst, obraz, wideo, audio, dane z temperatury, dane analizy webowej itp.
Dla wielu modalności istnieją modele AI, a mianowicie Open-Source, czyli dostępne bezpłatnie. Na przykład z wideo lub podcastów można wydobyć język i przekształcić go na tekst. To jest możliwe za pomocą własnych systemów AI opartych na Open-Source lepiej niż np. Microsoft Teams! Zabiegając o kontrolę danych, pomijamy tę kwestię.
Jaki komputer polecamy jako stanowisko robocze dla AI?
Zależy, czy chcą programować lub tylko pracować z AI jako użytkownik.
Dla programowania polecam system Ubuntu. Możliwe jest również korzystanie z Windowsa z WSL, co dla dobrego wejścia jest odpowiednie, ale nie dla profesjonalistów.
Jako użytkownik możecie wybrać dowolny komputer (lub notebook) posiadający kartę graficzną zdolną do obsługi KI z możliwie dużym ilością pamięci VRAM (NVidia) lub chip KI od Apple (np. M3). Wszystko inne jest prawie nieistotne. Istotnie byłoby jeszcze dysk twardy o pojemności co najmniej 1 TB, najlepiej z szybką technologią SSD. Pamięć RAM powinna wynosić co najmniej 32 GB.
Uwagi końcowe
Pewnie jeszcze wiele innych pytań. Nie wahajcie się zadać swoich pytań. Z chęcią odpowiedzią na nie.
Jeśli potrzebujecie pierwszej oceny możliwości lub nakładu pracy na realizację swojego projektu, z przyjemnością udzielimy wskazówek realistycznych.



My name is Klaus Meffert. I have a doctorate in computer science and have been working professionally and practically with information technology for over 30 years. I also work as an expert in IT & data protection. I achieve my results by looking at technology and law. This seems absolutely essential to me when it comes to digital data protection. My company, IT Logic GmbH, also offers consulting and development of optimized and secure AI solutions.
