Czy DeepSeek naprawdę jest bezpieczniejszy niż ChatGPT?

DeepSeek jest bezpieczny w swojej wersji open source, ponieważ może być obsługiwany lokalnie i w ten sposób żadne dane użytkowników nie są przekazywane do Chin. ChatGPT z kolei jest bardziej podatny, ponieważ agencje wywiadowcze Stanów Zjednoczonych mogą uzyskiwać dane od użytkowników.

Jak wydajny jest DeepSeek-R1 w porównaniu z ChatGPT?

DeepSeek-R1 jest znacznie bardziej wydajny, ponieważ może być uruchamiany na mniej wydajnym sprzęcie, odpowiada szybciej i zużywa mniej energii niż ChatGPT.

Jakie przypadki użycia są szczególnie interesujące w przypadku DeepSeek-R1?

DeepSeek-R1 jest dobrze przystosowany do odpowiadania na pytania dotyczące wiedzy firmowej, spełniania przepisów dotyczących łańcucha dostaw oraz tworzenia streszczeń, tłumaczeń lub uproszczeń językowych, co czyni go cennym narzędziem dla różnych zastosowań biznesowych.

Jakie są główne różnice między DeepSeek a ChatGPT?

DeepSeek wyróżnia się swoją naturą open-source, umożliwia lokalne działanie bez kosztów i oferuje spójność, w przeciwieństwie do wariujących wersji ChatGPT i ich nieprzewidywalnych kosztów.

Jak wykorzystać DeepSeek-R1?

DeepSeek-R1 może być pobrany i uruchomiony na własnym sprzęcie przez każdego, bez opłat abonamentowych ani zależności od chmury. Pozwala to na lokalne i ekonomiczne użytkowanie.

DeepSeek vs ChatGPT: Weryfikacja faktów na temat chińskiego modelu językowego AI

Sztuczna inteligencja to bardzo złożony temat, którego nie rozumie nawet wielu techników. Do tego dochodzą raporty, które często są niedokładne z powodu koniecznego uproszczenia lub potrzeby zwrócenia uwagi. Rezultatem są stwierdzenia, które malują zniekształcony obraz DeepSeek. Najważniejsze fakty w prostym języku.

Wprowadzenie

DeepSeek jest chińską firmą. Model językowy DeepSeek-R1 został niedawno opublikowany przez tę firmę. Mówi się, że jest równie dobry, a częściowo nawet lepszy niż model językowy OpenAI o1 ("ChatGPT").

To spowodowało, że wartości przedsiębiorstw firm AI takich jak Nvidia były na dobrej drodze do upadku. Nawet organizacja ochrony prywatności noyb poinformowała o tym w swoim newsletterze z dnia 30.01.2025

Często przedstawia się, że DeepSeek jest znacznie bardziej wydajny niż ChatGPT. Jest to prawdą w istotnych aspektach, ale mniej w innych.

Następnie czytamy nagłówki takie jak ten:

Stan na dzień 30.01.2025, Źródło: https://www.epochtimes.de/politik/deutschland/deutsche-datenschuetzer-wollen-chinesische-deepseek-ki-ueberpruefen-medienbericht-a5022687.html (obraz został przetłumaczony automatycznie).

Sprawia to wrażenie, że chiński model językowy nie jest bezpieczny, ponieważ dane użytkownika mogą zostać niewłaściwie wykorzystane.

Większość tego typu stwierdzeń krążących w domenie publicznej nie jest w pełni zgodna z prawdą.

Fakty na temat DeepSeek

Ochrona i bezpieczeństwo danych

DeepSeek to nazwa chińskiej firmy. Jeśli DeepSeek jest używany jako nazwa modelu językowego, należy rozróżnić dwa warianty:

Wersja w chmurze, określana również jako "aplikacja
Model językowy open source, może być używany całkowicie niezależnie

Tekst oryginalny: Die weiter oben genannte Berichterstattung, dass „DeepSeek“ wahrscheinlich Nutzerdaten missbrauche, kann sich nur auf die Cloud-Version („App“) beziehen. Denn das Open Source-Sprachmodell kann heruntergeladen und lokal betrieben werden, ganz bez połączenia z Internetem. Ohne solche Verbindung können schlecht Nutzerdaten nach China wandern. Tłumaczenie: Opisany powyżej raport o tym, że „DeepSeek” prawdopodobnie wykorzystuje dane użytkowników, dotyczy tylko wersji chmurowej („App”). Bo model językowy open source można pobrać i uruchomić lokalnie, całkowicie bez połączenia z Internetem. Bez takiego połączenia dane użytkownika mogą nieporadnie trafić do Chin.

Model językowy DeepSeek może być używany bez żadnego ryzyka dla bezpieczeństwa.
Mianowicie w wersji lokalnej, która może działać na własnym serwerze AI.

ChatGPT nie jest również bezstronnie bezpieczna. Amerkańskie ustawy dotyczące służb specjalnych pozwalają amerykańskim władzom i agencjom wywiadowczym na dostęp do danych innych osób. Porozumienie o ochronie danych między UE a USA (DPF) było zawsze mało wartościowe i jedynie formalne. Opiera się ono bowiem na przekazie prezydenta Joe Bidena. Zatwierdzenie przez Trumpa rozwiązania istotnego gremium jeszcze bardziej obniży jego wartość. Prezydencki przekaz może być również w każdej chwili uznany za nieważny przez Donalda Trumpa.

OpenAI również dobrze się bawi zbierając Twoje dane. Nawet jeśli dane z ChatGPT nie zostaną wykorzystane do szkolenia sztucznej inteligencji, mogą zostać użyte do innych celów! Na przykład do analizy sztucznej inteligencji OpenAI, która następnie uzależnia cię coraz bardziej (już ogłoszono wzrost cen).

Wydajność

Według informacji szkolenie DeepSeek-R1 kosztowało około 6 milionów dolarów USA. Faktualnie koszty były wyższe, ponieważ ta liczba odnosi się nie do całych kosztów i dotyczy modelu podstawowego DeepSeek-V3. Na szkolenie ChatGPT przeznaczono sumę 100 milionów dolarów USA.

To zdecydowanie prawda:

DeepSeek-R1 może być obsługiwany na znacznie tańszym sprzęcie niż ChatGPT
DeepSeek-R1 reaguje znacznie szybciej niż ChatGPT, ponieważ jest znacznie "mniejszy
Działanie DeepSeek-R1 zużywa zatem znacznie mniej energii

Dlaczego DeepSeek-R1 jest mniejszy niż ChatGPT? Według DeepSeek, R1 jest modelem 685B, czyli składa się z 685 miliardów połączeń neuronowych. ChatGPT ma prawdopodobnie podobny rozmiar. Co teraz?

DeepSeek-R1 działa tak jak ludzkie mózg: Gdy mówisz, aktywowane jest głównie centrum mowy. Podczas mówienia więc tylko nieliczne z Twoich neuronów w mózgu są włączone. Technicznie to osiągnięto przy pomocy takiej struktury Mixture of Experts. Ta architektura była już od dawna powszechnie używana. Została np. wykorzystana przez Mistrala.

Ponieważ DeepSeek-R1 jest oprogramowaniem typu open source, może być pobierany i obsługiwany przez użytkownika. Aby uruchomić DeepSeek-R1 na własnym sprzęcie, potrzebny jest serwer, który kosztuje około 30 000 euro. Wiele firm może sobie na to pozwolić. ChatGPT, z drugiej strony, nie chcesz uruchamiać na własnym sprzęcie, pomijając fakt, że nie możesz, ponieważ OpenAI nie chce i dlatego nie udostępnił modelu.

jakość

W różnych testach porównawczych DeepSeek-R1 radzi sobie równie dobrze jak OpenAI o1. Dzieje się tak pomimo faktu, że R1 jest znacznie wydajniejszy i mniejszy niż ChatGPT. Użytkownicy zgłaszają, że R1 jest tak samo dobry jak ChatGPT, podczas gdy inni widzą R1 w czołówce.

Chińscy cenzorzy usunęli lub zniekształcili niektóre fakty z modelu. W rezultacie jakość niektórych kwestii politycznych jest niska.

Jednak ogólny chatbot jest najgorszym możliwym przypadkiem użycia dla korporacyjnej sztucznej inteligencji. Pod tym względem prawie nie ma znaczenia, że niektóre fakty polityczne w R1 są wątpliwe. Dzięki standardowym procedurom, takim jak dostrajanie lub RAG, aplikacje tekstowe mogą być bardzo dobrze obsługiwane przez R1. Inne przypadki użycia mogą być realizowane jeszcze lepiej z R1. Obejmują one:

Zapoznaj się z wiedzą firmy (zapoznaj się z dokumentami),
Wypełnianie obowiązków wynikających z ustawy o łańcuchu dostaw, na przykład poprzez analizę dokumentów dostawców,
Twórz streszczenia, tłumaczenia lub uproszczenia językowe.
Asystent programowania

W szczególności ostatni przykład zastosowania jest bardzo interesujący. Tak oto autorowi udało się w ciągu kilku godzin zaprogramować to, co inaczej kosztowałoby kilka tygodni czasu. A to głównie na kanapce przy nieprzyjaznym tabletu i bez użycia mikrofonu. Jest oczywiście różnica pomiędzy tym, czy ktoś programuje AI z zabawą przez 30 minut lub czy osiąga to samo wyniki po dwóch dniach w najlepszym przypadku. ([1])

Dalsze zalety DeepSeek-R1 w porównaniu do ChatGPT

OpenAI regularnie wydaje nową wersję lub podwersję ChatGPT. Te warianty różnią się odnośnie odpowiedzi na Twoją pytanie. Nie ma tu spójności. Bez spójności nie ma niezawodność przy automatyzacji procesów.

OpenAI jest płatne. Wersja bezpłatna jest dla firm albo nieistotna, albo po prostu wykorzystywana. Płatna konsola chatowa nie pomaga w automatyzacji Twoich procesów. Płatna interfejs API (API) wiąże się z niepewnościami: ile razy będziesz musiał ją uruchomić? Ile danych będziesz musiał wysłać do API? Zależnie od rozmiaru danych koszty korzystania z API będą wyższe lub niższe.

Aktualizacje mają miejsce, gdy OpenAI je zaplanuje. Oznacza to również, że aktualizacje nie odbywają się wtedy, kiedy chcesz. Jako dostawca, OpenAI określa wersję ChatGPT, której możesz używać.

DeepSeek działa tak, jak możecie się spodziewać. Jednorazowo pobrany, zawsze odpowiada natychmiast. Testy i benchmarki pokazują trwały stan istnienia.

DeepSeek może być prowadzony do kosztów stałych, które w zasadzie składają się z ceny sprzętu (lub jego wynajmu).

DeepSeek można łatwo zastąpić innymi modelami lub nowszymi wariantami modeli. To się dzieje dokładnie wtedy, gdy chcesz. Niepewności można usunąć poprzez testy. Ogólnie rzecz biorąc jest to również dobry pomysł, aby konkretnych przypadków zastosowania rozwiązać za pomocą AI. Można je bardzo dobrze opanować i zweryfikować.

Dlaczego DeepSeek to wielki wybuch?

To dość zdumiewające, że model językowy taki jak R1 pokonuje najlepszego psa, ChatGPT, w opinii ogółu społeczeństwa. I to pomimo faktu, że model DeepSeek jest mniejszy. DeepSeek wykorzysta również mniej zasobów niż OpenAI.

Ale to nie wszystko: DeepSeek-R1 został opublikowany i udostępniony za darmo. W skrócie oznacza to:

Każdy może pobrać DeepSeek-R1, pobierając niektóre pliki w przeglądarce na dysk twardy. Każdy
Każdy może następnie zainstalować R1 lokalnie na swoim serwerze AI. Każdy.
Każdy może następnie korzystać z R1 tak często i tak długo, jak chce. Nie ma żadnych dodatkowych kosztów.

Dla kontrastu, oto możliwości oferowane przez ChatGPT.

Nikt nie może pobrać ChatGPT.
Nikt nie może używać ChatGPT do automatyzacji zadań lub innego wykorzystania API bez wydawania nieprzewidywalnej ilości pieniędzy.

Prawdziwa sensacja

Ale to nie wszystko.

DeepSeek zdobywa tym samym koronę: DeepSeek zdradza nam przepis na DeepSeek-R1.

Oznacza to:

Każdy może zbudować klona ChatGPT.
Nikt nie potrzebuje więcej OpenAI.

W szczególności, poniższe rozwiązanie jest dostępne w DeepSeek jako open source:

Metoda treningowa z R1 jako koncepcja ("papier")
Metoda szkoleniowa R1 jako użyteczna biblioteka programów (Python)
Destylacja zbiorów danych zawierających wiedzę i zwerbalizowane procesy myślowe z DeepSeek
Główne zestawy danych, takie jak C4 lub The Pile, które od dawna są powszechnie znane

Aby to zilustrować, oto fragment jednego ze wspomnianych zestawów danych destylatów:

Zestaw danych OpenThoughts-114k, wyciąg.

A oto opublikowany przepis na wypiek, aby Twoja firma mogła również upiec nowy model AI z jakością ChatGPT, jeśli zajdzie taka potrzeba:

To był tylko wybór. Opisano również inne drobne szczegóły, takie jak Multi-token Prediction

Kod do odtworzenia DeepSeek-R1 jest dostępny jako kod źródłowy w bibliotece Transformers w Pythonie.

DeepSeek powiedział wszystkim, jak można odbudować ChatGPT.
To jest prawdziwa sensacja.

Więcej wrażeń

DeepSeek ujawnił również wszystkim, w jaki sposób istniejące modele językowe, które są dość małe, można uczynić jeszcze bardziej inteligentnymi w prosty sposób za pomocą transferu wiedzy.

Te mniejsze modele nazywają się Destillatmodeli. Takie model jest tak małe, że może być uruchomione na tańszej sprzęcie. Niektóre z tych bardziej rozbudowanych modeli mogą działać na Low Cost AI-serverze. Najmniejszy z nich może nawet zostać zainstalowany na współczesnym smartfonie i działać bez połączenia z Internetem!

DeepSeek udostępnił również te modele destylatów.

Wynik

DeepSeek (jako firma lub model AI) nie stanowi zagrożenia dla ochrony danych, jeśli nie korzystasz z aplikacji DeepSeek. OpenAI stanowi zagrożenie dla bezpieczeństwa wrażliwych danych, ponieważ można korzystać tylko z wersji w chmurze.

DeepSeek ujawnił, w jaki sposób można zastąpić ChatGPT. Mniejsze modele jako produkt odpadowy są wspaniałym dodatkowym prezentem, który został podarowany. Za rozsądną kwotę (zakup sprzętu lub wynajem komputerów) każda firma może teraz odtworzyć ChatGPT dla siebie.

Nawet jeśli DeepSeek pochodzi z Chin: open source to open source. Oczywiście wszyscy dostawcy większych modeli sztucznej inteligencji kradli dane, nie tylko DeepSeek. Google i Meta również nadużywają danych użytkowników.

Niemieckie firmy mogą bezpiecznie wykorzystywać DeepSeek AI do rozwiązywania licznych problemów i automatyzacji procesów.
Mianowicie z firmową sztuczną inteligencją, która działa (tylko) w Twojej firmie.

Światowa szansa dla firm jest ogromna od DeepSeek-R1, aby automatyzować procesy przy pomocy AI. Z lokalnymi modelami staje się również dużo przyjemniejsze spełnienie zobowiązań wynikających z rozporządzenia dotyczącego AI , które obowiązują od 02 lutego 2025 roku ([1]) !