Drücke „Enter”, um zum Inhalt zu springen.
Hinweis zu diesem Datenschutz-Blog:
Anscheinend verwenden Sie einen Werbeblocker wie uBlock Origin oder Ghostery, oder einen Browser, der bestimmte Dienste blockiert.
Leider wird dadurch auch der Dienst von VG Wort blockiert. Online-Autoren haben einen gesetzlichen Anspruch auf eine Vergütung, wenn ihre Beiträge oft genug aufgerufen wurden. Um dies zu messen, muss vom Autor ein Dienst der VG Wort eingebunden werden. Ohne diesen Dienst geht der gesetzliche Anspruch für den Autor verloren.

Ich wäre Ihnen sehr verbunden, wenn Sie sich bei der VG Wort darüber beschweren, dass deren Dienst anscheinend so ausgeprägt ist, dass er von manchen als blockierungswürdig eingestuft wird. Dies führt ggf. dazu, dass ich Beiträge kostenpflichtig gestalten muss.

Durch Klick auf folgenden Button wird eine Mailvorlage geladen, die Sie inhaltlich gerne anpassen und an die VG Wort abschicken können.

Nachricht an VG WortMailtext anzeigen

Betreff: Datenschutzprobleme mit dem VG Wort Dienst(METIS)
Guten Tag,

als Besucher des Datenschutz-Blogs Dr. DSGVO ist mir aufgefallen, dass der VG Wort Dienst durch datenschutzfreundliche Browser (Brave, Mullvad...) sowie Werbeblocker (uBlock, Ghostery...) blockiert wird.
Damit gehen dem Autor der Online-Texte Einnahmen verloren, die ihm aber gesetzlich zustehen.

Bitte beheben Sie dieses Problem!

Diese Nachricht wurde von mir persönlich abgeschickt und lediglich aus einer Vorlage generiert.
Wenn der Klick auf den Button keine Mail öffnet, schreiben Sie bitte eine Mail an info@vgwort.de und weisen darauf hin, dass der VG Wort Dienst von datenschutzfreundlichen Browser blockiert wird und dass Online Autoren daher die gesetzlich garantierten Einnahmen verloren gehen.
Vielen Dank,

Ihr Klaus Meffert - Dr. DSGVO Datenschutz-Blog.

PS: Wenn Sie meine Beiträge oder meinen Online Website-Check gut finden, freue ich mich auch über Ihre Spende.
Ausprobieren Online Webseiten-Check sofort das Ergebnis sehen

DeepSeek vs ChatGPT: Weryfikacja faktów na temat chińskiego modelu językowego AI

0
Dr. DSGVO Newsletter detected: Extended functionality available
More articles · Website-Checks · Live Offline-AI

Sztuczna inteligencja to bardzo złożony temat, którego nie rozumie nawet wielu techników. Do tego dochodzą raporty, które często są niedokładne z powodu koniecznego uproszczenia lub potrzeby zwrócenia uwagi. Rezultatem są stwierdzenia, które malują zniekształcony obraz DeepSeek. Najważniejsze fakty w prostym języku.

Wprowadzenie

DeepSeek jest chińską firmą. Model językowy DeepSeek-R1 został niedawno opublikowany przez tę firmę. Mówi się, że jest równie dobry, a częściowo nawet lepszy niż model językowy OpenAI o1 ("ChatGPT").

To spowodowało, że wartości przedsiębiorstw firm AI takich jak Nvidia były na dobrej drodze do upadku. Nawet organizacja ochrony prywatności noyb poinformowała o tym w swoim newsletterze z dnia 30.01.2025

Często przedstawia się, że DeepSeek jest znacznie bardziej wydajny niż ChatGPT. Jest to prawdą w istotnych aspektach, ale mniej w innych.

Następnie czytamy nagłówki takie jak ten:

Stan na dzień 30.01.2025, Źródło: https://www.epochtimes.de/politik/deutschland/deutsche-datenschuetzer-wollen-chinesische-deepseek-ki-ueberpruefen-medienbericht-a5022687.html (obraz został przetłumaczony automatycznie).

Sprawia to wrażenie, że chiński model językowy nie jest bezpieczny, ponieważ dane użytkownika mogą zostać niewłaściwie wykorzystane.

Większość tego typu stwierdzeń krążących w domenie publicznej nie jest w pełni zgodna z prawdą.

Fakty na temat DeepSeek

Ochrona i bezpieczeństwo danych

DeepSeek to nazwa chińskiej firmy. Jeśli DeepSeek jest używany jako nazwa modelu językowego, należy rozróżnić dwa warianty:

  1. Wersja w chmurze, określana również jako "aplikacja
  2. Model językowy open source, może być używany całkowicie niezależnie

Tekst oryginalny: Die weiter oben genannte Berichterstattung, dass „DeepSeek“ wahrscheinlich Nutzerdaten missbrauche, kann sich nur auf die Cloud-Version („App“) beziehen. Denn das Open Source-Sprachmodell kann heruntergeladen und lokal betrieben werden, ganz bez połączenia z Internetem. Ohne solche Verbindung können schlecht Nutzerdaten nach China wandern. Tłumaczenie: Opisany powyżej raport o tym, że „DeepSeek” prawdopodobnie wykorzystuje dane użytkowników, dotyczy tylko wersji chmurowej („App”). Bo model językowy open source można pobrać i uruchomić lokalnie, całkowicie bez połączenia z Internetem. Bez takiego połączenia dane użytkownika mogą nieporadnie trafić do Chin.

Model językowy DeepSeek może być używany bez żadnego ryzyka dla bezpieczeństwa.

Mianowicie w wersji lokalnej, która może działać na własnym serwerze AI.

ChatGPT nie jest również bezstronnie bezpieczna. Amerkańskie ustawy dotyczące służb specjalnych pozwalają amerykańskim władzom i agencjom wywiadowczym na dostęp do danych innych osób. Porozumienie o ochronie danych między UE a USA (DPF) było zawsze mało wartościowe i jedynie formalne. Opiera się ono bowiem na przekazie prezydenta Joe Bidena. Zatwierdzenie przez Trumpa rozwiązania istotnego gremium jeszcze bardziej obniży jego wartość. Prezydencki przekaz może być również w każdej chwili uznany za nieważny przez Donalda Trumpa.

OpenAI również dobrze się bawi zbierając Twoje dane. Nawet jeśli dane z ChatGPT nie zostaną wykorzystane do szkolenia sztucznej inteligencji, mogą zostać użyte do innych celów! Na przykład do analizy sztucznej inteligencji OpenAI, która następnie uzależnia cię coraz bardziej (już ogłoszono wzrost cen).

Wydajność

Według informacji szkolenie DeepSeek-R1 kosztowało około 6 milionów dolarów USA. Faktualnie koszty były wyższe, ponieważ ta liczba odnosi się nie do całych kosztów i dotyczy modelu podstawowego DeepSeek-V3. Na szkolenie ChatGPT przeznaczono sumę 100 milionów dolarów USA.

To zdecydowanie prawda:

  • DeepSeek-R1 może być obsługiwany na znacznie tańszym sprzęcie niż ChatGPT
  • DeepSeek-R1 reaguje znacznie szybciej niż ChatGPT, ponieważ jest znacznie "mniejszy
  • Działanie DeepSeek-R1 zużywa zatem znacznie mniej energii

Dlaczego DeepSeek-R1 jest mniejszy niż ChatGPT? Według DeepSeek, R1 jest modelem 685B, czyli składa się z 685 miliardów połączeń neuronowych. ChatGPT ma prawdopodobnie podobny rozmiar. Co teraz?

DeepSeek-R1 działa tak jak ludzkie mózg: Gdy mówisz, aktywowane jest głównie centrum mowy. Podczas mówienia więc tylko nieliczne z Twoich neuronów w mózgu są włączone. Technicznie to osiągnięto przy pomocy takiej struktury Mixture of Experts. Ta architektura była już od dawna powszechnie używana. Została np. wykorzystana przez Mistrala.

Ponieważ DeepSeek-R1 jest oprogramowaniem typu open source, może być pobierany i obsługiwany przez użytkownika. Aby uruchomić DeepSeek-R1 na własnym sprzęcie, potrzebny jest serwer, który kosztuje około 30 000 euro. Wiele firm może sobie na to pozwolić. ChatGPT, z drugiej strony, nie chcesz uruchamiać na własnym sprzęcie, pomijając fakt, że nie możesz, ponieważ OpenAI nie chce i dlatego nie udostępnił modelu.

jakość

W różnych testach porównawczych DeepSeek-R1 radzi sobie równie dobrze jak OpenAI o1. Dzieje się tak pomimo faktu, że R1 jest znacznie wydajniejszy i mniejszy niż ChatGPT. Użytkownicy zgłaszają, że R1 jest tak samo dobry jak ChatGPT, podczas gdy inni widzą R1 w czołówce.

Chińscy cenzorzy usunęli lub zniekształcili niektóre fakty z modelu. W rezultacie jakość niektórych kwestii politycznych jest niska.

Jednak ogólny chatbot jest najgorszym możliwym przypadkiem użycia dla korporacyjnej sztucznej inteligencji. Pod tym względem prawie nie ma znaczenia, że niektóre fakty polityczne w R1 są wątpliwe. Dzięki standardowym procedurom, takim jak dostrajanie lub RAG, aplikacje tekstowe mogą być bardzo dobrze obsługiwane przez R1. Inne przypadki użycia mogą być realizowane jeszcze lepiej z R1. Obejmują one:

  • Zapoznaj się z wiedzą firmy (zapoznaj się z dokumentami),
  • Wypełnianie obowiązków wynikających z ustawy o łańcuchu dostaw, na przykład poprzez analizę dokumentów dostawców,
  • Twórz streszczenia, tłumaczenia lub uproszczenia językowe.
  • Asystent programowania

W szczególności ostatni przykład zastosowania jest bardzo interesujący. Tak oto autorowi udało się w ciągu kilku godzin zaprogramować to, co inaczej kosztowałoby kilka tygodni czasu. A to głównie na kanapce przy nieprzyjaznym tabletu i bez użycia mikrofonu. Jest oczywiście różnica pomiędzy tym, czy ktoś programuje AI z zabawą przez 30 minut lub czy osiąga to samo wyniki po dwóch dniach w najlepszym przypadku. ([1])

Dalsze zalety DeepSeek-R1 w porównaniu do ChatGPT

OpenAI regularnie wydaje nową wersję lub podwersję ChatGPT. Te warianty różnią się odnośnie odpowiedzi na Twoją pytanie. Nie ma tu spójności. Bez spójności nie ma niezawodność przy automatyzacji procesów.

OpenAI jest płatne. Wersja bezpłatna jest dla firm albo nieistotna, albo po prostu wykorzystywana. Płatna konsola chatowa nie pomaga w automatyzacji Twoich procesów. Płatna interfejs API (API) wiąże się z niepewnościami: ile razy będziesz musiał ją uruchomić? Ile danych będziesz musiał wysłać do API? Zależnie od rozmiaru danych koszty korzystania z API będą wyższe lub niższe.

Aktualizacje mają miejsce, gdy OpenAI je zaplanuje. Oznacza to również, że aktualizacje nie odbywają się wtedy, kiedy chcesz. Jako dostawca, OpenAI określa wersję ChatGPT, której możesz używać.

DeepSeek działa tak, jak możecie się spodziewać. Jednorazowo pobrany, zawsze odpowiada natychmiast. Testy i benchmarki pokazują trwały stan istnienia.

DeepSeek może być prowadzony do kosztów stałych, które w zasadzie składają się z ceny sprzętu (lub jego wynajmu).

DeepSeek można łatwo zastąpić innymi modelami lub nowszymi wariantami modeli. To się dzieje dokładnie wtedy, gdy chcesz. Niepewności można usunąć poprzez testy. Ogólnie rzecz biorąc jest to również dobry pomysł, aby konkretnych przypadków zastosowania rozwiązać za pomocą AI. Można je bardzo dobrze opanować i zweryfikować.

Dlaczego DeepSeek to wielki wybuch?

To dość zdumiewające, że model językowy taki jak R1 pokonuje najlepszego psa, ChatGPT, w opinii ogółu społeczeństwa. I to pomimo faktu, że model DeepSeek jest mniejszy. DeepSeek wykorzysta również mniej zasobów niż OpenAI.

Ale to nie wszystko: DeepSeek-R1 został opublikowany i udostępniony za darmo. W skrócie oznacza to:

  1. Każdy może pobrać DeepSeek-R1, pobierając niektóre pliki w przeglądarce na dysk twardy. Każdy
  2. Każdy może następnie zainstalować R1 lokalnie na swoim serwerze AI. Każdy.
  3. Każdy może następnie korzystać z R1 tak często i tak długo, jak chce. Nie ma żadnych dodatkowych kosztów.

Dla kontrastu, oto możliwości oferowane przez ChatGPT.

  1. Nikt nie może pobrać ChatGPT.
  2. Nikt nie może używać ChatGPT do automatyzacji zadań lub innego wykorzystania API bez wydawania nieprzewidywalnej ilości pieniędzy.

Prawdziwa sensacja

Ale to nie wszystko.

DeepSeek zdobywa tym samym koronę: DeepSeek zdradza nam przepis na DeepSeek-R1.

Oznacza to:

  • Każdy może zbudować klona ChatGPT.
  • Nikt nie potrzebuje więcej OpenAI.

W szczególności, poniższe rozwiązanie jest dostępne w DeepSeek jako open source:

  • Metoda treningowa z R1 jako koncepcja ("papier")
  • Metoda szkoleniowa R1 jako użyteczna biblioteka programów (Python)
  • Destylacja zbiorów danych zawierających wiedzę i zwerbalizowane procesy myślowe z DeepSeek
  • Główne zestawy danych, takie jak C4 lub The Pile, które od dawna są powszechnie znane

Aby to zilustrować, oto fragment jednego ze wspomnianych zestawów danych destylatów:

Zestaw danych OpenThoughts-114k, wyciąg.

A oto opublikowany przepis na wypiek, aby Twoja firma mogła również upiec nowy model AI z jakością ChatGPT, jeśli zajdzie taka potrzeba:

Źródło: HuggingFace

To był tylko wybór. Opisano również inne drobne szczegóły, takie jak Multi-token Prediction

Kod do odtworzenia DeepSeek-R1 jest dostępny jako kod źródłowy w bibliotece Transformers w Pythonie.

DeepSeek powiedział wszystkim, jak można odbudować ChatGPT.

To jest prawdziwa sensacja.

Więcej wrażeń

DeepSeek ujawnił również wszystkim, w jaki sposób istniejące modele językowe, które są dość małe, można uczynić jeszcze bardziej inteligentnymi w prosty sposób za pomocą transferu wiedzy.

Te mniejsze modele nazywają się Destillatmodeli. Takie model jest tak małe, że może być uruchomione na tańszej sprzęcie. Niektóre z tych bardziej rozbudowanych modeli mogą działać na Low Cost AI-serverze. Najmniejszy z nich może nawet zostać zainstalowany na współczesnym smartfonie i działać bez połączenia z Internetem!

DeepSeek udostępnił również te modele destylatów.

Wynik

DeepSeek (jako firma lub model AI) nie stanowi zagrożenia dla ochrony danych, jeśli nie korzystasz z aplikacji DeepSeek. OpenAI stanowi zagrożenie dla bezpieczeństwa wrażliwych danych, ponieważ można korzystać tylko z wersji w chmurze.

DeepSeek ujawnił, w jaki sposób można zastąpić ChatGPT. Mniejsze modele jako produkt odpadowy są wspaniałym dodatkowym prezentem, który został podarowany. Za rozsądną kwotę (zakup sprzętu lub wynajem komputerów) każda firma może teraz odtworzyć ChatGPT dla siebie.

Nawet jeśli DeepSeek pochodzi z Chin: open source to open source. Oczywiście wszyscy dostawcy większych modeli sztucznej inteligencji kradli dane, nie tylko DeepSeek. Google i Meta również nadużywają danych użytkowników.

Niemieckie firmy mogą bezpiecznie wykorzystywać DeepSeek AI do rozwiązywania licznych problemów i automatyzacji procesów.

Mianowicie z firmową sztuczną inteligencją, która działa (tylko) w Twojej firmie.

Światowa szansa dla firm jest ogromna od DeepSeek-R1, aby automatyzować procesy przy pomocy AI. Z lokalnymi modelami staje się również dużo przyjemniejsze spełnienie zobowiązań wynikających z rozporządzenia dotyczącego AI , które obowiązują od 02 lutego 2025 roku ([1]) !

Kluczowe przesłania tego artykułu

DeepSeek-R1 to model języka chińskiego, który według raportów z testów jest tak samo dobry jak ChatGPT.

DeepSeek-R1 jest bardziej wydajny niż ChatGPT, wymaga mniej mocy obliczeniowej i zużywa mniej energii.

DeepSeek-R1 jest oprogramowaniem typu open source, więc można go pobrać i obsługiwać lokalnie, co gwarantuje bezpieczeństwo danych.

Każdy może korzystać z DeepSeek-R1, a nawet tworzyć własne modele według tego samego przepisu.

O tych podstawowych stwierdzeniach
About the author on dr-dsgvo.de
My name is Klaus Meffert. I have a doctorate in computer science and have been working professionally and practically with information technology for over 30 years. I also work as an expert in IT & data protection. I achieve my results by looking at technology and law. This seems absolutely essential to me when it comes to digital data protection. My company, IT Logic GmbH, also offers consulting and development of optimized and secure AI solutions.

DeepSeek-R1: Mały model językowy wyparowuje z rynku akcji