Was sind die wichtigsten Unterschiede zwischen DeepSeek-R1 und ChatGPT?

DeepSeek-R1 ist kleiner, effizienter und schneller als ChatGPT, obwohl es in vielen Benchmarks eine vergleichbare Qualität erreicht. Wichtig ist, dass DeepSeek-R1 Open Source ist und lokal betrieben werden kann, während ChatGPT von OpenAI kontrolliert wird.

Welche Risiken sind mit der Nutzung der Cloud-Version von DeepSeek verbunden?

Die Cloud-Version von DeepSeek birgt das Risiko, dass Nutzerdaten an China gesendet werden, da sie von der chinesischen Firma DeepSeek betrieben wird. Diese Version ist jedoch nur dann anfällig, wenn sie nicht lokal auf eigener Hardware betrieben wird.

Wie hoch sind die Kosten für den Betrieb von DeepSeek-R1?

Der Betrieb von DeepSeek-R1 ist deutlich günstiger als der von ChatGPT, aber der Einstieg erfordert eine Investition von etwa 30.000 Euro für einen Server. Die tatsächlichen Kosten für das Basismodell DeepSeek-V3 lagen bei 6 Millionen USD, während ChatGPT mit 100 Millionen USD trainiert wurde.

Was ist der Hauptvorteil von DeepSeek gegenüber ChatGPT?

DeepSeek bietet die Möglichkeit, das Modell lokal herunterzuladen und zu betreiben, ohne Cloud-Abhängigkeit oder unerwartete Kosten. Dies ermöglicht eine unbegrenzte Nutzung und Kontrolle über das Modell.

Wie ist DeepSeek im Vergleich zu ChatGPT hinsichtlich der Zugänglichkeit?

Im Gegensatz zu ChatGPT, das nur über eine Cloud-basierte API zugänglich ist, kann DeepSeek vollständig heruntergeladen und lokal betrieben werden. Dies macht es für Unternehmen und Einzelpersonen zu einer attraktiven Alternative.

DeepSeek-R1 ist ein chinesisches KI-Sprachmodell, das in seiner Leistung mit ChatGPT vergleichbar ist. Es zeichnet sich durch Effizienz und geringeren Energieverbrauch aus.

Welche Vorteile bietet die lokale Nutzung von DeepSeek-R1?

Die lokale Nutzung von DeepSeek-R1 gewährleistet Datensicherheit und erleichtert die Einhaltung der KI-Verordnung, da das Modell innerhalb des Unternehmens betrieben wird.

Ist DeepSeek-R1 Open Source?

Ja, DeepSeek-R1 ist Open Source, was bedeutet, dass es heruntergeladen, angepasst und für eigene Modelle verwendet werden kann.

Sichere KI, digitaler Datenschutz & Website-Compliance

Kategorien: Künstliche Intelligenz

KI ist ein hochkomplexes Thema, das selbst viele Techniker nicht verstehen. Hinzu kommt eine Berichterstattung, die aus Gründen der notwendigen Vereinfachung oder einem Bedürfnis nach Aufmerksamkeit oft ungenau ist. Heraus kommen Aussagen, die ein verzerrtes Bild auf DeepSeek werfen. Das Wichtigste dazu im Klartext.

Einleitung

DeepSeek ist eine chinesische Firma. Kürzlich wurde von dieser Firma das Sprachmodell DeepSeek-R1 veröffentlicht. Es soll genauso gut und in Teilen auch besser als OpenAI’s Sprachmodell o1 sein („ChatGPT“).

Das führte dazu, dass Unternehmenswerte von KI-Firmen wie Nvidia am Boden lagen. Selbst die Datenschutzorganisation noyb berichtete dies in deren Newsletter vom 30.01.2025.

Es wird oft so dargestellt, als ob DeepSeek deutlich effizienter sei als ChatGPT. Das stimmt in den relevanten Aspekten auch, in anderen aber eher weniger.

Dann liest man Schlagzeilen wie diese:

Stand: 30.01.2025, Quelle: https://www.epochtimes.de/politik/deutschland/deutsche-datenschuetzer-wollen-chinesische-deepseek-ki-ueberpruefen-medienbericht-a5022687.html

Daraus entsteht der Eindruck, als sei das chinesische Sprachmodell nicht sicher, weil Nutzerdaten womöglich missbraucht werden.

Die meisten der in der Öffentlichkeit kursierenden Aussagen dieser Art sind nicht voll zutreffend.

Fakten zu DeepSeek

Der Begriff "DeepSeek" ist nicht eindeutig. Verschiedene Bedeutungen sind möglich!

Datenschutz & Datensicherheit

DeepSeek ist die Bezeichnung einer chinesischen Firma. Wenn DeepSeek stattdessen als Bezeichnung für ein Sprachmodell verwendet wird, muss man zwei Varianten unterscheiden:

Cloud-Version, auch als „App“ bezeichnet
Open Source Sprachmodell, völlig autark nutzbar

Mittlerweile gibt es sogar revolutionäre neue KI-Modelle von DeepSeek, die über LLMs hinausgehen. Herauszugeben ist DeepSeek-OCR, ein Texterkennungs-Modell. Das besondere an Deepseek-OCR ist der neue Ansatz: Statt Text aus einem Bild zu extrahieren, wird der Text als Bild interpretiert. Das erlaubt es, die Struktur des Textes inklusive Einrückungen, Formaten oder Tabellen zu verstehen. Erstaunlicherweise führt dieser Ansatz nicht nur zu besseren OCR-Ergebnissen. Außerdem kann so der Informationsgehalt des Textes in einer komprimierten Form als Embedding abgelegt werden.

Die weiter oben genannte Berichterstattung, dass „DeepSeek“ wahrscheinlich Nutzerdaten missbrauche, kann sich nur auf die Cloud-Version („App“) beziehen. Denn das Open Source-Sprachmodell kann heruntergeladen und lokal betrieben werden, ganz ohne Internetverbindung. Ohne solche Verbindung können schlecht Nutzerdaten nach China wandern.

Das DeepSeek-Sprachmodell kann ohne jedes Sicherheitsrisiko genutzt werden.
Nämlich in der lokalen Version, die auf einem eigenen KI-Server laufen kann.

ChatGPT ist übrigens auch nicht unbedingt sicher. Amerikanische Geheimdienstgesetze erlauben es US-Behörden und US-Geheimdiensten, Daten von anderen abzugreifen. Das EU-US-Datenschutzabkommen DPF war sowieso nie viel Wert und nur ein Formalismus. Es basiert zudem auf einem Präsidialerlass von Joe Biden. Mit der Auflösung eines wichtigen Gremiums durch Trump wird es weiter entwertet. Der Präsidialerlass könnte ebenso jederzeit von Donald Trump für nichtig erklärt werden.

Zudem hat OpenAI sehr viel Spaß daran, Ihre Daten einzusammeln. Selbst, wenn Ihre ChatGPT-Daten nicht für das KI-Training verwendet werden, dann aber doch vielleicht für andere Zwecke! Etwa zum Auswerten der OpenAI-KI, die Sie dann immer abhängiger macht (Preiserhöhungen wurden bereits angekündigt).

Effizienz

Angeblich soll das Training von DeepSeek-R1 ca. 6 Millionen USD gekostet. Die tatsächlichen Kosten waren höher, denn diese Zahl bezieht sich nicht auf die Gesamtkosten und zudem auf das Basismodell DeepSeek-V3. Für ChatGPT wurde eine Summe von 100 Millionen USD berichtet.

Richtig ist auf jeden Fall:

DeepSeek-R1 kann auf deutlich günstigerer Hardware als ChatGPT betrieben werden
DeepSeek-R1 antwortet deutlich schneller als ChatGPT, weil es deutlich „kleiner“ ist
Der Betrieb von DeepSeek-R1 verbraucht somit deutlich weniger Energie

Warum ist DeepSeek-R1 kleiner als ChatGPT? Laut Angaben von DeepSeek ist R1 ein 685B Modell, besteht also aus 685 Milliarden Neuronenverbindungen. ChatGPT dürfte ähnlich groß sein. Also was jetzt?

DeepSeek-R1 arbeitet so wie das menschliche Gehirn: Wenn Sie sprechen, wird überwiegend das Sprachzentrum aktiviert. Beim Sprechen feuern also nur wenige aller Ihrer Neuronen im Gehirn. Technisch wird dies bei DeepSeek-R1 durch eine sogenannte Mixture of Experts-Architektur bewerkstelligt. Diese Architektur ist schon seit langem Allgemeingut. Sie wurde etwa bereits von Mistral verwendet.

Weil DeepSeek-R1 Open Source ist, kann es heruntergeladen und selbst betrieben werden. Um DeepSeek-R1 auf eigener Hardware laufen zu lassen, benötigt man einen Server, der ungefähr 30.000 Euro kostet. Das können sich viele Firmen leisten. ChatGPT hingegen wollen Sie nicht auf eigener Hardware laufen lassen, abgesehen davon, dass Sie es nicht können, weil OpenAI das nicht möchte und deswegen das Modell nicht veröffentlicht hat.

Qualität

In diversen Benchmarks schneidet DeepSeek-R1 genauso gut wie OpenAI o1 ab. Und das, obwohl R1 sehr viel effizienter und kleiner als ChatGPT ist. Nutzer berichten, dass R1 genauso gut wie ChatGPT sei, andere sehen R1 vorne.

Die chinesische Zensur hat einige Fakten aus dem Modell herausgelöscht oder verdreht eingespeichert. Demnach ist die Qualität bei einigen politischen Fragen schlecht.

Allerdings ist ein allgemeiner Chatbot ein denkbar schlechter Anwendungsfall für eine Unternehmens-KI. Insofern ist es fast egal, dass einige politische Fakten in R1 fragwürdig sind. Mit Standardverfahren wie Fine-Tuning oder RAG können Textanwendungen sehr gut mit R1 betrieben werden. Weitere Anwendungsfälle können mit R1 noch besser realisiert werden. Dazu gehören:

Firmenwissen befragen (Ihre Dokumente befragen),
Erfüllen der Pflichten aus dem Lieferkettengesetz, etwa durch Auswerten von Lieferanten-Dokumenten,
Erstellen von Zusammenfassungen, Übersetzungen oder Sprachvereinfachungen,
Programmier-Assistent.

Vor allem der letzte Anwendungsfall ist hochinteressant. So gelang es in einem einfachen Experiment, innerhalb von wenigen Stunden das zu programmieren, was ansonsten mehrere Wochen Zeit gekostet hätte. Und das meist auf dem Sofa am Tipp-unfreundlichen Tablet und ohne Mikrofon-Nutzung. Es ist eben ein Unterschied, ob man 30 Minuten lang spaßbehaftet mit KI programmiert oder ob man im besten Fall das gleiche Ergebnis ohne Spaß nach 2 Tagen erreicht.

Weitere Vorteile von DeepSeek-R1 gegenüber ChatGPT

OpenAI bringt immer wieder mal ein Release oder eine neue Unterversion von ChatGPT heraus. Diese Varianten unterscheiden sich bezüglich der Beantwortung Ihrer Frage. Eine Konsistenz ist hier nicht gegeben. Ohne Konsistenz keine Zuverlässigkeit bei der Automatisierung von Prozessen.

OpenAI ist kostenpflichtig. Die Kostenlos-Version ist für Unzternehmen entweder irrelevant oder wird eben einfach genutzt. Die kostenpflichtige Chatbox hilft nicht bei der Automatisierung Ihrer Prozesse. Die kostenpflichtige Programmierschnittstelle (API) bringt Unsicherheiten mit sich: Wie oft wird man diese API wohl aufrufen müssen? Wie viele Daten müssen wohl an die API geschickt werden? Abhängig vom Umfang der Daten sind auch die Kosten für die API-Nutzung höher oder niedriger.

Updates finden dann statt, wenn OpenAI diese einplant. Das bedeutet auch, dass Updates nicht dann stattfinden, wenn Sie dies möchten. OpenAI als Lieferant bestimmt über die Version von ChatGPT, die Sie benutzen dürfen.

DeepSeek funktioniert so, wie Sie es erwarten können. Einmal heruntergeladen, antwortet es immer gleich. Tests und Benchmarks zeigen den dauerhaft gültigen Zustand.

DeepSeek kann zu Fixkosten betrieben werden, die im Wesentlichen aus dem Preis von Hardware (oder deren Miete) bestehen.

DeepSeek kann leicht durch andere Modelle oder neuere Modellvarianten ausgetauscht werden. Das passiert genau dann, wenn Sie es wollen. Unsicherheiten können durch Tests beseitigt werden. Generell ist es auch deswegen eine gute Idee, konkrete Anwendungsfälle mit KI lösen zu wollen. Diese kann man sehr gut beherschen und validieren.

Warum ist DeepSeek ein Urknall?

Es ist schon sehr erstaunlich, dass ein Sprachmodell wie R1 den Platzhirschen, ChatGPT, nach Meinung der breiten Öffentlichkeit schlägt. Und das, obwohl das Modell von DeepSeek kleiner ist. Auch wird DeepSeek weniger Mittel als OpenAI verwendet haben.

Was aber dem ganzen noch eins drauf setzt: DeepSeek-R1 wurde veröffentlicht und frei zugänglich gemacht. Plastisch beschrieben, bedeutet das:

Jeder kann DeepSeek-R1 per Download einiger Dateien in Ihrem Browser auf Ihre Festplatte herunterladen.. Jeder
Jeder kann dann R1 lokal auf seinem KI-Server installieren. Jeder.
Jeder kann dann R1 so oft und lange nutzen, wie er oder sie es will. Es entstehen keine Zusatzkosten.

Im Gegensatz hier die Möglichkeiten, die ChatGPT bietet.

Niemand kann ChatGPT herunterladen.
Niemand kann ChatGPT für Automatisierungsaufgaben oder andere API-Verwendung nutzen, ohne eine unvorhersehbare Menge Geld dafür aufwenden zu müssen.

Die wahre Sensation

Das war aber noch nicht alles.

Die Krone setzt DeepSeek damit auf: DeepSeek verrät uns allen das Kochrezept zum Herstellen von DeepSeek-R1.

Das bedeutet:

Jeder kann sich einen ChatGPT-Klon bauen.
Niemand braucht mehr OpenAI.

Konkret ist folgendes von DeepSeek als Open-Source verfügbar:

Trainingsmethode von R1 als Konzept („Paper“)
Trainingsmethode von R1 als nutzbare Programmbibliothek (Python)
Destillat-Datensätze, die Wissen und verbalisierte Denkprozesse aus DeepSeek enthalten
Hauptdatensätze wie C4 oder The Pile, die seit langem Allgemeingut sind

Zur Veranschaulichung hier ein Auszug aus einem der genannten Destillat-Datensätze:

Und hier das veröffentlichte Backrezept, damit auch Ihr Unternehmen bei Bedarf ein neues KI-Modell in der Güte von ChatGPT backen kann:

Das war nur ein Auszug. Genannt und beschrieben sind auch weitere Feinheiten wie Multi-token Prediction.

Der Code zum Neuerschaffen von DeepSeek-R1 ist in der Transformers-Bibliothek in Python als Quellcode verfügbar.

DeepSeek hat jedem verraten, wie ChatGPT nachgebaut werden kann.
Das ist die eigentliche Sensation.

Weitere Sensationen

Ganzen Artikel jetzt über kostenfreien Dr. DSGVO Newsletter lesen.

Weitere Extras für Abonnenten:
Viele Artikel in PDF-Form · Kompakte Kernaussagen für Beiträge · Offline-KI · Freikontingent+ für Website-Checks

Schon Abonnent? Link im Newsletter anklicken & diese Seite auffrischen.

↓

Newsletter abonnieren

KI-Beratung, KI-Lösungen

Umfassende Beratung (fachlich, rechtlich, technisch):

Leistungsangebot:

Erstberatung inkl. Machbarkeitsaussagen
Schulungen und Workshops für Führungskräfte, Berufsgeheimnisträger, Angestellte, Entwickler
KI-Lösungen mit und ohne ChatGPT/Azure. Cloud oder eigener KI-Server

Ihre Anfrage

Oder Mail an ki@dr-dsgvo.de

Kommentare von Lesern

Die Kommentare drücken die Meinungen der jeweiligen Kommentargeber aus

Ray

Vielen Dank Dr. Meffert, für diese Einordnung, wie immer sehr hilfreich. Mit welchen Größenordnungen muss man denn bei einem Download rechnen?

Danke und beste Grüße

Antworten
- Dr. DSGVO
  
  Beim großen Hauptmodell R1 sind es ca. 700 GB.
  Bei den Destillatmodellen deutlich weniger, abhängig von der Variante. Für eine 7B Version beispielsweise ca. 15 GB
  
  Wenn Sie keinen KI-Rechner haben, würde ich an Ihrer Stelle die Zeit anders verwenden, als KI-Modelle zu installieren 😉
  
  Antworten
Ray

Vielen Dank, das hilft doch schon mal zur Einordnung.

Antworten