Drücke „Enter”, um zum Inhalt zu springen.
Hinweis zu diesem Datenschutz-Blog:
Anscheinend verwenden Sie einen Werbeblocker wie uBlock Origin oder Ghostery, oder einen Browser, der bestimmte Dienste blockiert.
Leider wird dadurch auch der Dienst von VG Wort blockiert. Online-Autoren haben einen gesetzlichen Anspruch auf eine Vergütung, wenn ihre Beiträge oft genug aufgerufen wurden. Um dies zu messen, muss vom Autor ein Dienst der VG Wort eingebunden werden. Ohne diesen Dienst geht der gesetzliche Anspruch für den Autor verloren.

Ich wäre Ihnen sehr verbunden, wenn Sie sich bei der VG Wort darüber beschweren, dass deren Dienst anscheinend so ausgeprägt ist, dass er von manchen als blockierungswürdig eingestuft wird. Dies führt ggf. dazu, dass ich Beiträge kostenpflichtig gestalten muss.

Durch Klick auf folgenden Button wird eine Mailvorlage geladen, die Sie inhaltlich gerne anpassen und an die VG Wort abschicken können.

Nachricht an VG WortMailtext anzeigen

Betreff: Datenschutzprobleme mit dem VG Wort Dienst(METIS)
Guten Tag,

als Besucher des Datenschutz-Blogs Dr. DSGVO ist mir aufgefallen, dass der VG Wort Dienst durch datenschutzfreundliche Browser (Brave, Mullvad...) sowie Werbeblocker (uBlock, Ghostery...) blockiert wird.
Damit gehen dem Autor der Online-Texte Einnahmen verloren, die ihm aber gesetzlich zustehen.

Bitte beheben Sie dieses Problem!

Diese Nachricht wurde von mir persönlich abgeschickt und lediglich aus einer Vorlage generiert.
Wenn der Klick auf den Button keine Mail öffnet, schreiben Sie bitte eine Mail an info@vgwort.de und weisen darauf hin, dass der VG Wort Dienst von datenschutzfreundlichen Browser blockiert wird und dass Online Autoren daher die gesetzlich garantierten Einnahmen verloren gehen.
Vielen Dank,

Ihr Klaus Meffert - Dr. DSGVO Datenschutz-Blog.

PS: Wenn Sie meine Beiträge oder meinen Online Website-Check gut finden, freue ich mich auch über Ihre Spende.
Ausprobieren Online Webseiten-Check sofort das Ergebnis sehen

DeepSeek vs. ChatGPT: Faktatjek af den kinesiske AI-sprogmodel

0
Dr. DSGVO Newsletter detected: Extended functionality available
More articles · Website-Checks · Live Offline-AI
📄 Artikel som PDF (kun for abonnenter på nyhedsbrevet)
🔒 Premium-Funktion
Der aktuelle Beitrag kann in PDF-Form angesehen und heruntergeladen werden

📊 Download freischalten
Der Download ist nur für Abonnenten des Dr. DSGVO-Newsletters möglich

AI er et meget komplekst emne, som selv mange teknikere ikke forstår. Dertil kommer rapportering, som ofte er unøjagtig på grund af nødvendig forenkling eller behov for opmærksomhed. Resultatet er udsagn, der tegner et forvrænget billede af DeepSeek. De vigtigste fakta i almindeligt sprog.

Indledning

DeepSeek er en kinesisk virksomhed. DeepSeek-R1-sprogmodellen blev for nylig offentliggjort af dette firma. Den siges at være lige så god og til dels endnu bedre end OpenAI's sprogmodel o1 ("ChatGPT").

Det førte til, at virksomhedsværdier hos AI-firmaer som Nvidia lå på bunden. Selv den privatlivsorganisation noyb rapporterede dette i deres nyhedsbrev fra 30.01.2025

Det fremstilles ofte, som om DeepSeek er betydeligt mere effektiv end ChatGPT. Det er sandt i de relevante aspekter, men mindre sandt i andre.

Så læser man overskrifter som denne:

Status pr. 30.01.2025, kilde: https://www.epochtimes.de/politik/deutschland/deutsche-datenschuetzer-wollen-chinesische-deepseek-ki-ueberpruefen-medienbericht-a5022687.html (billedet blev automatisk oversat).

Det giver indtryk af, at den kinesiske sprogmodel ikke er sikker, fordi brugerdata kan blive misbrugt.

De fleste af de udsagn af denne art, der cirkulerer i det offentlige rum, er ikke helt korrekte.

Fakta om DeepSeek

Databeskyttelse og datasikkerhed

DeepSeek er navnet på et kinesisk firma. Hvis DeepSeek i stedet bruges som navn på en sprogmodel, skal der skelnes mellem to varianter:

  1. Cloud-version, også kaldet "app
  2. Open source-sprogmodel, kan bruges helt uafhængigt

Berichterstattningen om at "DeepSeek" sandsynligvis misbruger brugerdata, som nævnt ovenover, kan kun henvise til den i cloud-version („App“). Fordi det åbne kildesprogmodell kan downloades og køres lokal, uden internetforbindelse. Uden en sådan forbindelse kan dårligt brugerdata vandre til Kina.

DeepSeek-sprogmodellen kan bruges uden nogen sikkerhedsrisiko.

Nemlig i den lokale version, som kan køre på sin egen AI-server.

ChatGPT er desuden heller ikke nødvendigvis sikker. Amerikanske efterretningslove tillader amerikanske myndigheder og amerikanske efterretningsagenter at tilgå data fra andre. Det EU-USA-datasikkerhedsaftale DPF var aldrig meget værd og kun en formalitet. Den bygger desuden på et præsidentielt dekret af Joe Biden. Med opløsningen af et vigtigt udvalg af Trump bliver det endnu mere forvridet. Det præsidentielle dekret kunne lige så godt være blevet erklæret ugyldigt af Donald Trump.

OpenAI har det også meget sjovt med at indsamle dine data. Selv om dine ChatGPT-data ikke bruges til AI-træning, kan de blive brugt til andre formål! For eksempel til at analysere OpenAI's AI, som så gør dig mere og mere afhængig (prisstigninger er allerede annonceret).

Effektivitet

Det siges, at træningen af DeepSeek-R1 har kostet omkring 6 millioner USD. De faktiske udgifter var højere, da denne sum ikke dækker de samlede udgifter og desuden refererer til det grundlæggende model DeepSeek-V3. For ChatGPT blev en sum på 100 millioner USD rapporteret.

Det er helt sikkert rigtigt:

  • DeepSeek-R1 kan drives på betydeligt billigere hardware end ChatGPT
  • DeepSeek-R1 reagerer meget hurtigere end ChatGPT, fordi den er meget "mindre
  • Driften af DeepSeek-R1 bruger derfor betydeligt mindre energi

Hvorfor er DeepSeek-R1 mindre end ChatGPT? Ifølge DeepSeek er R1 en 685B-model, dvs. den består af 685 milliarder neuronforbindelser. ChatGPT er sandsynligvis af samme størrelse. Og hvad så nu?

DeepSeek-R1 fungerer så som det menneskelige hjerne: Når du taler, bliver overvejende talecentret aktiveret. Ved at tale sætter kun få af dine neuroner i gang i hjernen. Teknikken gøres ved DeepSeek-R1 mulig ved en såkaldt Mixture of Experts-arkitektur. Denne arkitektur er allerede længe almindelig. Den blev brugt af Mistral.

Fordi DeepSeek-R1 er open source, kan den downloades og betjenes af brugeren. For at køre DeepSeek-R1 på din egen hardware skal du bruge en server, der koster omkring 30.000 euro. Det er der mange virksomheder, der har råd til. ChatGPT vil du derimod ikke køre på din egen hardware, bortset fra at du ikke kan, fordi OpenAI ikke ønsker det og derfor ikke har frigivet modellen.

Qualität

I forskellige benchmarks klarer DeepSeek-R1 sig lige så godt som OpenAI o1. Det er på trods af, at R1 er meget mere effektiv og mindre end ChatGPT. Brugere rapporterer, at R1 er lige så god som ChatGPT, mens andre ser R1 i spidsen.

Den kinesiske censur har slettet eller fordrejet nogle fakta fra modellen. Som følge heraf er kvaliteten af nogle politiske emner dårlig.

Men en generel chatbot er den værst tænkelige brugssag for en virksomheds AI. I den forbindelse er det næsten ligegyldigt, at nogle politiske fakta i R1 er tvivlsomme. Med standardprocedurer som finjustering eller RAG kan tekstapplikationer betjenes meget godt med R1. Andre brugsscenarier kan realiseres endnu bedre med R1. Disse omfatter:

  • Konsulter virksomhedens viden (se dine dokumenter),
  • Opfyldelse af de forpligtelser, der følger af Supply Chain Act, f.eks. ved at analysere leverandørdokumenter,
  • Lav resuméer, oversættelser eller sproglige forenklinger.
  • Programmeringsassistent

Det er især den sidste anvendelsesfald, der er meget interessant. Så lykkedes det for forfatteren at programmere noget inden for få timer, hvad der ellers ville have taget flere uger tid. Og det mest på sofaen med et tablet, som ikke var til tjeneste, og uden brug af mikrofon. Det er jo en forskel, om man programmerer med AI i 30 minutter med sjov eller om man efter bedste evne når samme resultat uden sjov efter 2 dage. ([1])

Yderligere fordele ved DeepSeek-R1 i forhold til ChatGPT

OpenAI bringer igen og igen en ny udgave eller en underversion af ChatGPT frem. Disse varianter adskiller sig ved, hvordan de besvarer din spørgsmål. En konsekvens er her ikke givet. Uden konsekvens ingen Tilførlighed ved automatisering af processer.

OpenAI er betalingsværdigt. Den gratis version er enten irrelevant for små virksomheder eller bliver simpelthen brugt. Den betalingsværdige chatbox hjælper ikke med at automatisere dine processer. Den betalingsværdige programmeringsschnittstelle (API) bringer Usikkerhed med sig: Hvor ofte skal man nok oprette en forbindelse til denne API? Hvor mange data skal blive sendt til API'en? Afhængigt af størrelsen på dataene er også omkostningerne for at bruge API'en højere eller lavere.

Opdateringer finder sted, når OpenAI planlægger dem. Det betyder også, at opdateringer ikke finder sted, når du ønsker det. Som leverandør bestemmer OpenAI, hvilken version af ChatGPT du har lov til at bruge.

DeepSeek fungerer sådan, som du forventer det. Efter at være blevet downloadet, svarer den altid lige hurtigt. Tests og benchmarkinger viser den faste tilstand.

DeepSeek kan drives med faste omkostninger, der i hovedsagen består af prisen på hardware (eller dennes udlejning).

DeepSeek kan let udskiftes med andre modeller eller nyere modelvarianter. Det sker præcis, når du vil det. Usikkerheder kan fjernes ved hjælp af tests. Generelt er det også en god idé at konkrete anvendelsesfald løse med AI. Dette kan man meget godt beherske og validere.

Hvorfor er DeepSeek et big bang?

Det er ret forbløffende, at en sprogmodel som R1 slår tophunden, ChatGPT, efter den brede offentligheds mening. Og det på trods af, at DeepSeeks model er mindre. DeepSeek vil også have brugt færre ressourcer end OpenAI.

Men det er ikke alt: DeepSeek-R1 er blevet offentliggjort og gjort frit tilgængelig. Med en levende beskrivelse betyder det:

  1. Alle kan downloade DeepSeek-R1 ved at downloade nogle filer i din browser til din harddisk. Alle
  2. Alle kan derefter installere R1 lokalt på deres AI-server. Hvem som helst.
  3. Alle kan derefter bruge R1 så ofte og så længe, de vil. Der er ingen ekstra omkostninger.

I modsætning hertil er her de muligheder, som ChatGPT tilbyder.

  1. Ingen kan downloade ChatGPT.
  2. Ingen kan bruge ChatGPT til automatiseringsopgaver eller anden API-brug uden at bruge en uforudsigelig mængde penge.

Den virkelige fornemmelse

Men det var ikke alt.

DeepSeek tager kronen på værket med dette: DeepSeek fortæller os alle opskriften på, hvordan man laver DeepSeek-R1.

Det vil sige:

  • Alle kan bygge en ChatGPT-klon.
  • Ingen har brug for mere OpenAI.

Specifikt er følgende tilgængeligt fra DeepSeek som open source:

  • Træningsmetode fra R1 som et koncept ("papir")
  • Træningsmetode for R1 som et brugbart programbibliotek (Python)
  • Destillér datasæt, der indeholder viden og verbaliserede tankeprocesser fra DeepSeek
  • Hoveddatasæt som C4 eller The Pile, som længe har været almindeligt kendt

For at illustrere dette er her et uddrag fra et af de nævnte datasæt for destillater:

Datasæt OpenThoughts-114k, udtræk.

Og her er den offentliggjorte bageopskrift, så din virksomhed også kan bage en ny AI-model med kvaliteten fra ChatGPT, hvis det er nødvendigt:

Kilde: HuggingFace

Det var kun en udplukning. Også nævnt og beskrevet er yderligere finesser som Multi-token Prediction.

Koden til at genskabe DeepSeek-R1 er tilgængelig som kildekode i Transformers-biblioteket i Python.

DeepSeek har fortalt alle, hvordan ChatGPT kan genopbygges.

Det er den virkelige fornemmelse.

Flere fornemmelser

DeepSeek afslørede også for alle, hvordan eksisterende sprogmodeller, som er ret små, kan gøres endnu mere intelligente på en enkel måde ved hjælp af vidensoverførsel.

Dette mindre model er kaldt Destillatmodel. Et sådant model er så lille, at det kan køres på billig hardware. Nogle af disse udvidede modeller kan køres på en lavkost AI-server. Det mindste af disse modeller kan også installeres på et moderne smartphone og køres uden internettet!

DeepSeek har også gjort disse destillatmodeller frit tilgængelige.

Konklusion

DeepSeek (som virksomhed eller AI-model) er ikke en databeskyttelsesrisiko, hvis du ikke bruger DeepSeek-appen. OpenAI er en sikkerhedsrisiko for følsomme data, fordi du kun kan bruge cloud-versionen.

DeepSeek har afsløret, hvordan ChatGPT kan udskiftes. De mindre modeller som affaldsprodukt er en stor ekstra gave, der er blevet givet. For et rimeligt håndterbart beløb (køb af hardware eller leje af computere) kan enhver virksomhed nu genskabe ChatGPT for sig selv.

Selv om DeepSeek kommer fra Kina: open source er open source. Selvfølgelig har alle udbydere af større AI-modeller stjålet data, ikke kun DeepSeek. Google og Meta misbruger også brugerdata.

Tyske virksomheder kan trygt bruge DeepSeek AI til at løse mange problemer og automatisere processer.

Nemlig med en virksomheds-AI, der (kun) kører i din virksomhed.

Chancen for virksomheder er siden DeepSeek-R1 blev enormt større til at automatisere processer med kunstig intelligens. Med lokale modeller gør det også meget mere spændende at opfylde de pligtigheder fra AI-ordningen, der træder i kraft den 02. februar 2025!

Nøglebudskaber i denne artikel

DeepSeek-R1 er en kinesisk sprogmodel, som ifølge testrapporter er lige så god som ChatGPT.

DeepSeek-R1 er mere effektiv end ChatGPT, kræver mindre computerkraft og bruger mindre energi.

DeepSeek-R1 er open source, så den kan downloades og betjenes lokalt, hvilket garanterer datasikkerhed.

Alle kan bruge DeepSeek-R1 og endda skabe deres egne modeller med den samme opskrift.

Om disse centrale udsagn
About the author on dr-dsgvo.de
My name is Klaus Meffert. I have a doctorate in computer science and have been working professionally and practically with information technology for over 30 years. I also work as an expert in IT & data protection. I achieve my results by looking at technology and law. This seems absolutely essential to me when it comes to digital data protection. My company, IT Logic GmbH, also offers consulting and development of optimized and secure AI solutions.

DeepSeek-R1: En lille sprogmodel fordamper aktiemarkedet