Er DeepSeek virkelig sikrere end ChatGPT?

DeepSeek er er sikker i sin open source-version, da den kan køre lokalt og dermed ikke sender brugerdata til Kina. ChatGPT er derimod mere sårbar, da amerikanske efterretningstjenester kan hente data fra brugere.

Hvor effektiv er DeepSeek-R1 i forhold til ChatGPT?

DeepSeek-R1 er langt mere effektivt, da det kan betjenes på mindre kraftfuld hardware, svarer hurtigere og forbruger mindre energi end ChatGPT.

Hvilke use cases er særligt interessante med DeepSeek-R1?

DeepSeek-R1 er egnet sig godt til at afdække virksomhedskendskab, opfylde forsyningskædebestemmelser og generere resuméer, oversættelser eller sprogforenklinger, hvilket gør det til et værdifuldt værktøj til forskellige forretningsapplikationer.

Hvad er de vigtigste forskelle mellem DeepSeek og ChatGPT?

DeepSeek skiller ved sin open-source-natur, muliggør lokal drift uden omkostninger og tilbyder konsistens, i modsætning til ChatGPTs varierende versioner og uforudsigelige omkostninger.

Hvordan kan man bruge DeepSeek-R1?

DeepSeek-R1 kan downloades og betjenes på dit eget hardware uden abonnementgebyrer eller cloud-afhængighed. Dette muliggør lokal og omkostningseffektiv brug.

Hvilke fordele giver DeepSeek i forhold til ChatGPT med hensyn til automatisering?

DeepSeek muliggør pålidelig automatisering, da det drives lokalt og undgår API-omkostninger. I modsætning hertil er ChatGPT upålidelig for automatiserede processer på grund af uforudsigelige API-omkostninger og versionsændringer.

Hvad er det primære fordel ved DeepSeek-R1 i forhold til ChatGPT?

DeepSeek-R1 er langt mere effektivt, kræver mindre regnekraft og forbruger mindre energi end ChatGPT. Dette gør det til et mere ressourcebesparende valg.

Hvorfor er DeepSeek-R1 særligt?

DeepSeek-R1 ergavers i en open source-variant og kan betjenes lokalt, hvilket øger databeskyttelsen. Brugere kan downloade modellen og oprette egne modeller baseret på samme opskrift.

DeepSeek vs. ChatGPT: Faktatjek af den kinesiske AI-sprogmodel

AI er et meget komplekst emne, som selv mange teknikere ikke forstår. Dertil kommer rapportering, som ofte er unøjagtig på grund af nødvendig forenkling eller behov for opmærksomhed. Resultatet er udsagn, der tegner et forvrænget billede af DeepSeek. De vigtigste fakta i almindeligt sprog.

Indledning

DeepSeek er en kinesisk virksomhed. DeepSeek-R1-sprogmodellen blev for nylig offentliggjort af dette firma. Den siges at være lige så god og til dels endnu bedre end OpenAI's sprogmodel o1 ("ChatGPT").

Det førte til, at virksomhedsværdier hos AI-firmaer som Nvidia lå på bunden. Selv den privatlivsorganisation noyb rapporterede dette i deres nyhedsbrev fra 30.01.2025

Det fremstilles ofte, som om DeepSeek er betydeligt mere effektiv end ChatGPT. Det er sandt i de relevante aspekter, men mindre sandt i andre.

Så læser man overskrifter som denne:

Status pr. 30.01.2025, kilde: https://www.epochtimes.de/politik/deutschland/deutsche-datenschuetzer-wollen-chinesische-deepseek-ki-ueberpruefen-medienbericht-a5022687.html (billedet blev automatisk oversat).

Det giver indtryk af, at den kinesiske sprogmodel ikke er sikker, fordi brugerdata kan blive misbrugt.

De fleste af de udsagn af denne art, der cirkulerer i det offentlige rum, er ikke helt korrekte.

Fakta om DeepSeek

Databeskyttelse og datasikkerhed

DeepSeek er navnet på et kinesisk firma. Hvis DeepSeek i stedet bruges som navn på en sprogmodel, skal der skelnes mellem to varianter:

Cloud-version, også kaldet "app
Open source-sprogmodel, kan bruges helt uafhængigt

Berichterstattningen om at "DeepSeek" sandsynligvis misbruger brugerdata, som nævnt ovenover, kan kun henvise til den i cloud-version („App“). Fordi det åbne kildesprogmodell kan downloades og køres lokal, uden internetforbindelse. Uden en sådan forbindelse kan dårligt brugerdata vandre til Kina.

DeepSeek-sprogmodellen kan bruges uden nogen sikkerhedsrisiko.
Nemlig i den lokale version, som kan køre på sin egen AI-server.

ChatGPT er desuden heller ikke nødvendigvis sikker. Amerikanske efterretningslove tillader amerikanske myndigheder og amerikanske efterretningsagenter at tilgå data fra andre. Det EU-USA-datasikkerhedsaftale DPF var aldrig meget værd og kun en formalitet. Den bygger desuden på et præsidentielt dekret af Joe Biden. Med opløsningen af et vigtigt udvalg af Trump bliver det endnu mere forvridet. Det præsidentielle dekret kunne lige så godt være blevet erklæret ugyldigt af Donald Trump.

OpenAI har det også meget sjovt med at indsamle dine data. Selv om dine ChatGPT-data ikke bruges til AI-træning, kan de blive brugt til andre formål! For eksempel til at analysere OpenAI's AI, som så gør dig mere og mere afhængig (prisstigninger er allerede annonceret).

Effektivitet

Det siges, at træningen af DeepSeek-R1 har kostet omkring 6 millioner USD. De faktiske udgifter var højere, da denne sum ikke dækker de samlede udgifter og desuden refererer til det grundlæggende model DeepSeek-V3. For ChatGPT blev en sum på 100 millioner USD rapporteret.

Det er helt sikkert rigtigt:

DeepSeek-R1 kan drives på betydeligt billigere hardware end ChatGPT
DeepSeek-R1 reagerer meget hurtigere end ChatGPT, fordi den er meget "mindre
Driften af DeepSeek-R1 bruger derfor betydeligt mindre energi

Hvorfor er DeepSeek-R1 mindre end ChatGPT? Ifølge DeepSeek er R1 en 685B-model, dvs. den består af 685 milliarder neuronforbindelser. ChatGPT er sandsynligvis af samme størrelse. Og hvad så nu?

DeepSeek-R1 fungerer så som det menneskelige hjerne: Når du taler, bliver overvejende talecentret aktiveret. Ved at tale sætter kun få af dine neuroner i gang i hjernen. Teknikken gøres ved DeepSeek-R1 mulig ved en såkaldt Mixture of Experts-arkitektur. Denne arkitektur er allerede længe almindelig. Den blev brugt af Mistral.

Fordi DeepSeek-R1 er open source, kan den downloades og betjenes af brugeren. For at køre DeepSeek-R1 på din egen hardware skal du bruge en server, der koster omkring 30.000 euro. Det er der mange virksomheder, der har råd til. ChatGPT vil du derimod ikke køre på din egen hardware, bortset fra at du ikke kan, fordi OpenAI ikke ønsker det og derfor ikke har frigivet modellen.

Qualität

I forskellige benchmarks klarer DeepSeek-R1 sig lige så godt som OpenAI o1. Det er på trods af, at R1 er meget mere effektiv og mindre end ChatGPT. Brugere rapporterer, at R1 er lige så god som ChatGPT, mens andre ser R1 i spidsen.

Den kinesiske censur har slettet eller fordrejet nogle fakta fra modellen. Som følge heraf er kvaliteten af nogle politiske emner dårlig.

Men en generel chatbot er den værst tænkelige brugssag for en virksomheds AI. I den forbindelse er det næsten ligegyldigt, at nogle politiske fakta i R1 er tvivlsomme. Med standardprocedurer som finjustering eller RAG kan tekstapplikationer betjenes meget godt med R1. Andre brugsscenarier kan realiseres endnu bedre med R1. Disse omfatter:

Konsulter virksomhedens viden (se dine dokumenter),
Opfyldelse af de forpligtelser, der følger af Supply Chain Act, f.eks. ved at analysere leverandørdokumenter,
Lav resuméer, oversættelser eller sproglige forenklinger.
Programmeringsassistent

Det er især den sidste anvendelsesfald, der er meget interessant. Så lykkedes det for forfatteren at programmere noget inden for få timer, hvad der ellers ville have taget flere uger tid. Og det mest på sofaen med et tablet, som ikke var til tjeneste, og uden brug af mikrofon. Det er jo en forskel, om man programmerer med AI i 30 minutter med sjov eller om man efter bedste evne når samme resultat uden sjov efter 2 dage. ([1])

Yderligere fordele ved DeepSeek-R1 i forhold til ChatGPT

OpenAI bringer igen og igen en ny udgave eller en underversion af ChatGPT frem. Disse varianter adskiller sig ved, hvordan de besvarer din spørgsmål. En konsekvens er her ikke givet. Uden konsekvens ingen Tilførlighed ved automatisering af processer.

OpenAI er betalingsværdigt. Den gratis version er enten irrelevant for små virksomheder eller bliver simpelthen brugt. Den betalingsværdige chatbox hjælper ikke med at automatisere dine processer. Den betalingsværdige programmeringsschnittstelle (API) bringer Usikkerhed med sig: Hvor ofte skal man nok oprette en forbindelse til denne API? Hvor mange data skal blive sendt til API'en? Afhængigt af størrelsen på dataene er også omkostningerne for at bruge API'en højere eller lavere.

Opdateringer finder sted, når OpenAI planlægger dem. Det betyder også, at opdateringer ikke finder sted, når du ønsker det. Som leverandør bestemmer OpenAI, hvilken version af ChatGPT du har lov til at bruge.

DeepSeek fungerer sådan, som du forventer det. Efter at være blevet downloadet, svarer den altid lige hurtigt. Tests og benchmarkinger viser den faste tilstand.

DeepSeek kan drives med faste omkostninger, der i hovedsagen består af prisen på hardware (eller dennes udlejning).

DeepSeek kan let udskiftes med andre modeller eller nyere modelvarianter. Det sker præcis, når du vil det. Usikkerheder kan fjernes ved hjælp af tests. Generelt er det også en god idé at konkrete anvendelsesfald løse med AI. Dette kan man meget godt beherske og validere.

Hvorfor er DeepSeek et big bang?

Det er ret forbløffende, at en sprogmodel som R1 slår tophunden, ChatGPT, efter den brede offentligheds mening. Og det på trods af, at DeepSeeks model er mindre. DeepSeek vil også have brugt færre ressourcer end OpenAI.

Men det er ikke alt: DeepSeek-R1 er blevet offentliggjort og gjort frit tilgængelig. Med en levende beskrivelse betyder det:

Alle kan downloade DeepSeek-R1 ved at downloade nogle filer i din browser til din harddisk. Alle
Alle kan derefter installere R1 lokalt på deres AI-server. Hvem som helst.
Alle kan derefter bruge R1 så ofte og så længe, de vil. Der er ingen ekstra omkostninger.

I modsætning hertil er her de muligheder, som ChatGPT tilbyder.

Ingen kan downloade ChatGPT.
Ingen kan bruge ChatGPT til automatiseringsopgaver eller anden API-brug uden at bruge en uforudsigelig mængde penge.

Den virkelige fornemmelse

Men det var ikke alt.

DeepSeek tager kronen på værket med dette: DeepSeek fortæller os alle opskriften på, hvordan man laver DeepSeek-R1.

Det vil sige:

Alle kan bygge en ChatGPT-klon.
Ingen har brug for mere OpenAI.

Specifikt er følgende tilgængeligt fra DeepSeek som open source:

Træningsmetode fra R1 som et koncept ("papir")
Træningsmetode for R1 som et brugbart programbibliotek (Python)
Destillér datasæt, der indeholder viden og verbaliserede tankeprocesser fra DeepSeek
Hoveddatasæt som C4 eller The Pile, som længe har været almindeligt kendt

For at illustrere dette er her et uddrag fra et af de nævnte datasæt for destillater:

Og her er den offentliggjorte bageopskrift, så din virksomhed også kan bage en ny AI-model med kvaliteten fra ChatGPT, hvis det er nødvendigt:

Det var kun en udplukning. Også nævnt og beskrevet er yderligere finesser som Multi-token Prediction.

Koden til at genskabe DeepSeek-R1 er tilgængelig som kildekode i Transformers-biblioteket i Python.

DeepSeek har fortalt alle, hvordan ChatGPT kan genopbygges.
Det er den virkelige fornemmelse.

Flere fornemmelser

DeepSeek afslørede også for alle, hvordan eksisterende sprogmodeller, som er ret små, kan gøres endnu mere intelligente på en enkel måde ved hjælp af vidensoverførsel.

Dette mindre model er kaldt Destillatmodel. Et sådant model er så lille, at det kan køres på billig hardware. Nogle af disse udvidede modeller kan køres på en lavkost AI-server. Det mindste af disse modeller kan også installeres på et moderne smartphone og køres uden internettet!

DeepSeek har også gjort disse destillatmodeller frit tilgængelige.

Konklusion

DeepSeek (som virksomhed eller AI-model) er ikke en databeskyttelsesrisiko, hvis du ikke bruger DeepSeek-appen. OpenAI er en sikkerhedsrisiko for følsomme data, fordi du kun kan bruge cloud-versionen.

DeepSeek har afsløret, hvordan ChatGPT kan udskiftes. De mindre modeller som affaldsprodukt er en stor ekstra gave, der er blevet givet. For et rimeligt håndterbart beløb (køb af hardware eller leje af computere) kan enhver virksomhed nu genskabe ChatGPT for sig selv.

Selv om DeepSeek kommer fra Kina: open source er open source. Selvfølgelig har alle udbydere af større AI-modeller stjålet data, ikke kun DeepSeek. Google og Meta misbruger også brugerdata.

Tyske virksomheder kan trygt bruge DeepSeek AI til at løse mange problemer og automatisere processer.
Nemlig med en virksomheds-AI, der (kun) kører i din virksomhed.

Chancen for virksomheder er siden DeepSeek-R1 blev enormt større til at automatisere processer med kunstig intelligens. Med lokale modeller gør det også meget mere spændende at opfylde de pligtigheder fra AI-ordningen, der træder i kraft den 02. februar 2025!