Drücke „Enter”, um zum Inhalt zu springen.
Hinweis zu diesem Datenschutz-Blog:
Anscheinend verwenden Sie einen Werbeblocker wie uBlock Origin oder Ghostery, oder einen Browser, der bestimmte Dienste blockiert.
Leider wird dadurch auch der Dienst von VG Wort blockiert. Online-Autoren haben einen gesetzlichen Anspruch auf eine Vergütung, wenn ihre Beiträge oft genug aufgerufen wurden. Um dies zu messen, muss vom Autor ein Dienst der VG Wort eingebunden werden. Ohne diesen Dienst geht der gesetzliche Anspruch für den Autor verloren.

Ich wäre Ihnen sehr verbunden, wenn Sie sich bei der VG Wort darüber beschweren, dass deren Dienst anscheinend so ausgeprägt ist, dass er von manchen als blockierungswürdig eingestuft wird. Dies führt ggf. dazu, dass ich Beiträge kostenpflichtig gestalten muss.

Durch Klick auf folgenden Button wird eine Mailvorlage geladen, die Sie inhaltlich gerne anpassen und an die VG Wort abschicken können.

Nachricht an VG WortMailtext anzeigen

Betreff: Datenschutzprobleme mit dem VG Wort Dienst(METIS)
Guten Tag,

als Besucher des Datenschutz-Blogs Dr. DSGVO ist mir aufgefallen, dass der VG Wort Dienst durch datenschutzfreundliche Browser (Brave, Mullvad...) sowie Werbeblocker (uBlock, Ghostery...) blockiert wird.
Damit gehen dem Autor der Online-Texte Einnahmen verloren, die ihm aber gesetzlich zustehen.

Bitte beheben Sie dieses Problem!

Diese Nachricht wurde von mir persönlich abgeschickt und lediglich aus einer Vorlage generiert.
Wenn der Klick auf den Button keine Mail öffnet, schreiben Sie bitte eine Mail an info@vgwort.de und weisen darauf hin, dass der VG Wort Dienst von datenschutzfreundlichen Browser blockiert wird und dass Online Autoren daher die gesetzlich garantierten Einnahmen verloren gehen.
Vielen Dank,

Ihr Klaus Meffert - Dr. DSGVO Datenschutz-Blog.

PS: Wenn Sie meine Beiträge oder meinen Online Website-Check gut finden, freue ich mich auch über Ihre Spende.
Ausprobieren Online Webseiten-Check sofort das Ergebnis sehen

DeepSeek vs. ChatGPT: Faktakontroll av den kinesiska AI-språkmodellen

0
Dr. DSGVO Newsletter detected: Extended functionality available
More articles · Website-Checks · Live Offline-AI

AI är ett mycket komplext ämne som inte ens många tekniker förstår. Till detta kommer en rapportering som ofta är felaktig på grund av nödvändig förenkling eller behov av uppmärksamhet. Resultatet blir uttalanden som ger en snedvriden bild av DeepSeek. De viktigaste fakta i klarspråk.

Inledning

DeepSeek är ett kinesiskt företag. Språkmodellen DeepSeek-R1 publicerades nyligen av detta företag. Den sägs vara lika bra och i vissa delar till och med bättre än OpenAI:s språkmodell o1 ("ChatGPT").

Detta ledde till att företagsvärden från AI-företag som Nvidia låg på botten. Även den dataskyddsorganisationen noyb rapporterade detta i deras nyhetsbrev den 30.01.2025

Det framställs ofta som om DeepSeek är betydligt mer effektivt än ChatGPT. Detta är sant i relevanta avseenden, men mindre sant i andra avseenden.

Sedan läser man rubriker som den här:

Status per 30.01.2025, källa: https://www.epochtimes.de/politik/deutschland/deutsche-datenschuetzer-wollen-chinesische-deepseek-ki-ueberpruefen-medienbericht-a5022687.html (bilden översattes automatiskt).

Detta ger intrycket att den kinesiska språkmodellen inte är säker eftersom användardata kan missbrukas.

De flesta av de uttalanden av detta slag som cirkulerar i det offentliga rummet är inte helt korrekta.

Fakta om DeepSeek

Dataskydd och datasäkerhet

DeepSeek är namnet på ett kinesiskt företag. Om DeepSeek i stället används som namn på en språkmodell måste man skilja mellan två varianter:

  1. Molnversion, även kallad "app
  2. Språkmodell med öppen källkod, kan användas helt oberoende

Den rapportering som nämnts tidigare, att "DeepSeek" sannolikt missbrukar användardata, kan bara gälla för molnversionen ("App"). För det är så Open Source-språkmodellen kan laddas ner och köra lokal, helt utan internetuppkoppling. Utan en sådan uppkoppling kan dåliga användardata smyga iväg till Kina.

Språkmodellen DeepSeek kan användas utan säkerhetsrisk.

Nämligen i den lokala versionen, som kan köras på sin egen AI-server.

ChatGPT är för övrigt inte heller särskilt säkert. Amerikanska underrättelsegesetzen tillåter det amerikanska myndigheterna och amerikanska underrättelsetjänsterna att ta ut data från andra. Det EU-USA-datatransparensavtalet DPF var i alla fall aldrig mycket värt och bara en formalitet. Det bygger dessutom på ett präsidialek av Joe Biden. Med upplösningen av ett viktigt organ av Trump blir det ännu mer förvanskad. Präsidialeket kunde lika gärna förklaras som ogiltig av Donald Trump.

OpenAI har också mycket roligt när de samlar in dina data. Även om dina ChatGPT-data inte används för AI-utbildning kan de användas för andra ändamål! Till exempel för att analysera OpenAI AI, som sedan gör dig mer och mer beroende (prishöjningar har redan aviserats).

Effektivitet

Enligt uppgift ska träningen av DeepSeek-R1 ha kostat cirka 6 miljoner USD. De faktiska kostnaderna var högre, eftersom den här siffran inte hänvisar till de totala kostnaderna och dessutom till det grundläggande DeepSeek-V3-modellen. För ChatGPT har en summa på 100 miljoner USD rapporterats.

Det är definitivt sant:

  • DeepSeek-R1 kan drivas på betydligt billigare hårdvara än ChatGPT
  • DeepSeek-R1 reagerar mycket snabbare än ChatGPT eftersom den är mycket "mindre
  • Driften av DeepSeek-R1 förbrukar därför betydligt mindre energi

Varför är DeepSeek-R1 mindre än ChatGPT? Enligt DeepSeek är R1 en 685B-modell, dvs. den består av 685 miljarder neuronanslutningar. ChatGPT är förmodligen lika stor. Så vad händer nu?

DeepSeek-R1 fungerar så som det mänskliga hjärnan: När du talar aktiveras främst talcentrumet. Vid tala skjuter bara ett fåtal av alla dina nervceller i hjärnan igång. Tekniskt sett uppnås detta med DeepSeek-R1 genom en så kallad Mixture of Experts-arkitektur. Denna arkitektur är redan länge allmänt känt och har till exempel använts av Mistral.

Eftersom DeepSeek-R1 är öppen källkod kan den laddas ner och användas av användaren. För att köra DeepSeek-R1 på egen hårdvara behövs en server som kostar cirka 30 000 euro. Många företag har råd med detta. ChatGPT däremot vill man inte köra på sin egen hårdvara, förutom att man inte kan det eftersom OpenAI inte vill det och därför inte har släppt modellen.

kvalitet

I olika benchmarks presterar DeepSeek-R1 lika bra som OpenAI o1. Detta trots att R1 är mycket mer effektiv och mindre än ChatGPT. Användare rapporterar att R1 är lika bra som ChatGPT, medan andra ser R1 i ledningen.

De kinesiska censorerna har tagit bort eller förvrängt vissa fakta från modellen. Som en följd av detta är kvaliteten på vissa politiska frågor dålig.

En allmän chatbot är dock det sämsta tänkbara användningsområdet för en AI för företag. I detta avseende spelar det nästan ingen roll att vissa politiska fakta i R1 är tvivelaktiga. Med standardförfaranden som finjustering eller RAG kan textapplikationer drivas mycket bra med R1. Andra användningsfall kan realiseras ännu bättre med R1. Dessa inkluderar:

  • Konsultera företagets kunskap (konsultera dina dokument),
  • Fullgörande av de skyldigheter som följer av lagen om leverantörskedjor, t.ex. genom att analysera leverantörsdokument,
  • Skapa sammanfattningar, översättningar eller språkförenklingar.
  • Programmeringsassistent

Särskilt den sista tillämpningsfallet är högintressant. Så lyckades författaren att inom några timmar programmera det som annars skulle ha tagit flera veckor tid. Och det mest på soffan med ett tablet som inte var tillräckligt bra och utan användning av mikrofon. Det är ju en skillnad om man programerar med AI i 30 minuter och har kul eller om man efter bästa förmåga når samma resultat utan kul efter två dagar. ([1])

Ytterligare fördelar med DeepSeek-R1 jämfört med ChatGPT

OpenAI släpper allt oftare ut en ny version eller en underversion av ChatGPT. Dessa varianter skiljer sig åt när det gäller att besvara din fråga. En konsekvens är inte här. Utan konsekvens ingen tillförlitlighet vid automatisering av processer.

OpenAI är kostnadsfritt. Den gratisversionen är för företag antingen ointressant eller används helt enkelt. Den kostnadskrävande chattboxen hjälper inte till att automatisera dina processer. Den kostnadskrävande programbiblioteksgränssnittet (API) medför osäkerheter: Hur ofta kommer man välja att använda den här API: n? Hur många data kommer man välja att skicka till API: n? Beroende på omfattningen av datorna är även kostnaderna för API-användning högre eller lägre.

Uppdateringar sker när OpenAI schemalägger dem. Detta innebär också att uppdateringar inte sker när du vill att de ska göra det. Som leverantör bestämmer OpenAI vilken version av ChatGPT som du får använda.

DeepSeek fungerar så som du förväntar dig. När det är nedladdat, svarar det alltid lika snabbt. Tester och benchmarkningar visar den permanent giltiga tillståndet.

DeepSeek kan drivas med fastkostnader, som i huvudsak består av priset på hårdvara (eller hyran för den).

DeepSeek kan lätt bytas ut mot andra modeller eller nyare modellvarianter. Det händer precis då och då, när du vill det. Osäkerheter kan avhjälpas genom tester. I allmänhet är det också en bra idé att konkreta tillämpningsfall med AI lösa vill man. Dessa kan man mycket väl behärska och verifiera.

Varför är DeepSeek en big bang?

Det är ganska förvånande att en språkmodell som R1 slår topphunden ChatGPT enligt allmänhetens uppfattning. Och detta trots att DeepSeeks modell är mindre. DeepSeek kommer också att ha använt färre resurser än OpenAI.

Men det är inte allt: DeepSeek-R1 har publicerats och gjorts fritt tillgängligt. Beskrivet på ett levande sätt innebär detta:

  1. Vem som helst kan ladda ner DeepSeek-R1 genom att ladda ner några filer i din webbläsare till din hårddisk. Vem som helst
  2. Vem som helst kan sedan installera R1 lokalt på sin AI-server. Vem som helst.
  3. Alla kan sedan använda R1 så ofta och så länge de vill. Det tillkommer inga extra kostnader.

I motsats till detta är här de möjligheter som ChatGPT erbjuder.

  1. Ingen kan ladda ner ChatGPT.
  2. Ingen kan använda ChatGPT för automatiseringsuppgifter eller annan API-användning utan att spendera en oförutsägbar summa pengar.

Den verkliga känslan

Men det var inte allt.

DeepSeek tar kronan med detta: DeepSeek berättar för oss alla receptet för att göra DeepSeek-R1.

Det betyder..:

  • Vem som helst kan bygga en ChatGPT-klon.
  • Ingen behöver mer OpenAI.

Specifikt är följande tillgängligt från DeepSeek som öppen källkod:

  • Träningsmetod från R1 som ett koncept ("papper")
  • Utbildningsmetod för R1 som ett användbart programbibliotek (Python)
  • Destillera dataset som innehåller kunskap och verbaliserade tankeprocesser från DeepSeek
  • Huvuddatauppsättningar som C4 eller The Pile, som länge har varit allmänt kända

För att illustrera detta följer här ett utdrag från en av de destillatdatauppsättningar som nämnts:

Datauppsättning OpenThoughts-114k, utdrag.

Och här är det publicerade bakreceptet så att ditt företag också kan baka en ny AI-modell med kvaliteten på ChatGPT om det behövs:

Quelle: HuggingFace

Det var bara ett utdrag. Namngivna och beskrivna är också ytterligare detaljer som Multi-token Prediction.

Koden för att återskapa DeepSeek-R1 finns tillgänglig som källkod i Transformers-biblioteket i Python.

DeepSeek har berättat för alla hur ChatGPT kan byggas upp igen.

Det är den verkliga känslan.

Fler förnimmelser

DeepSeek avslöjade också för alla hur befintliga språkmodeller, som är ganska små, kan göras ännu intelligentare på ett enkelt sätt med hjälp av kunskapsöverföring.

Dessa mindre modeller kallas Destillatmodeller. Ett sådant modell är så litet att det kan drivas på billigare hårdvara. Vissa av dessa utökade modeller kan dras på en Low Cost AI-server. Det minsta av dessa modeller kan till och med installeras på ett modernt mobiltelefon och köra utan internetuppkoppling!

DeepSeek har också gjort dessa destillatmodeller fritt tillgängliga.

Sammandrag

DeepSeek (som företag eller AI-modell) är inte en dataskyddsrisk om du inte använder DeepSeek-appen. OpenAI är en säkerhetsrisk för känsliga uppgifter eftersom du bara kan använda molnversionen.

DeepSeek har avslöjat hur ChatGPT kan ersättas. De mindre modellerna som en avfallsprodukt är en stor extra gåva som har getts. För en rimligt hanterbar summa (hårdvaruköp eller datahyra) kan varje företag nu återskapa ChatGPT för sig själv.

Även om DeepSeek kommer från Kina: öppen källkod är öppen källkod. Naturligtvis har alla leverantörer av större AI-modeller stulit data, inte bara DeepSeek. Google och Meta missbrukar också användardata.

Tyska företag kan tryggt använda DeepSeek AI för att lösa många problem och automatisera processer.

Nämligen med en företags-AI som (bara) körs i ditt företag.

Företagens möjlighet att automatisera processer med hjälp av AI har blivit enormt stort sedan DeepSeek-R1. Med lokala modeller blir det dessutom mycket roligare att uppfylla de skyldigheter som föreskrivs i AI-förordningen, som gäller från och med den 02 februari 2025!

Viktiga budskap i denna artikel

DeepSeek-R1 är en kinesisk språkmodell som enligt testrapporter är lika bra som ChatGPT.

DeepSeek-R1 är mer effektiv än ChatGPT, kräver mindre datorkraft och förbrukar mindre energi.

DeepSeek-R1 har öppen källkod, vilket innebär att den kan laddas ner och användas lokalt, vilket garanterar datasäkerheten.

Vem som helst kan använda DeepSeek-R1 och till och med skapa sina egna modeller med samma recept.

Om dessa grundläggande uttalanden
About the author on dr-dsgvo.de
My name is Klaus Meffert. I have a doctorate in computer science and have been working professionally and practically with information technology for over 30 years. I also work as an expert in IT & data protection. I achieve my results by looking at technology and law. This seems absolutely essential to me when it comes to digital data protection. My company, IT Logic GmbH, also offers consulting and development of optimized and secure AI solutions.

DeepSeek-R1: En liten språkmodell förångar aktiemarknaden