Drücke „Enter”, um zum Inhalt zu springen.
Hinweis zu diesem Datenschutz-Blog:
Anscheinend verwenden Sie einen Werbeblocker wie uBlock Origin oder Ghostery, oder einen Browser, der bestimmte Dienste blockiert.
Leider wird dadurch auch der Dienst von VG Wort blockiert. Online-Autoren haben einen gesetzlichen Anspruch auf eine Vergütung, wenn ihre Beiträge oft genug aufgerufen wurden. Um dies zu messen, muss vom Autor ein Dienst der VG Wort eingebunden werden. Ohne diesen Dienst geht der gesetzliche Anspruch für den Autor verloren.

Ich wäre Ihnen sehr verbunden, wenn Sie sich bei der VG Wort darüber beschweren, dass deren Dienst anscheinend so ausgeprägt ist, dass er von manchen als blockierungswürdig eingestuft wird. Dies führt ggf. dazu, dass ich Beiträge kostenpflichtig gestalten muss.

Durch Klick auf folgenden Button wird eine Mailvorlage geladen, die Sie inhaltlich gerne anpassen und an die VG Wort abschicken können.

Nachricht an VG WortMailtext anzeigen

Betreff: Datenschutzprobleme mit dem VG Wort Dienst(METIS)
Guten Tag,

als Besucher des Datenschutz-Blogs Dr. DSGVO ist mir aufgefallen, dass der VG Wort Dienst durch datenschutzfreundliche Browser (Brave, Mullvad...) sowie Werbeblocker (uBlock, Ghostery...) blockiert wird.
Damit gehen dem Autor der Online-Texte Einnahmen verloren, die ihm aber gesetzlich zustehen.

Bitte beheben Sie dieses Problem!

Diese Nachricht wurde von mir persönlich abgeschickt und lediglich aus einer Vorlage generiert.
Wenn der Klick auf den Button keine Mail öffnet, schreiben Sie bitte eine Mail an info@vgwort.de und weisen darauf hin, dass der VG Wort Dienst von datenschutzfreundlichen Browser blockiert wird und dass Online Autoren daher die gesetzlich garantierten Einnahmen verloren gehen.
Vielen Dank,

Ihr Klaus Meffert - Dr. DSGVO Datenschutz-Blog.

PS: Wenn Sie meine Beiträge oder meinen Online Website-Check gut finden, freue ich mich auch über Ihre Spende.
Ausprobieren Online Webseiten-Check sofort das Ergebnis sehen

DeepSeek vs ChatGPT: verifica dei fatti sul modello linguistico dell'intelligenza artificiale cinese

0
Dr. DSGVO Newsletter detected: Extended functionality available
More articles · Website-Checks · Live Offline-AI
📄 Articolo in formato PDF (solo per gli abbonati alla newsletter)
🔒 Premium-Funktion
Der aktuelle Beitrag kann in PDF-Form angesehen und heruntergeladen werden

📊 Download freischalten
Der Download ist nur für Abonnenten des Dr. DSGVO-Newsletters möglich

L'IA è un argomento molto complesso che persino molti tecnici non comprendono. A ciò si aggiungono i resoconti spesso imprecisi per motivi di necessaria semplificazione o per un bisogno di attenzione. Il risultato sono affermazioni che dipingono un quadro distorto di DeepSeek. I fatti più importanti in un linguaggio semplice.

Introduzione

DeepSeek è un'azienda cinese. Il modello linguistico DeepSeek-R1 è stato recentemente pubblicato da questa azienda. Si dice che sia altrettanto valido e, in parte, addirittura migliore del modello linguistico o1 ("ChatGPT") di OpenAI.

Ciò portò a valori aziendali delle società di intelligenza artificiale come Nvidia che erano al livello del suolo. Anche l'organizzazione per la protezione della privacy noyb riportava questo in loro newsletter del 30.01.2025

Spesso viene presentato come se DeepSeek fosse significativamente più efficiente di ChatGPT. Questo è vero per alcuni aspetti, ma meno per altri.

Poi si leggono titoli come questo:

Stato al 30.01.2025, Fonte: https://www.epochtimes.de/politik/deutschland/deutsche-datenschuetzer-wollen-chinesische-deepseek-ki-ueberpruefen-medienbericht-a5022687.html (l'immagine è stata tradotta automaticamente).

Questo dà l'impressione che il modello di lingua cinese non sia sicuro perché i dati dell'utente potrebbero essere utilizzati in modo improprio.

La maggior parte delle dichiarazioni di questo tipo che circolano nel pubblico dominio non sono del tutto accurate.

Fatti su DeepSeek

Protezione e sicurezza dei dati

DeepSeek è il nome di un'azienda cinese. Se DeepSeek viene invece utilizzato come nome di un modello linguistico, occorre distinguere tra due varianti:

  1. Versione cloud, detta anche "app"
  2. Modello linguistico open source, utilizzabile in modo completamente indipendente

La segnalazione fatta sopra riguardo alla "DeepSeek", che probabilmente abusa dei dati degli utenti, si riferisce solo alla versione cloud (app) e non al modello di linguaggio open source, che può essere scaricato e utilizzato localmente senza connessione internet. Senza tale connessione i dati degli utenti possono finire in Cina.

Il modello linguistico DeepSeek può essere utilizzato senza alcun rischio per la sicurezza.

In particolare nella versione locale, che può essere eseguita sul proprio server AI.

ChatGPT non è nemmeno necessariamente sicuro. Le leggi di intelligence americane consentono alle autorità e ai servizi segreti statunitensi di accedere ai dati degli altri. L'accordo sulla protezione dei dati tra l'UE e gli Stati Uniti, DPF, era comunque poco significativo e solo un formalismo. Si basa inoltre su un decreto presidenziale di Joe Biden. Con la dissoluzione di un importante organo da parte di Trump viene ulteriormente declassificato. Il decreto presidenziale potrebbe essere dichiarato nullo allo stesso modo da Donald Trump.

OpenAI si diverte anche a raccogliere i vostri dati. Anche se i vostri dati ChatGPT non vengono utilizzati per l'addestramento dell'IA, potrebbero essere utilizzati per altri scopi! Ad esempio, per analizzare l'IA di OpenAI, che poi vi renderà sempre più dipendenti (sono già stati annunciati aumenti di prezzo).

Efficienza

Si dice che il training di DeepSeek-R1 sia costato circa 6 milioni di dollari USA. I reali costi erano più alti, poiché questo numero si riferisce non ai costi totali e inoltre al modello base DeepSeek-V3. Per ChatGPT è stato riportato un importo di 100 milioni di dollari USA.

Questo è sicuramente vero:

  • DeepSeek-R1 può essere utilizzato su un hardware significativamente più economico rispetto a ChatGPT
  • DeepSeek-R1 risponde molto più velocemente di ChatGPT perché è molto più "piccolo"
  • Il funzionamento di DeepSeek-R1 consuma quindi molta meno energia

Perché DeepSeek-R1 è più piccolo di ChatGPT? Secondo DeepSeek, R1 è un modello 685B, cioè è composto da 685 miliardi di connessioni neuronali. ChatGPT ha probabilmente dimensioni simili. E adesso?

DeepSeek-R1 funziona così come il cervello umano: quando parli, viene attivato principalmente il centro linguistico. Al momento del parlare quindi solo pochi dei tuoi neuroni nel cervello sparano. Tecnica che DeepSeek-R1 realizza attraverso una architettura chiamata Mixture of Experts. Questa architettura è già da tempo di uso comune. Fu utilizzata circa anche da Mistral.

Poiché DeepSeek-R1 è open source, può essere scaricato e gestito dall'utente. Per eseguire DeepSeek-R1 sul proprio hardware, è necessario un server che costa circa 30.000 euro. Molte aziende possono permetterselo. ChatGPT, invece, non si vuole eseguire sul proprio hardware, a parte il fatto che non si può perché OpenAI non vuole farlo e quindi non ha rilasciato il modello.

qualità

In diversi benchmark, DeepSeek-R1 si comporta altrettanto bene di OpenAI o1. Questo nonostante R1 sia molto più efficiente e più piccolo di ChatGPT. Gli utenti riferiscono che R1 è altrettanto valido di ChatGPT, mentre altri vedono R1 in vantaggio.

I censori cinesi hanno cancellato o distorto alcuni fatti dal modello. Di conseguenza, la qualità di alcuni temi politici è scarsa.

Tuttavia, un chatbot generico è il peggior caso d'uso possibile per un'intelligenza artificiale aziendale. In questo senso, è quasi irrilevante che alcuni fatti politici in R1 siano discutibili. Con procedure standard come il fine-tuning o il RAG, le applicazioni testuali possono essere gestite molto bene con R1. Altri casi d'uso possono essere realizzati ancora meglio con R1. Tra questi:

  • Consultate le conoscenze aziendali (consultate i vostri documenti),
  • Adempimento degli obblighi derivanti dal Supply Chain Act, ad esempio analizzando i documenti dei fornitori,
  • Creare riassunti, traduzioni o semplificazioni linguistiche.
  • Assistente alla programmazione

Soprattutto l'ultimo esempio di applicazione è molto interessante. Così riuscì l'autore a programmare in poche ore ciò che altrimenti sarebbe costato più settimane. E questo per lo più sul divano con il tablet non troppo amichevole e senza utilizzo del microfono. È una differenza, se si programma con intelligenza artificiale per 30 minuti in modo divertente o se si raggiunge lo stesso risultato senza divertimento dopo due giorni al meglio. ([1])

Ulteriori vantaggi di DeepSeek-R1 rispetto a ChatGPT

OpenAI porta sempre nuovamente un rilascio o una nuova sottoversione di ChatGPT. Queste varianti si differenziano per la risposta alla tua domanda. Una consistenza non è data qui. Senza consistenza nessuna affidabilità nell'automatizzazione dei processi.

OpenAI è a pagamento. La versione gratuita è per le imprese o comunque viene utilizzata. La chatbox a pagamento non aiuta nell'automatizzazione dei processi. L'interfaccia di programmazione degli applicativi (API) porta incertezze: Quante volte si dovrà chiamare questa API? Quanti dati si dovranno inviare all'API? A seconda dell'estensione dei dati, i costi per l'utilizzo dell'API sono più alti o più bassi.

Gli aggiornamenti avvengono quando OpenAI li programma. Ciò significa anche che gli aggiornamenti non avvengono quando lo desiderate. In qualità di fornitore, OpenAI determina la versione di ChatGPT che l'utente è autorizzato a utilizzare.

DeepSeek funziona come potreste aspettarvi. Una volta scaricato, risponde sempre allo stesso modo. I test e i benchmark mostrano lo stato duraturo.

DeepSeek può essere gestito a costi fissi, che consistono principalmente nel prezzo dell'hardware (o del suo affitto).

DeepSeek può essere facilmente sostituito con altri modelli o varianti più recenti del modello. Ciò accade solo quando lo desiderate. Le incertezze possono essere eliminate attraverso i test. In generale, è anche una buona idea risolvere casi di utilizzo concreto con l'intelligenza artificiale. Questo può essere gestito e validato molto bene.

Perché DeepSeek è un big bang?

È sorprendente che un modello linguistico come R1 batta il capofila, ChatGPT, nell'opinione pubblica. E questo nonostante il fatto che il modello di DeepSeek sia più piccolo. DeepSeek avrà anche utilizzato meno risorse di OpenAI.

Ma non è tutto: DeepSeek-R1 è stato pubblicato e reso liberamente accessibile. Descritto in modo vivace, questo significa:

  1. Chiunque può scaricare DeepSeek-R1 scaricando alcuni file nel browser sul proprio disco rigido. Chiunque
  2. Chiunque può quindi installare R1 localmente sul proprio server AI. Chiunque.
  3. Ognuno può quindi utilizzare R1 tutte le volte e per tutto il tempo che vuole. Non ci sono costi aggiuntivi.

Al contrario, ecco le possibilità offerte da ChatGPT.

  1. Nessuno può scaricare ChatGPT.
  2. Nessuno può utilizzare ChatGPT per compiti di automazione o altri usi dell'API senza spendere una quantità imprevedibile di denaro.

La sensazione reale

Ma non è tutto.

DeepSeek si aggiudica la corona con questo: DeepSeek ci racconta la ricetta per realizzare DeepSeek-R1.

Ciò significa che:

  • Chiunque può costruire un clone di ChatGPT.
  • Nessuno ha bisogno di altri OpenAI.

In particolare, DeepSeek ha reso disponibile quanto segue come open source:

  • Metodo di formazione da R1 come concetto ("carta")
  • Metodo di formazione di R1 come libreria di programmi utilizzabili (Python)
  • Distillare gli insiemi di dati contenenti conoscenza e processi di pensiero verbalizzati da DeepSeek
  • I principali set di dati, come C4 o The Pile, sono da tempo di dominio pubblico

Per illustrare questo aspetto, ecco un estratto di uno dei set di dati sui distillati citati:

Set di dati OpenThoughts-114k, estratto.

Ed ecco la ricetta di cottura pubblicata, in modo che anche la vostra azienda possa sfornare un nuovo modello di IA con la qualità di ChatGPT, se necessario:

Fonte: HuggingFace

Era solo un estratto. Inoltre, sono nominate e descritte anche altre sfumature come Multi-token Prediction

Il codice per ricreare DeepSeek-R1 è disponibile come codice sorgente nella libreria Transformers di Python.

DeepSeek ha spiegato a tutti come ChatGPT può essere ricostruito.

Questa è la vera sensazione.

Altre sensazioni

DeepSeek ha anche rivelato a tutti come i modelli linguistici esistenti, che sono piuttosto piccoli, possono essere resi ancora più intelligenti in modo semplice con l'aiuto del trasferimento di conoscenza.

Questi modelli più piccoli si chiamano Destillatmodelle. Un tale modello è così piccolo che può essere gestito con hardware a basso costo. Alcuni di questi modelli espansi possono essere eseguiti su un server AI ad accesso economico. Il modello più piccolo può anche essere installato su uno smartphone moderno e funzionare senza connessione internet!

DeepSeek ha reso disponibili gratuitamente anche questi modelli di distillati.

Conclusione

DeepSeek (come azienda o modello di IA) non rappresenta un rischio per la protezione dei dati se non si utilizza l'app DeepSeek. OpenAI è un rischio per la sicurezza dei dati sensibili perché è possibile utilizzare solo la versione cloud.

DeepSeek ha rivelato come ChatGPT possa essere sostituito. I modelli più piccoli come prodotto di scarto sono un grande regalo aggiuntivo che è stato fatto. Per una cifra ragionevolmente gestibile (acquisto di hardware o noleggio di computer), ogni azienda può ora ricreare ChatGPT per se stessa.

Anche se DeepSeek proviene dalla Cina: l'open source è open source. Naturalmente, tutti i fornitori di modelli di IA più grandi hanno rubato dati, non solo DeepSeek. Anche Google e Meta abusano dei dati degli utenti.

Le aziende tedesche possono tranquillamente utilizzare l'intelligenza artificiale di DeepSeek per risolvere numerosi problemi e automatizzare i processi.

Vale a dire con un'intelligenza artificiale aziendale che funziona (solo) nella vostra azienda.

La possibilità per le aziende di automatizzare processi con l'intelligenza artificiale è enormemente aumentata dopo DeepSeek-R1. Con i modelli locali, inoltre, si diverte molto più a soddisfare gli obblighi della normativa sulla IA che entrerà in vigore il 02 febbraio 2025 ([1]) !

Messaggi chiave di questo articolo

DeepSeek-R1 è un modello di lingua cinese che, secondo i rapporti di prova, è altrettanto valido di ChatGPT.

DeepSeek-R1 è più efficiente di ChatGPT, richiede meno potenza di calcolo e consuma meno energia.

DeepSeek-R1 è open source, quindi può essere scaricato e utilizzato localmente, garantendo la sicurezza dei dati.

Chiunque può utilizzare DeepSeek-R1 e persino creare i propri modelli con la stessa ricetta.

A proposito di queste affermazioni fondamentali
About the author on dr-dsgvo.de
My name is Klaus Meffert. I have a doctorate in computer science and have been working professionally and practically with information technology for over 30 years. I also work as an expert in IT & data protection. I achieve my results by looking at technology and law. This seems absolutely essential to me when it comes to digital data protection. My company, IT Logic GmbH, also offers consulting and development of optimized and secure AI solutions.

DeepSeek-R1: un piccolo modello linguistico fa evaporare il mercato azionario