È DeepSeek davvero più sicuro di ChatGPT?

DeepSeek è sicuro nella sua versione open source perché può essere gestito localmente e, di conseguenza, nessun dato dell'utente viaggia in Cina. ChatGPT, invece, è più vulnerabile, poiché gli agenzie di intelligence americane possono accedere ai dati degli utenti.

Quanto è efficiente DeepSeek-R1 rispetto a ChatGPT?

DeepSeek-R1 è significativamente più efficiente, poiché può essere eseguito su hardware meno potente, risponde più velocemente e consuma meno energia rispetto a ChatGPT.

Quali sono i casi d'uso particolarmente interessanti per DeepSeek-R1?

DeepSeek-R1 è adatto per l'interrogazione della knowledge aziendale, il rispetto delle normative sulla supply chain e la creazione di riassunti, traduzioni o semplificazioni linguistiche, il che lo rende un prezioso strumento per diverse applicazioni aziendali.

Quali sono le principali differenze tra DeepSeek e ChatGPT?

DeepSeek si distingue per la sua natura open-source, consente un funzionamento locale senza costi e offre coerenza, a differenza delle versioni variabili e imprevedibili di ChatGPT.

Come si può utilizzare DeepSeek-R1?

DeepSeek-R1 può essere scaricato e gestito su hardware propria da chiunque, senza costi di abbonamento o dipendenza dal cloud. Ciò consente un utilizzo locale ed economico.

Quali vantaggi offre DeepSeek rispetto a ChatGPT in termini di automazione?

DeepSeek consente un'automazione affidabile poiché viene eseguito localmente e non ci sono costi API. Al contrario, ChatGPT è inaffidabile per i processi automatizzati a causa di costi API imprevedibili e modifiche delle versioni.

Qual è il principale vantaggio di DeepSeek-R1 rispetto a ChatGPT?

DeepSeek-R1 è più efficiente, richiede meno potenza di calcolo e consuma meno energia rispetto a ChatGPT. Questo lo rende un'opzione più a risparmio energetico.

Perché DeepSeek-R1 è speciale?

DeepSeek-R1 è disponibile in una versione open source e può essere eseguito localmente, il che aumenta la sicurezza dei dati. Gli utenti possono scaricare il modello e creare i propri modelli in base alla stessa ricetta.

Sichere KI, digitaler Datenschutz & Website-Compliance

L'IA è un argomento molto complesso che persino molti tecnici non comprendono. A ciò si aggiungono i resoconti spesso imprecisi per motivi di necessaria semplificazione o per un bisogno di attenzione. Il risultato sono affermazioni che dipingono un quadro distorto di DeepSeek. I fatti più importanti in un linguaggio semplice.

Introduzione

DeepSeek è un'azienda cinese. Il modello linguistico DeepSeek-R1 è stato recentemente pubblicato da questa azienda. Si dice che sia altrettanto valido e, in parte, addirittura migliore del modello linguistico o1 ("ChatGPT") di OpenAI.

Ciò portò a valori aziendali delle società di intelligenza artificiale come Nvidia che erano al livello del suolo. Anche l'organizzazione per la protezione della privacy noyb riportava questo in loro newsletter del 30.01.2025

Spesso viene presentato come se DeepSeek fosse significativamente più efficiente di ChatGPT. Questo è vero per alcuni aspetti, ma meno per altri.

Poi si leggono titoli come questo:

Stato al 30.01.2025, Fonte: https://www.epochtimes.de/politik/deutschland/deutsche-datenschuetzer-wollen-chinesische-deepseek-ki-ueberpruefen-medienbericht-a5022687.html (l'immagine è stata tradotta automaticamente).

Questo dà l'impressione che il modello di lingua cinese non sia sicuro perché i dati dell'utente potrebbero essere utilizzati in modo improprio.

La maggior parte delle dichiarazioni di questo tipo che circolano nel pubblico dominio non sono del tutto accurate.

Fatti su DeepSeek

Protezione e sicurezza dei dati

DeepSeek è il nome di un'azienda cinese. Se DeepSeek viene invece utilizzato come nome di un modello linguistico, occorre distinguere tra due varianti:

Versione cloud, detta anche "app"
Modello linguistico open source, utilizzabile in modo completamente indipendente

La segnalazione fatta sopra riguardo alla "DeepSeek", che probabilmente abusa dei dati degli utenti, si riferisce solo alla versione cloud (app) e non al modello di linguaggio open source, che può essere scaricato e utilizzato localmente senza connessione internet. Senza tale connessione i dati degli utenti possono finire in Cina.

Il modello linguistico DeepSeek può essere utilizzato senza alcun rischio per la sicurezza.
In particolare nella versione locale, che può essere eseguita sul proprio server AI.

ChatGPT non è nemmeno necessariamente sicuro. Le leggi di intelligence americane consentono alle autorità e ai servizi segreti statunitensi di accedere ai dati degli altri. L'accordo sulla protezione dei dati tra l'UE e gli Stati Uniti, DPF, era comunque poco significativo e solo un formalismo. Si basa inoltre su un decreto presidenziale di Joe Biden. Con la dissoluzione di un importante organo da parte di Trump viene ulteriormente declassificato. Il decreto presidenziale potrebbe essere dichiarato nullo allo stesso modo da Donald Trump.

OpenAI si diverte anche a raccogliere i vostri dati. Anche se i vostri dati ChatGPT non vengono utilizzati per l'addestramento dell'IA, potrebbero essere utilizzati per altri scopi! Ad esempio, per analizzare l'IA di OpenAI, che poi vi renderà sempre più dipendenti (sono già stati annunciati aumenti di prezzo).

Efficienza

Si dice che il training di DeepSeek-R1 sia costato circa 6 milioni di dollari USA. I reali costi erano più alti, poiché questo numero si riferisce non ai costi totali e inoltre al modello base DeepSeek-V3. Per ChatGPT è stato riportato un importo di 100 milioni di dollari USA.

Questo è sicuramente vero:

DeepSeek-R1 può essere utilizzato su un hardware significativamente più economico rispetto a ChatGPT
DeepSeek-R1 risponde molto più velocemente di ChatGPT perché è molto più "piccolo"
Il funzionamento di DeepSeek-R1 consuma quindi molta meno energia

Perché DeepSeek-R1 è più piccolo di ChatGPT? Secondo DeepSeek, R1 è un modello 685B, cioè è composto da 685 miliardi di connessioni neuronali. ChatGPT ha probabilmente dimensioni simili. E adesso?

DeepSeek-R1 funziona così come il cervello umano: quando parli, viene attivato principalmente il centro linguistico. Al momento del parlare quindi solo pochi dei tuoi neuroni nel cervello sparano. Tecnica che DeepSeek-R1 realizza attraverso una architettura chiamata Mixture of Experts. Questa architettura è già da tempo di uso comune. Fu utilizzata circa anche da Mistral.

Poiché DeepSeek-R1 è open source, può essere scaricato e gestito dall'utente. Per eseguire DeepSeek-R1 sul proprio hardware, è necessario un server che costa circa 30.000 euro. Molte aziende possono permetterselo. ChatGPT, invece, non si vuole eseguire sul proprio hardware, a parte il fatto che non si può perché OpenAI non vuole farlo e quindi non ha rilasciato il modello.

qualità

In diversi benchmark, DeepSeek-R1 si comporta altrettanto bene di OpenAI o1. Questo nonostante R1 sia molto più efficiente e più piccolo di ChatGPT. Gli utenti riferiscono che R1 è altrettanto valido di ChatGPT, mentre altri vedono R1 in vantaggio.

I censori cinesi hanno cancellato o distorto alcuni fatti dal modello. Di conseguenza, la qualità di alcuni temi politici è scarsa.

Tuttavia, un chatbot generico è il peggior caso d'uso possibile per un'intelligenza artificiale aziendale. In questo senso, è quasi irrilevante che alcuni fatti politici in R1 siano discutibili. Con procedure standard come il fine-tuning o il RAG, le applicazioni testuali possono essere gestite molto bene con R1. Altri casi d'uso possono essere realizzati ancora meglio con R1. Tra questi:

Consultate le conoscenze aziendali (consultate i vostri documenti),
Adempimento degli obblighi derivanti dal Supply Chain Act, ad esempio analizzando i documenti dei fornitori,
Creare riassunti, traduzioni o semplificazioni linguistiche.
Assistente alla programmazione

Soprattutto l'ultimo esempio di applicazione è molto interessante. Così riuscì l'autore a programmare in poche ore ciò che altrimenti sarebbe costato più settimane. E questo per lo più sul divano con il tablet non troppo amichevole e senza utilizzo del microfono. È una differenza, se si programma con intelligenza artificiale per 30 minuti in modo divertente o se si raggiunge lo stesso risultato senza divertimento dopo due giorni al meglio. ([1])

Ulteriori vantaggi di DeepSeek-R1 rispetto a ChatGPT

OpenAI porta sempre nuovamente un rilascio o una nuova sottoversione di ChatGPT. Queste varianti si differenziano per la risposta alla tua domanda. Una consistenza non è data qui. Senza consistenza nessuna affidabilità nell'automatizzazione dei processi.

OpenAI è a pagamento. La versione gratuita è per le imprese o comunque viene utilizzata. La chatbox a pagamento non aiuta nell'automatizzazione dei processi. L'interfaccia di programmazione degli applicativi (API) porta incertezze: Quante volte si dovrà chiamare questa API? Quanti dati si dovranno inviare all'API? A seconda dell'estensione dei dati, i costi per l'utilizzo dell'API sono più alti o più bassi.

Gli aggiornamenti avvengono quando OpenAI li programma. Ciò significa anche che gli aggiornamenti non avvengono quando lo desiderate. In qualità di fornitore, OpenAI determina la versione di ChatGPT che l'utente è autorizzato a utilizzare.

DeepSeek funziona come potreste aspettarvi. Una volta scaricato, risponde sempre allo stesso modo. I test e i benchmark mostrano lo stato duraturo.

DeepSeek può essere gestito a costi fissi, che consistono principalmente nel prezzo dell'hardware (o del suo affitto).

DeepSeek può essere facilmente sostituito con altri modelli o varianti più recenti del modello. Ciò accade solo quando lo desiderate. Le incertezze possono essere eliminate attraverso i test. In generale, è anche una buona idea risolvere casi di utilizzo concreto con l'intelligenza artificiale. Questo può essere gestito e validato molto bene.

Perché DeepSeek è un big bang?

È sorprendente che un modello linguistico come R1 batta il capofila, ChatGPT, nell'opinione pubblica. E questo nonostante il fatto che il modello di DeepSeek sia più piccolo. DeepSeek avrà anche utilizzato meno risorse di OpenAI.

Ma non è tutto: DeepSeek-R1 è stato pubblicato e reso liberamente accessibile. Descritto in modo vivace, questo significa:

Chiunque può scaricare DeepSeek-R1 scaricando alcuni file nel browser sul proprio disco rigido. Chiunque
Chiunque può quindi installare R1 localmente sul proprio server AI. Chiunque.
Ognuno può quindi utilizzare R1 tutte le volte e per tutto il tempo che vuole. Non ci sono costi aggiuntivi.

Al contrario, ecco le possibilità offerte da ChatGPT.

Nessuno può scaricare ChatGPT.
Nessuno può utilizzare ChatGPT per compiti di automazione o altri usi dell'API senza spendere una quantità imprevedibile di denaro.

La sensazione reale

Ma non è tutto.

DeepSeek si aggiudica la corona con questo: DeepSeek ci racconta la ricetta per realizzare DeepSeek-R1.

Ciò significa che:

Chiunque può costruire un clone di ChatGPT.
Nessuno ha bisogno di altri OpenAI.

In particolare, DeepSeek ha reso disponibile quanto segue come open source:

Metodo di formazione da R1 come concetto ("carta")
Metodo di formazione di R1 come libreria di programmi utilizzabili (Python)
Distillare gli insiemi di dati contenenti conoscenza e processi di pensiero verbalizzati da DeepSeek
I principali set di dati, come C4 o The Pile, sono da tempo di dominio pubblico

Per illustrare questo aspetto, ecco un estratto di uno dei set di dati sui distillati citati:

Set di dati OpenThoughts-114k, estratto.

Ed ecco la ricetta di cottura pubblicata, in modo che anche la vostra azienda possa sfornare un nuovo modello di IA con la qualità di ChatGPT, se necessario:

Era solo un estratto. Inoltre, sono nominate e descritte anche altre sfumature come Multi-token Prediction

Il codice per ricreare DeepSeek-R1 è disponibile come codice sorgente nella libreria Transformers di Python.

DeepSeek ha spiegato a tutti come ChatGPT può essere ricostruito.
Questa è la vera sensazione.

Altre sensazioni

DeepSeek ha anche rivelato a tutti come i modelli linguistici esistenti, che sono piuttosto piccoli, possono essere resi ancora più intelligenti in modo semplice con l'aiuto del trasferimento di conoscenza.

Questi modelli più piccoli si chiamano Destillatmodelle. Un tale modello è così piccolo che può essere gestito con hardware a basso costo. Alcuni di questi modelli espansi possono essere eseguiti su un server AI ad accesso economico. Il modello più piccolo può anche essere installato su uno smartphone moderno e funzionare senza connessione internet!

DeepSeek ha reso disponibili gratuitamente anche questi modelli di distillati.

Conclusione

DeepSeek (come azienda o modello di IA) non rappresenta un rischio per la protezione dei dati se non si utilizza l'app DeepSeek. OpenAI è un rischio per la sicurezza dei dati sensibili perché è possibile utilizzare solo la versione cloud.

DeepSeek ha rivelato come ChatGPT possa essere sostituito. I modelli più piccoli come prodotto di scarto sono un grande regalo aggiuntivo che è stato fatto. Per una cifra ragionevolmente gestibile (acquisto di hardware o noleggio di computer), ogni azienda può ora ricreare ChatGPT per se stessa.

Anche se DeepSeek proviene dalla Cina: l'open source è open source. Naturalmente, tutti i fornitori di modelli di IA più grandi hanno rubato dati, non solo DeepSeek. Anche Google e Meta abusano dei dati degli utenti.

Le aziende tedesche possono tranquillamente utilizzare l'intelligenza artificiale di DeepSeek per risolvere numerosi problemi e automatizzare i processi.
Vale a dire con un'intelligenza artificiale aziendale che funziona (solo) nella vostra azienda.

La possibilità per le aziende di automatizzare processi con l'intelligenza artificiale è enormemente aumentata dopo DeepSeek-R1. Con i modelli locali, inoltre, si diverte molto più a soddisfare gli obblighi della normativa sulla IA che entrerà in vigore il 02 febbraio 2025 ([1]) !