DeepSeek è sia insicuro (l'applicazione cloud) che molto sicuro (il modello open source). Questo documento su DeepSeek, nato dal gruppo di esperti di IA dell'IT Klub Mainz & Rheinhessen, analizza il background di DeepSeek, l'applicazione e i vari modelli di DeepSeek. Prima di tutto: ogni azienda può ottenere di più con l'IA open-source che con ChatGPT.
Che cos'è DeepSeek?
Con "DeepSeek" si fa riferimento soprattutto al modello linguistico eccezionale chiamato R1, pubblicato da una società cinese di nome "DeepSeek". I modelli linguistici basati su intelligenza artificiale vengono anche chiamati LLMs, che sta per "Large Language Model".
Ciò che è possibile con un modello open source di DeepSeek è fondamentalmente possibile anche con i potenti modelli open source di altri fornitori (anche europei).
Con R1, DeepSeek è riuscito a creare un modello linguistico che è altrettanto buono come "ChatGPT". DeepSeek ha suscitato scalpore, perché l'applicazione di loro ha rotto tutti i record in breve tempo e ha ottenuto la massima attenzione.
Cosa rende DeepSeek così speciale?
A causa di numerose caratteristiche eccezionali, DeepSeek ha scosso il mercato della IA. L'app di DeepSeek è stata scaricata in breve tempo da più persone rispetto ad altre app. Alcuni dei motivi del successo:
Elevato fattore di intelligenza
I modelli DeepSeek possono avere un numero molto elevato di neuroni, ma ne richiedono solo una frazione per ogni compito. DeepSeek ha anche inventato sofisticati metodi di addestramento.
Comportamento di formazione e risposta più efficiente
Attraverso l'attivazione selettiva di esperti si riduce significativamente il Sforzo di calcolo rispetto a modelli la cui rete neurale è sempre completamente attivata.
Costi inferiori
Attraverso l'architettura del modello selezionato, i costi per il funzionamento sono nettamente inferiori a quelli di modelli come ChatGPT di OpenAI.
Open source e sicuro
Ogni persona può diventare "OpenAI": i modelli DeepSeek sono disponibili gratuitamente e possono essere eseguiti localmente. La versione locale non richiede alcun trasferimento di dati. La seguente grafica lo illustra:

I modelli di intelligenza artificiale open source possono essere inseriti nei sistemi di intelligenza artificiale semplicemente scaricando un file. Il modello non invia alcun dato da nessuna parte. Per analogia, immaginiamo un file di testo che non può comunicare con nessuno o con niente.
Pubblicata la ricetta per il successo
Per finire, DeepSeek ha rivelato come chiunque possa creare il proprio modello di intelligenza artificiale per competere con ChatGPT.
Che cosa significa "DeepSeek"?
Il termine "DeepSeek" è spesso usato come sinonimo di vari termini che hanno significati diversi:
| Term | Meaning | Properties |
|---|---|---|
| DeepSeek | Chinese company |
“AI recipe” given away, startup?, strokes of genius |
| DeepSeek R1 |
Powerful language model |
Open source, highly powerful, best data security |
| DeepSeek App |
Application for smartphones |
No data security, vaporized the stock market, based on R1 |
| Student models |
Smart LLMs with compact size |
Open source, best data security, R1 was the teacher |
DeepSeek è sicuro da usare?
App per smartphone (versione cloud)
L'applicazione DeepSeek è considerata estremamente insicura. In generale non dovrebbe essere utilizzata, nemmeno per scopi puramente privati.
Open-Source Varianten
I modelli open-source di DeepSeek, compresi i pratici modelli di distillato, possono essere scaricati e utilizzati in modo completamente locale/autonomo sul proprio hardware. Di conseguenza, offrono una completa sicurezza dei dati. È possibile escludere il trasferimento dei dati a terzi. Ciò significa che i modelli di intelligenza artificiale di DeepSeek sono più sicuri nella versione open source rispetto alle soluzioni cloud come quelle di OpenAI o Microsoft.
Conoscenze memorizzate
In ogni modello di intelligenza artificiale viene immagazzinata un'enorme quantità di conoscenza del mondo attraverso i dati di addestramento. DeepSeek, un'azienda cinese, ha distorto alcuni fatti per motivi politici e li ha memorizzati in modo discutibile nel modello di punta R1 in offerta. Ora ci sono modelli che hanno corretto il problema.
Nel caso di applicazioni di IA che interrogano la conoscenza aziendale, la conoscenza aziendale è generalmente favorita in processi diffusi come il RAG e l'imperativo cinese viene soppresso e reso innocuo.
What bedeutet „Mixture of Experts“?
La "Mixture of Experts" (MoE) è un'architettura per reti neurali in cui diverse sottoreti specializzate (gli "esperti") esistono in parallelo, mentre un meccanismo di instradamento (il "gatekeeper") decide quali esperti devono essere attivati per il compito corrente.
L'approccio del trasformatore
Transformer è un approccio AI ampiamente utilizzato per i modelli "intelligenti". Nei modelli Transformer convenzionali, tutti i parametri del modello vengono utilizzati per ogni interrogazione. I modelli MoE, invece, dividono le loro capacità in diverse sottoreti specializzate, ognuna delle quali è ottimizzata per specifici tipi di input o compiti.
Architettura ottimizzata
Quando un modello MoE riceve un input, utilizza per prima cosa un router (noto anche come "rete di selezione"). Il router decide quali tra gli esperti disponibili sono più adatti per questo compito specifico. In genere, vengono attivati solo uno o due esperti per token, mentre gli altri rimangono inattivi.
Altri modelli MoE
DeepSeek non ha inventato l'approccio MoE (ma ha prodotto altre innovazioni). Ad esempio, l'azienda francese Mistral ha fornito un modello con questa architettura alla fine del 2023.
Come è strutturato DeepSeek R1?
I modelli DeepSeek elaborano gli input attivando solo alcune parti del cervello elettronico – i cosiddetti esperti – a seconda della domanda posta.

agli esperti corrispondenti. Lo schema è stato generato con il supporto dell'intelligenza artificiale. (l'immagine è stata tradotta automaticamente).
Questa architettura offre diversi vantaggi significativi rispetto ai modelli convenzionali con una struttura densa e spiega perché i modelli MoE come DeepSeek-MoE possono essere molto potenti con uno sforzo di calcolo relativamente ridotto. Il principio è paragonabile a quello del cervello umano: quando si parla, viene utilizzato prevalentemente il centro del linguaggio e le altre parti sono poco o per nulla attive.
Componenti importanti di un modello MoE
I modelli MoE come DeepSeek R1 utilizzano le seguenti innovazioni:
- Rete del Router: Determina quali esperti di intelligenza artificiale attivarsi per quale parte dell'input (token).
- Reti di esperti: Reti neural specializzate che sono state addestrate per svolgere specifiche attività.
- Esperti-Valori: I pesi calcolati dal router che determinano quanto ciascun esperto contribuisce al risultato finale.
- Somma ponderata: Combinare le spese dei diversi esperti in base ai pesi assegnati dal router.
Riassunto
- I modelli di intelligenza artificiale open source stanno diventando migliori e più efficienti.
- Modelli come DeepSeek R1 possono essere utilizzati con un hardware accessibile.
- Le implementazioni locali migliorano la qualità dei risultati e consentono di risparmiare sui costi se utilizzate in modo più intensivo.
- L'applicazione DeepSeek (Cloud) non deve essere utilizzata in nessun caso.
- Le istruzioni per creare "ChatGPT 2.0" sono disponibili pubblicamente e gratuite.
- I modelli open source creano indipendenza dai servizi cloud e dalle applicazioni di terze parti.
Informazioni sul gruppo di esperti di IA dell'IT Klub
L'IT Klub può dimostrare un concentrato di competenze informatiche. Il gruppo di esperti di IA fornisce supporto con offerte pratiche e raccomandazioni su aspetti tecnici e legali. L'attenzione si concentra su soluzioni personalizzate per assistenti AI intelligenti e su una formazione continua mirata.
Informazioni sul Club IT
L'IT Klub Mainz & Rheinhessen è stato fondato con l'obiettivo di rappresentare il settore per le aziende della regione. Come rete, l'IT Klub offre ai suoi membri trasferimento di conoscenze, formazione continua, promozione di giovani talenti e marketing territoriale.
Randnotiz
Questo articolo è stato creato con l'aiuto dell'AI come estratto dal PDF (ma non solo con l'AI).
L'estratto di testo di questo post, che solo i motori di ricerca possono vedere, è chiamato "estratto". Anch'esso è stato creato con l'aiuto dell'IA.
L'immagine dell'articolo è stata generata con l'IA. Anche i due diagrammi sono stati generati con il supporto dell'IA.
Il PDF da scaricare è stato creato, tranne che per il contenuto, ancora una volta con l'aiuto dell'AI:

Anche questa mini-illustrazione "Creazione assistita dall'AI" è stata generata con l'AI. Sta lentamente diventando noioso (ma in modo positivo!) …
Chiunque parli di IA e offra consulenza e soluzioni di IA dovrebbe anche utilizzare l'IA stessa. Questo è esattamente ciò che sta accadendo qui. Altri esempi seguiranno nei prossimi articoli, come la generazione altamente efficiente di codice di programma da parte degli assistenti AI (programmazione AI).



My name is Klaus Meffert. I have a doctorate in computer science and have been working professionally and practically with information technology for over 30 years. I also work as an expert in IT & data protection. I achieve my results by looking at technology and law. This seems absolutely essential to me when it comes to digital data protection. My company, IT Logic GmbH, also offers consulting and development of optimized and secure AI solutions.