DeepSeek es a la vez inseguro (la aplicación en la nube) y muy seguro (el modelo de código abierto). Este documento sobre DeepSeek, elaborado por el grupo de expertos en IA del IT Klub Mainz & Rheinhessen, analiza los antecedentes de DeepSeek, la aplicación y los distintos modelos de DeepSeek. En primer lugar: cualquier empresa puede conseguir más con IA de código abierto que con ChatGPT.
¿Qué es DeepSeek?
Con "DeepSeek" se hace referencia principalmente al modelo de lenguaje excepcional llamado R1, publicado por una empresa china llamada "DeepSeek". Los modelos de lenguaje basados en inteligencia artificial también se conocen como LLMs, que significa "Large Language Model".
Lo que es posible con un modelo de código abierto de DeepSeek es básicamente también posible con los potentes modelos de código abierto de otros proveedores (también europeos).
Con R1, DeepSeek ha logrado crear un modelo de lenguaje que es tan bueno como "ChatGPT". DeepSeek ha causado sensación, porque su aplicación rompió todos los récords en cuestión de tiempo debido a la calidad de R1 y así obtuvo la máxima atención.
¿Qué hace tan especial a DeepSeek?
Debido a numerosas características destacadas, DeepSeek ha agitado el mercado de la Inteligencia Artificial. La aplicación DeepSeek se convirtió en la app más descargada en un plazo muy corto. Algunos de los motivos del éxito:
Alto factor de inteligencia
Los modelos de DeepSeek pueden tener un número muy elevado de neuronas y requerir sólo una fracción de ellas por tarea. DeepSeek también ha inventado sofisticados métodos de entrenamiento.
Formación y comportamiento de respuesta más eficaces
A través de la activación selectiva de expertos se reduce significativamente el Esfuerzo de cálculo en comparación con modelos cuya red neuronal está siempre completamente activada.
Costes más bajos
A través de la arquitectura de modelo selectiva, los costos para el funcionamiento son significativamente menores que en modelos como ChatGPT de OpenAI.
Código abierto y seguro
Cada uno puede convertirse en "OpenAI": los modelos DeepSeek están disponibles de forma gratuita y pueden ser ejecutados localmente. La versión local no requiere ningún intercambio de datos. La siguiente gráfica lo ilustra:

Los modelos de IA de código abierto pueden implantarse en sistemas de IA simplemente descargando un archivo. El modelo no envía datos a ninguna parte. Como analogía, imagine un archivo de texto que no puede comunicarse con nadie ni con nada.
Publicada la receta del éxito
Por si fuera poco, DeepSeek ha revelado cómo cualquiera puede crear su propio modelo de IA para rivalizar con ChatGPT.
¿Qué significa "DeepSeek"?
El término "DeepSeek" se utiliza a menudo como sinónimo de varios términos que tienen significados diferentes:
| Term | Meaning | Properties |
|---|---|---|
| DeepSeek | Chinese company |
“AI recipe” given away, startup?, strokes of genius |
| DeepSeek R1 |
Powerful language model |
Open source, highly powerful, best data security |
| DeepSeek App |
Application for smartphones |
No data security, vaporized the stock market, based on R1 |
| Student models |
Smart LLMs with compact size |
Open source, best data security, R1 was the teacher |
¿Es seguro utilizar DeepSeek?
Aplicación para smartphones (versión en la nube)
La aplicación DeepSeek se considera extremadamente insegura. En general, no debería utilizarse, ni siquiera con fines puramente privados.
Open-Source Varianten
Los modelos de código abierto de DeepSeek, incluidos los prácticos modelos destilados, pueden descargarse y funcionar de forma completamente local/autónoma en su propio hardware. Como resultado, ofrecen una seguridad total de los datos. Se puede descartar la transferencia de datos a terceros. Esto significa que los modelos de IA de DeepSeek son más seguros en su versión de código abierto que las soluciones en la nube como las de OpenAI o Microsoft.
Conocimientos almacenados
En cada modelo de IA se almacena una enorme cantidad de conocimiento del mundo a través de los datos de entrenamiento. DeepSeek, una empresa china, distorsionó algunos hechos por motivos políticos y los almacenó de forma cuestionable en el modelo insignia R1 que ofrecía. Ahora hay modelos que lo han corregido.
En el caso de las aplicaciones de IA que consultan el conocimiento de la empresa, el conocimiento de la empresa suele verse favorecido en procesos generalizados como el GAR y el imperativo chino se suprime y se vuelve inofensivo.
What bedeutet „Mixture of Experts“?
La "mezcla de expertos" (MoE) es una arquitectura para redes neuronales en la que varias subredes especializadas (los "expertos") existen en paralelo, mientras que un mecanismo de enrutamiento (el "guardián") decide qué expertos deben activarse para la tarea actual.
El enfoque Transformer
Transformer es un enfoque de IA muy utilizado para los modelos "inteligentes". En los modelos Transformer convencionales, todos los parámetros del modelo se utilizan para cada consulta. En cambio, los modelos MoE dividen sus capacidades en varias subredes especializadas, cada una de las cuales está optimizada para tipos específicos de entradas o tareas.
Arquitectura optimizada
Cuando un modelo MoE recibe una entrada, primero utiliza un enrutador (también conocido como "red de compuerta"). El enrutador decide cuáles de los expertos disponibles son los más adecuados para esta tarea específica. Normalmente, sólo se activan uno o dos expertos por ficha, mientras que los demás permanecen inactivos.
Otros modelos de ME
DeepSeek no inventó el enfoque MoE (pero sí produjo otras innovaciones). Por ejemplo, la empresa francesa Mistral proporcionó un modelo con esta arquitectura a finales de 2023.
¿Cómo se estructura DeepSeek R1?
Los modelos de DeepSeek procesan las entradas activando sólo unas pocas partes del cerebro electrónico -las llamadas expertas- en función de la pregunta que se formule.

a los expertos correspondientes. El diagrama se generó con ayuda de IA. (la imagen se ha traducido automáticamente).
Esta arquitectura ofrece varias ventajas significativas sobre los modelos convencionales con una estructura densa y explica por qué modelos MoE como DeepSeek-MoE pueden ser muy potentes con un esfuerzo computacional comparativamente pequeño. El principio es comparable al del cerebro humano: al hablar, se utiliza predominantemente el centro del habla y otras partes están poco o nada activas.
Componentes importantes de un modelo de ME
Los modelos de ME como DeepSeek R1 utilizan las siguientes innovaciones:
- Red de Router: Determina qué expertos en Inteligencia Artificial activan para cada parte de la entrada (Token).
- Redes de expertos: Redes neuronales especializadas que están entrenadas para realizar tareas específicas.
- Peso de expertos: Los pesos calculados por el router que determinan hasta qué punto cada experto contribuye al resultado final.
- Ponderada Suma: Combinar los gastos de diferentes expertos según los pesos asignados por el router.
Resumido
- Los modelos de IA de código abierto son cada vez mejores y más eficaces.
- Modelos como DeepSeek R1 pueden funcionar con hardware asequible.
- Las implantaciones locales mejoran la calidad de los resultados y ahorran costes cuando se utilizan de forma más intensiva.
- La aplicación DeepSeek (Cloud) no debe utilizarse bajo ninguna circunstancia.
- Las instrucciones para crear "ChatGPT 2.0" están a disposición del público y son de uso gratuito.
- Los modelos de código abierto crean independencia de los servicios en la nube y las aplicaciones de terceros.
Acerca del grupo de expertos en IA del IT Klub
El IT Klub puede demostrar su experiencia concentrada en TI. El grupo de expertos en IA ofrece apoyo con ofertas prácticas y recomendaciones sobre aspectos técnicos y jurídicos. La atención se centra en soluciones personalizadas para asistentes inteligentes de IA y formación continua específica.
Acerca del Club IT
El IT Klub Mainz & Rheinhessen se fundó con el objetivo de representar al sector para las empresas de la región. Como red, el IT Klub ofrece a sus miembros transferencia de conocimientos, formación continua, promoción de jóvenes talentos y marketing de localización.
Randnotiz
Este artículo fue creado con la ayuda de la IA como un extracto del PDF (pero no sólo con la IA).
El extracto de texto de esta entrada, que sólo pueden ver los motores de búsqueda, se denomina "extracto". También se creó con ayuda de la IA.
La imagen del artículo se generó con IA. Los dos diagramas también se generaron con ayuda de IA.
El PDF para descargar fue, salvo por el contenido, creado de nuevo con ayuda de la IA:

Esta mini-ilustración "Creación asistida por IA" también se generó con IA. Poco a poco se está volviendo aburrido (¡pero en el buen sentido!)…
Cualquiera que hable de IA y ofrezca consultoría y soluciones de IA también debería utilizarla. Esto es exactamente lo que está ocurriendo aquí. En próximos artículos veremos más ejemplos, como la generación altamente eficiente de código de programas por parte de asistentes de IA (programación de IA).



Me llamo Klaus Meffert. Soy doctor en informática y llevo más de 30 años dedicándome profesional y prácticamente a las tecnologías de la información. También trabajo como experto en informática y protección de datos. Obtengo mis resultados analizando la tecnología y el Derecho. Esto me parece absolutamente esencial cuando se trata de protección de datos digitales.