¿DeepSeek es realmente más seguro que ChatGPT?

DeepSeek es seguro en su versión de código abierto, ya que puede ser operado localmente y, por lo tanto, ningún dato de usuario viaja a China. ChatGPT, por otro lado, es más vulnerable, ya que los servicios de inteligencia estadounidenses pueden obtener datos de los usuarios.

¿Qué tan eficiente es DeepSeek-R1 en comparación con ChatGPT?

DeepSeek-R1 es significativamente más eficiente, ya que puede operar en hardware menos potente, responde más rápido y consume menos energía que ChatGPT.

¿Cuáles son los casos de uso que son particularmente interesantes con DeepSeek-R1?

DeepSeek-R1 es adecuado para la consulta de conocimiento empresarial, el cumplimiento de las leyes de la cadena de suministro y la creación de resúmenes, traducciones o simplificaciones lingüísticas, lo que lo convierte en una herramienta valiosa para diversas aplicaciones comerciales.

¿Cuáles son las principales diferencias entre DeepSeek y ChatGPT?

DeepSeek destaca por su naturaleza de código abierto, permite un funcionamiento local sin costos y ofrece consistencia, a diferencia de las versiones variables y los costos impredecibles de ChatGPT.

¿Cómo se puede utilizar DeepSeek-R1?

DeepSeek-R1 se puede descargar y operar en su propio hardware, sin tarifas de suscripción ni dependencia de la nube. Esto permite un uso local y económico.

¿Cuáles son las ventajas de DeepSeek sobre ChatGPT en términos de automatización?

DeepSeek permite una automatización fiable, ya que se opera localmente y no genera costes de API. En contraste, ChatGPT es poco fiable para procesos automatizados debido a costes de API impredecibles y cambios de versión.

¿Cuál es la principal ventaja de DeepSeek-R1 sobre ChatGPT?

DeepSeek-R1 es más eficiente, requiere menos potencia de cálculo y consume menos energía que ChatGPT. Esto lo convierte en una opción más económica en recursos.

¿Por qué es especial DeepSeek-R1?

DeepSeek-R1 está disponible en una versión de código abierto y se puede operar localmente, lo que aumenta la seguridad de los datos. Los usuarios pueden descargar el modelo y crear sus propios modelos basándose en la misma receta.

DeepSeek frente a ChatGPT: la verdad sobre el modelo lingüístico chino de IA

La IA es un tema muy complejo que ni siquiera muchos técnicos comprenden. A esto se añade una información que a menudo es inexacta por razones de simplificación necesaria o necesidad de llamar la atención. El resultado son declaraciones que pintan una imagen distorsionada de DeepSeek. Los hechos más importantes en lenguaje sencillo.

Introducción

DeepSeek es una empresa china. Esta empresa ha publicado recientemente el modelo lingüístico DeepSeek-R1. Se dice que es tan bueno y en algunas partes incluso mejor que el modelo de lenguaje o1 de OpenAI ("ChatGPT").

Eso llevó a que los valores de las empresas de Inteligencia Artificial como Nvidia estuvieran en el suelo. Incluso la organización de protección de datos noyb informó esto en su boletín del 30.01.2025

A menudo se presenta como si DeepSeek fuera significativamente más eficiente que ChatGPT. Esto es cierto en los aspectos relevantes, pero no tanto en otros.

Luego lees titulares como este:

Estado a 30.01.2025, Fuente: https://www.epochtimes.de/politik/deutschland/deutsche-datenschuetzer-wollen-chinesische-deepseek-ki-ueberpruefen-medienbericht-a5022687.html (la imagen se ha traducido automáticamente).

Esto da la impresión de que el modelo en chino no es seguro, ya que los datos del usuario pueden utilizarse de forma indebida.

La mayoría de las afirmaciones de este tipo que circulan por la opinión pública no son del todo exactas.

Datos sobre DeepSeek

Protección y seguridad de los datos

DeepSeek es el nombre de una empresa china. Si en su lugar se utiliza DeepSeek como nombre de un modelo lingüístico, hay que distinguir entre dos variantes:

Versión en la nube, también denominada "app"
Modelo lingüístico de código abierto, puede utilizarse de forma totalmente independiente

La información de seguimiento mencionada anteriormente, de que "DeepSeek" probablemente abuse de los datos de usuarios, solo puede referirse a la versión en la nube ( "Aplicación"). Porque el modelo de lenguaje abierto se puede descargar y ejecutarse localmente, completamente sin conexión a Internet. Sin tal conexión, maliciosos pueden hacer que los datos de usuario viajen a China.

El modelo lingüístico DeepSeek puede utilizarse sin ningún riesgo para la seguridad.
Concretamente en la versión local, que puede ejecutarse en su propio servidor de IA.

ChatGPT no es tampoco necesariamente seguro. Las leyes de inteligencia estadounidenses permiten a las autoridades y servicios secretos estadounidenses acceder a los datos de otros. El acuerdo de protección de datos entre la UE y EE.UU., DPF, nunca tuvo mucho valor y era solo un formalismo. Se basa además en un Decreto ejecutivo de Joe Biden. Con la disolución de un importante órgano por parte de Trump se vuelve aún más insignificante. El Decreto ejecutivo podría ser igualmente declarado nulo por Donald Trump.

OpenAI también se divierte recopilando tus datos. Aunque tus datos de ChatGPT no se utilicen para entrenar a la IA, ¡podrían utilizarse para otros fines! Por ejemplo, para analizar la IA de OpenAI, que luego te hace cada vez más dependiente (ya se han anunciado subidas de precios).

Eficacia

Se dice que el entrenamiento de DeepSeek-R1 costó alrededor de 6 millones de dólares USD. Los gastos reales fueron más altos, ya que este número no se refiere a los costos totales y se aplica al modelo básico DeepSeek-V3. Se informó una suma de 100 millones de dólares para ChatGPT.

Eso es definitivamente cierto:

DeepSeek-R1 puede funcionar con un hardware mucho más barato que ChatGPT
DeepSeek-R1 responde mucho más rápido que ChatGPT porque es mucho más "pequeño
Por tanto, el funcionamiento de DeepSeek-R1 consume mucha menos energía

¿Por qué DeepSeek-R1 es más pequeño que ChatGPT? Según DeepSeek, R1 es un modelo 685B, es decir, consta de 685.000 millones de conexiones neuronales. ChatGPT probablemente tenga un tamaño similar. ¿Y ahora qué?

DeepSeek-R1 funciona de manera similar al cerebro humano: cuando hablas, se activa principalmente el centro de lenguaje. Al hablar, solo disparan unos pocos de todos tus neuronas en el cerebro. Técnicamente, esto se logra con DeepSeek-R1 mediante una arquitectura llamada Mixture of Experts. Esta arquitectura es ya desde hace tiempo un conocimiento generalizado. Fue aproximadamente utilizada por Mistral.

Como DeepSeek-R1 es de código abierto, el usuario puede descargarlo y utilizarlo. Para ejecutar DeepSeek-R1 en su propio hardware, necesita un servidor que cuesta unos 30.000 euros. Muchas empresas pueden permitírselo. ChatGPT, por otro lado, no quieres ejecutarlo en tu propio hardware, aparte del hecho de que no puedes porque OpenAI no quiere y por lo tanto no ha liberado el modelo.

calidad

En varias pruebas comparativas, DeepSeek-R1 rinde tan bien como OpenAI o1. Esto a pesar de que R1 es mucho más eficiente y pequeño que ChatGPT. Los usuarios informan de que R1 es tan bueno como ChatGPT, mientras que otros ven a R1 en cabeza.

Los censores chinos han suprimido o distorsionado algunos hechos del modelo. Como resultado, la calidad de algunas cuestiones políticas es deficiente.

Sin embargo, un chatbot general es el peor caso de uso posible para una IA corporativa. En este sentido, casi no importa que algunos hechos políticos en R1 sean cuestionables. Con procedimientos estándar como el ajuste fino o la RAG, las aplicaciones de texto pueden funcionar muy bien con R1. Otros casos de uso pueden realizarse aún mejor con R1. Por ejemplo:

Consulte los conocimientos de la empresa (consulte sus documentos),
Cumplimiento de las obligaciones derivadas de la Ley de la Cadena de Suministro, por ejemplo analizando los documentos de los proveedores,
Cree resúmenes, traducciones o simplificaciones lingüísticas.
Asistente de programación

El último caso de aplicación es especialmente interesante. Así, el autor logró programar en cuestión de horas lo que habría llevado varias semanas. Y eso, por lo general, en el sofá con un tablet no muy amigable y sin utilizar la función del micrófono. Es una diferencia si se programa con AI durante 30 minutos con diversión o si se logra el mismo resultado sin diversión después de dos días. ([1])

Otras ventajas de DeepSeek-R1 sobre ChatGPT

OpenAI saca a menudo un lanzamiento o una nueva subversión de ChatGPT. Estas variantes se diferencian en cuanto a la respuesta a su pregunta. No hay consistencia aquí. Sin consistencia, ninguna fiabilidad al automatizar procesos.

OpenAI es de pago. La versión gratuita es irrelevante para las empresas o se utiliza simplemente. La caja de chat de pago no ayuda a automatizar tus procesos. La interfaz de programación de aplicaciones (API) de pago conlleva incertidumbres: ¿Cuántas veces habrá que llamar a esta API? ¿Qué cantidad de datos se enviarán a la API? Dependiendo del alcance de los datos, también serán mayores o menores los costos por el uso de la API.

Las actualizaciones tienen lugar cuando OpenAI las programa. Esto también significa que las actualizaciones no tienen lugar cuando usted lo desea. Como proveedor, OpenAI determina la versión de ChatGPT que puedes utilizar.

DeepSeek funciona como podrías esperar. Una vez descargado, responde siempre igual. Los tests y benchmarks muestran el estado válido de manera duradera.

DeepSeek puede ser operado con costos fijos, que en esencia consisten en el precio de la hardware (o su alquiler).

DeepSeek se puede sustituir fácilmente por otros modelos o versiones más recientes del modelo. Esto sucede exactamente cuando lo deseas. Las incertidumbres pueden eliminarse mediante pruebas. En general, es también una buena idea resolver casos de aplicación concretos con Inteligencia Artificial. Estos se pueden dominar y validar muy bien.

¿Por qué DeepSeek es un big bang?

Resulta sorprendente que un modelo lingüístico como R1 supere al líder, ChatGPT, en opinión del público en general. Y eso a pesar de que el modelo de DeepSeek es más pequeño. DeepSeek también habrá utilizado menos recursos que OpenAI.

Pero eso no es todo: DeepSeek-R1 se ha publicado y es de libre acceso. Descrito vívidamente, esto significa:

Cualquiera puede descargar DeepSeek-R1 descargando algunos archivos en su navegador a su disco duro. Cualquiera
Cualquiera puede instalar R1 localmente en su servidor de IA. Cualquiera.
Todo el mundo puede utilizar el R1 con la frecuencia y durante el tiempo que quiera. No hay costes adicionales.

En cambio, estas son las posibilidades que ofrece ChatGPT.

Nadie puede descargar ChatGPT.
Nadie puede utilizar ChatGPT para tareas de automatización u otro uso de la API sin gastar una cantidad impredecible de dinero.

La sensación real

Pero eso no fue todo.

DeepSeek se lleva la corona con esto: DeepSeek nos cuenta toda la receta para hacer DeepSeek-R1.

Es decir:

Cualquiera puede construir un clon de ChatGPT.
Nadie necesita más OpenAI.

En concreto, DeepSeek ofrece lo siguiente como código abierto:

Método de formación de R1 como concepto ("papel")
Método de formación de R1 como biblioteca de programas utilizable (Python)
Destilar conjuntos de datos que contengan conocimientos y procesos de pensamiento verbalizados a partir de DeepSeek
Principales conjuntos de datos como C4 o The Pile, que son de dominio público desde hace tiempo

Para ilustrarlo, he aquí un extracto de uno de los conjuntos de datos sobre destilados mencionados:

Conjunto de datos OpenThoughts-114k, extracto.

Y aquí está la receta de repostería publicada para que su empresa también pueda hornear un nuevo modelo de IA con la calidad de ChatGPT si lo necesita:

Eso fue solo un extracto. Nombrado y descrito también se encuentran otras sutilezas como Multi-token Prediction.

El código para recrear DeepSeek-R1 está disponible como código fuente en la biblioteca Transformers de Python.

DeepSeek ha dicho a todo el mundo cómo se puede reconstruir ChatGPT.
Esa es la verdadera sensación.

Más sensaciones

DeepSeek también reveló a todo el mundo cómo los modelos lingüísticos existentes, que son bastante pequeños, pueden hacerse aún más inteligentes de forma sencilla con la ayuda de la transferencia de conocimientos.

Estos modelos más pequeños se llaman Modelos de destilado. Un modelo así es tan pequeño que puede funcionar con hardware más asequible. Algunas de estas versiones ampliadas pueden ejecutarse en un servidor de Inteligencia Artificial de bajo costo. El modelo más pequeño de todos puede incluso instalarse en un smartphone moderno y ejecutarse sin conexión a Internet!

DeepSeek también ha puesto a disposición gratuita estos modelos de destilados.

Conclusión

DeepSeek (como empresa o modelo de IA) no es un riesgo para la protección de datos si no se utiliza la app DeepSeek. OpenAI es un riesgo para la seguridad de los datos sensibles porque solo puedes usar la versión en la nube.

DeepSeek ha revelado cómo se puede sustituir ChatGPT. Los modelos más pequeños como producto de desecho son un gran regalo adicional que se ha hecho. Por una cantidad razonablemente manejable (compra de hardware o alquiler de computación), cada empresa puede ahora recrear ChatGPT para sí misma.

Aunque DeepSeek proceda de China: el código abierto es el código abierto. Por supuesto, todos los proveedores de grandes modelos de IA han robado datos, no sólo DeepSeek. Google y Meta también hacen un uso indebido de los datos de los usuarios.

Las empresas alemanas pueden utilizar DeepSeek AI de forma segura para resolver numerosos problemas y automatizar procesos.
A saber, con una IA de empresa que (sólo) funcione en tu empresa.

La oportunidad para las empresas ha aumentado enormemente desde DeepSeek-R1 en cuanto a automatizar procesos con inteligencia artificial. Con modelos locales, además, se hace mucho más divertido cumplir con los deberes de la Ordenanza de Inteligencia Artificial, que entrarán en vigor el 02 de febrero de 2025!