Drücke „Enter”, um zum Inhalt zu springen.
Hinweis zu diesem Datenschutz-Blog:
Anscheinend verwenden Sie einen Werbeblocker wie uBlock Origin oder Ghostery, oder einen Browser, der bestimmte Dienste blockiert.
Leider wird dadurch auch der Dienst von VG Wort blockiert. Online-Autoren haben einen gesetzlichen Anspruch auf eine Vergütung, wenn ihre Beiträge oft genug aufgerufen wurden. Um dies zu messen, muss vom Autor ein Dienst der VG Wort eingebunden werden. Ohne diesen Dienst geht der gesetzliche Anspruch für den Autor verloren.

Ich wäre Ihnen sehr verbunden, wenn Sie sich bei der VG Wort darüber beschweren, dass deren Dienst anscheinend so ausgeprägt ist, dass er von manchen als blockierungswürdig eingestuft wird. Dies führt ggf. dazu, dass ich Beiträge kostenpflichtig gestalten muss.

Durch Klick auf folgenden Button wird eine Mailvorlage geladen, die Sie inhaltlich gerne anpassen und an die VG Wort abschicken können.

Nachricht an VG WortMailtext anzeigen

Betreff: Datenschutzprobleme mit dem VG Wort Dienst(METIS)
Guten Tag,

als Besucher des Datenschutz-Blogs Dr. DSGVO ist mir aufgefallen, dass der VG Wort Dienst durch datenschutzfreundliche Browser (Brave, Mullvad...) sowie Werbeblocker (uBlock, Ghostery...) blockiert wird.
Damit gehen dem Autor der Online-Texte Einnahmen verloren, die ihm aber gesetzlich zustehen.

Bitte beheben Sie dieses Problem!

Diese Nachricht wurde von mir persönlich abgeschickt und lediglich aus einer Vorlage generiert.
Wenn der Klick auf den Button keine Mail öffnet, schreiben Sie bitte eine Mail an info@vgwort.de und weisen darauf hin, dass der VG Wort Dienst von datenschutzfreundlichen Browser blockiert wird und dass Online Autoren daher die gesetzlich garantierten Einnahmen verloren gehen.
Vielen Dank,

Ihr Klaus Meffert - Dr. DSGVO Datenschutz-Blog.

PS: Wenn Sie meine Beiträge oder meinen Online Website-Check gut finden, freue ich mich auch über Ihre Spende.
Ausprobieren Online Webseiten-Check sofort das Ergebnis sehen

DeepSeek frente a ChatGPT: la verdad sobre el modelo lingüístico chino de IA

0
Dr. DSGVO Newsletter detected: Extended functionality available
More articles · Website-Checks · Live Offline-AI

La IA es un tema muy complejo que ni siquiera muchos técnicos comprenden. A esto se añade una información que a menudo es inexacta por razones de simplificación necesaria o necesidad de llamar la atención. El resultado son declaraciones que pintan una imagen distorsionada de DeepSeek. Los hechos más importantes en lenguaje sencillo.

Introducción

DeepSeek es una empresa china. Esta empresa ha publicado recientemente el modelo lingüístico DeepSeek-R1. Se dice que es tan bueno y en algunas partes incluso mejor que el modelo de lenguaje o1 de OpenAI ("ChatGPT").

Eso llevó a que los valores de las empresas de Inteligencia Artificial como Nvidia estuvieran en el suelo. Incluso la organización de protección de datos noyb informó esto en su boletín del 30.01.2025

A menudo se presenta como si DeepSeek fuera significativamente más eficiente que ChatGPT. Esto es cierto en los aspectos relevantes, pero no tanto en otros.

Luego lees titulares como este:

Estado a 30.01.2025, Fuente: https://www.epochtimes.de/politik/deutschland/deutsche-datenschuetzer-wollen-chinesische-deepseek-ki-ueberpruefen-medienbericht-a5022687.html (la imagen se ha traducido automáticamente).

Esto da la impresión de que el modelo en chino no es seguro, ya que los datos del usuario pueden utilizarse de forma indebida.

La mayoría de las afirmaciones de este tipo que circulan por la opinión pública no son del todo exactas.

Datos sobre DeepSeek

Protección y seguridad de los datos

DeepSeek es el nombre de una empresa china. Si en su lugar se utiliza DeepSeek como nombre de un modelo lingüístico, hay que distinguir entre dos variantes:

  1. Versión en la nube, también denominada "app"
  2. Modelo lingüístico de código abierto, puede utilizarse de forma totalmente independiente

La información de seguimiento mencionada anteriormente, de que "DeepSeek" probablemente abuse de los datos de usuarios, solo puede referirse a la versión en la nube ( "Aplicación"). Porque el modelo de lenguaje abierto se puede descargar y ejecutarse localmente, completamente sin conexión a Internet. Sin tal conexión, maliciosos pueden hacer que los datos de usuario viajen a China.

El modelo lingüístico DeepSeek puede utilizarse sin ningún riesgo para la seguridad.

Concretamente en la versión local, que puede ejecutarse en su propio servidor de IA.

ChatGPT no es tampoco necesariamente seguro. Las leyes de inteligencia estadounidenses permiten a las autoridades y servicios secretos estadounidenses acceder a los datos de otros. El acuerdo de protección de datos entre la UE y EE.UU., DPF, nunca tuvo mucho valor y era solo un formalismo. Se basa además en un Decreto ejecutivo de Joe Biden. Con la disolución de un importante órgano por parte de Trump se vuelve aún más insignificante. El Decreto ejecutivo podría ser igualmente declarado nulo por Donald Trump.

OpenAI también se divierte recopilando tus datos. Aunque tus datos de ChatGPT no se utilicen para entrenar a la IA, ¡podrían utilizarse para otros fines! Por ejemplo, para analizar la IA de OpenAI, que luego te hace cada vez más dependiente (ya se han anunciado subidas de precios).

Eficacia

Se dice que el entrenamiento de DeepSeek-R1 costó alrededor de 6 millones de dólares USD. Los gastos reales fueron más altos, ya que este número no se refiere a los costos totales y se aplica al modelo básico DeepSeek-V3. Se informó una suma de 100 millones de dólares para ChatGPT.

Eso es definitivamente cierto:

  • DeepSeek-R1 puede funcionar con un hardware mucho más barato que ChatGPT
  • DeepSeek-R1 responde mucho más rápido que ChatGPT porque es mucho más "pequeño
  • Por tanto, el funcionamiento de DeepSeek-R1 consume mucha menos energía

¿Por qué DeepSeek-R1 es más pequeño que ChatGPT? Según DeepSeek, R1 es un modelo 685B, es decir, consta de 685.000 millones de conexiones neuronales. ChatGPT probablemente tenga un tamaño similar. ¿Y ahora qué?

DeepSeek-R1 funciona de manera similar al cerebro humano: cuando hablas, se activa principalmente el centro de lenguaje. Al hablar, solo disparan unos pocos de todos tus neuronas en el cerebro. Técnicamente, esto se logra con DeepSeek-R1 mediante una arquitectura llamada Mixture of Experts. Esta arquitectura es ya desde hace tiempo un conocimiento generalizado. Fue aproximadamente utilizada por Mistral.

Como DeepSeek-R1 es de código abierto, el usuario puede descargarlo y utilizarlo. Para ejecutar DeepSeek-R1 en su propio hardware, necesita un servidor que cuesta unos 30.000 euros. Muchas empresas pueden permitírselo. ChatGPT, por otro lado, no quieres ejecutarlo en tu propio hardware, aparte del hecho de que no puedes porque OpenAI no quiere y por lo tanto no ha liberado el modelo.

calidad

En varias pruebas comparativas, DeepSeek-R1 rinde tan bien como OpenAI o1. Esto a pesar de que R1 es mucho más eficiente y pequeño que ChatGPT. Los usuarios informan de que R1 es tan bueno como ChatGPT, mientras que otros ven a R1 en cabeza.

Los censores chinos han suprimido o distorsionado algunos hechos del modelo. Como resultado, la calidad de algunas cuestiones políticas es deficiente.

Sin embargo, un chatbot general es el peor caso de uso posible para una IA corporativa. En este sentido, casi no importa que algunos hechos políticos en R1 sean cuestionables. Con procedimientos estándar como el ajuste fino o la RAG, las aplicaciones de texto pueden funcionar muy bien con R1. Otros casos de uso pueden realizarse aún mejor con R1. Por ejemplo:

  • Consulte los conocimientos de la empresa (consulte sus documentos),
  • Cumplimiento de las obligaciones derivadas de la Ley de la Cadena de Suministro, por ejemplo analizando los documentos de los proveedores,
  • Cree resúmenes, traducciones o simplificaciones lingüísticas.
  • Asistente de programación

El último caso de aplicación es especialmente interesante. Así, el autor logró programar en cuestión de horas lo que habría llevado varias semanas. Y eso, por lo general, en el sofá con un tablet no muy amigable y sin utilizar la función del micrófono. Es una diferencia si se programa con AI durante 30 minutos con diversión o si se logra el mismo resultado sin diversión después de dos días. ([1])

Otras ventajas de DeepSeek-R1 sobre ChatGPT

OpenAI saca a menudo un lanzamiento o una nueva subversión de ChatGPT. Estas variantes se diferencian en cuanto a la respuesta a su pregunta. No hay consistencia aquí. Sin consistencia, ninguna fiabilidad al automatizar procesos.

OpenAI es de pago. La versión gratuita es irrelevante para las empresas o se utiliza simplemente. La caja de chat de pago no ayuda a automatizar tus procesos. La interfaz de programación de aplicaciones (API) de pago conlleva incertidumbres: ¿Cuántas veces habrá que llamar a esta API? ¿Qué cantidad de datos se enviarán a la API? Dependiendo del alcance de los datos, también serán mayores o menores los costos por el uso de la API.

Las actualizaciones tienen lugar cuando OpenAI las programa. Esto también significa que las actualizaciones no tienen lugar cuando usted lo desea. Como proveedor, OpenAI determina la versión de ChatGPT que puedes utilizar.

DeepSeek funciona como podrías esperar. Una vez descargado, responde siempre igual. Los tests y benchmarks muestran el estado válido de manera duradera.

DeepSeek puede ser operado con costos fijos, que en esencia consisten en el precio de la hardware (o su alquiler).

DeepSeek se puede sustituir fácilmente por otros modelos o versiones más recientes del modelo. Esto sucede exactamente cuando lo deseas. Las incertidumbres pueden eliminarse mediante pruebas. En general, es también una buena idea resolver casos de aplicación concretos con Inteligencia Artificial. Estos se pueden dominar y validar muy bien.

¿Por qué DeepSeek es un big bang?

Resulta sorprendente que un modelo lingüístico como R1 supere al líder, ChatGPT, en opinión del público en general. Y eso a pesar de que el modelo de DeepSeek es más pequeño. DeepSeek también habrá utilizado menos recursos que OpenAI.

Pero eso no es todo: DeepSeek-R1 se ha publicado y es de libre acceso. Descrito vívidamente, esto significa:

  1. Cualquiera puede descargar DeepSeek-R1 descargando algunos archivos en su navegador a su disco duro. Cualquiera
  2. Cualquiera puede instalar R1 localmente en su servidor de IA. Cualquiera.
  3. Todo el mundo puede utilizar el R1 con la frecuencia y durante el tiempo que quiera. No hay costes adicionales.

En cambio, estas son las posibilidades que ofrece ChatGPT.

  1. Nadie puede descargar ChatGPT.
  2. Nadie puede utilizar ChatGPT para tareas de automatización u otro uso de la API sin gastar una cantidad impredecible de dinero.

La sensación real

Pero eso no fue todo.

DeepSeek se lleva la corona con esto: DeepSeek nos cuenta toda la receta para hacer DeepSeek-R1.

Es decir:

  • Cualquiera puede construir un clon de ChatGPT.
  • Nadie necesita más OpenAI.

En concreto, DeepSeek ofrece lo siguiente como código abierto:

  • Método de formación de R1 como concepto ("papel")
  • Método de formación de R1 como biblioteca de programas utilizable (Python)
  • Destilar conjuntos de datos que contengan conocimientos y procesos de pensamiento verbalizados a partir de DeepSeek
  • Principales conjuntos de datos como C4 o The Pile, que son de dominio público desde hace tiempo

Para ilustrarlo, he aquí un extracto de uno de los conjuntos de datos sobre destilados mencionados:

Conjunto de datos OpenThoughts-114k, extracto.

Y aquí está la receta de repostería publicada para que su empresa también pueda hornear un nuevo modelo de IA con la calidad de ChatGPT si lo necesita:

Fuente: HuggingFace

Eso fue solo un extracto. Nombrado y descrito también se encuentran otras sutilezas como Multi-token Prediction.

El código para recrear DeepSeek-R1 está disponible como código fuente en la biblioteca Transformers de Python.

DeepSeek ha dicho a todo el mundo cómo se puede reconstruir ChatGPT.

Esa es la verdadera sensación.

Más sensaciones

DeepSeek también reveló a todo el mundo cómo los modelos lingüísticos existentes, que son bastante pequeños, pueden hacerse aún más inteligentes de forma sencilla con la ayuda de la transferencia de conocimientos.

Estos modelos más pequeños se llaman Modelos de destilado. Un modelo así es tan pequeño que puede funcionar con hardware más asequible. Algunas de estas versiones ampliadas pueden ejecutarse en un servidor de Inteligencia Artificial de bajo costo. El modelo más pequeño de todos puede incluso instalarse en un smartphone moderno y ejecutarse sin conexión a Internet!

DeepSeek también ha puesto a disposición gratuita estos modelos de destilados.

Conclusión

DeepSeek (como empresa o modelo de IA) no es un riesgo para la protección de datos si no se utiliza la app DeepSeek. OpenAI es un riesgo para la seguridad de los datos sensibles porque solo puedes usar la versión en la nube.

DeepSeek ha revelado cómo se puede sustituir ChatGPT. Los modelos más pequeños como producto de desecho son un gran regalo adicional que se ha hecho. Por una cantidad razonablemente manejable (compra de hardware o alquiler de computación), cada empresa puede ahora recrear ChatGPT para sí misma.

Aunque DeepSeek proceda de China: el código abierto es el código abierto. Por supuesto, todos los proveedores de grandes modelos de IA han robado datos, no sólo DeepSeek. Google y Meta también hacen un uso indebido de los datos de los usuarios.

Las empresas alemanas pueden utilizar DeepSeek AI de forma segura para resolver numerosos problemas y automatizar procesos.

A saber, con una IA de empresa que (sólo) funcione en tu empresa.

La oportunidad para las empresas ha aumentado enormemente desde DeepSeek-R1 en cuanto a automatizar procesos con inteligencia artificial. Con modelos locales, además, se hace mucho más divertido cumplir con los deberes de la Ordenanza de Inteligencia Artificial, que entrarán en vigor el 02 de febrero de 2025!

Mensajes clave de este artículo

DeepSeek-R1 es un modelo en chino que, según los informes de las pruebas, es tan bueno como ChatGPT.

DeepSeek-R1 es más eficiente que ChatGPT, requiere menos potencia de cálculo y consume menos energía.

DeepSeek-R1 es de código abierto, por lo que puede descargarse y utilizarse localmente, lo que garantiza la seguridad de los datos.

Cualquiera puede utilizar DeepSeek-R1 e incluso crear sus propios modelos con la misma receta.

Acerca de estas declaraciones fundamentales
Sobre el autor
Me llamo Klaus Meffert. Soy doctor en informática y llevo más de 30 años dedicándome profesional y prácticamente a las tecnologías de la información. También trabajo como experto en informática y protección de datos. Obtengo mis resultados analizando la tecnología y el Derecho. Esto me parece absolutamente esencial cuando se trata de protección de datos digitales.

DeepSeek-R1: Un pequeño modelo lingüístico vaporiza la Bolsa