¿Cómo funciona esencialmente la Inteligencia Artificial (IA)?

Los sistemas de IA como ChatGPT se basan en redes neuronales artificiales que imitan al cerebro humano. Estas redes procesan la información en secuencias de números (vectores) y utilizan operaciones matemáticas para resolver tareas.

¿Qué papel juegan las tarjetas gráficas (GPUs) en la IA?

Las GPUs son cruciales para las aplicaciones de IA, ya que son especialmente adecuadas para la ejecución paralela de operaciones de cálculo que se utilizan en los algoritmos de IA. Permiten un procesamiento significativamente más rápido en comparación con las CPUs tradicionales.

¿Cómo funcionan los generadores de imágenes como Dall-E o Midjourney?

Estos generadores trabajan con vectores que representan imágenes, texto o vídeo. Compara estos vectores para crear nuevas imágenes o vídeos, basándose en la información proporcionada.

¿Cuáles son los desafíos al calcular modelos de IA?

El cálculo de modelos como BloombergGPT requiere una enorme potencia de cómputo, por ejemplo, a través de 512 tarjetas gráficas de alto rendimiento con 40 GB de memoria de tarjeta gráfica cada una. Esto conlleva altos costos y representa un desafío técnico significativo.

¿Qué es el conjunto de datos LAION 5B?

El conjunto de datos LAION 5B es una base de datos popular a nivel mundial, compilada por LAION, que contiene más de 5 mil millones de imágenes. Estas imágenes se descargaron de fuentes de acceso público y se utilizan para aplicaciones de imágenes de IA.

¿Qué aspectos legales son relevantes en relación con las imágenes generadas por IA?

Las imágenes generadas por IA están sujetas tanto al derecho de autor como a la protección de datos, ya que implican un procesamiento automatizado de datos personales (como imágenes). Es crucial tener en cuenta el marco legal para evitar infracciones de derechos de autor y problemas de protección de datos.

¿Cómo reacciona LAION a una solicitud de eliminación de fotógrafos?

LAION responde a las solicitudes de eliminación de fotógrafos a menudo con un recibo de abogado y una demanda de daños y perjuicios, ya que el almacenamiento y análisis temporal de imágenes se considera permisible y no existe una violación inmediata del derecho de autor.

¿Por qué es recomendable el uso de datos de acceso público en aplicaciones de IA?

El uso de datos de acceso público minimiza los riesgos legales, ya que están disponibles libremente y no contienen datos personales. Es importante evitar los datos de los usuarios, ya que podrían contener información sensible.

Inteligencia artificial: fundamentos técnicos y legales

¿Cómo funciona la Inteligencia Artificial (IA) y por qué es ahora revolucionaria y mundialmente importante? ¿Cuáles son las condiciones legales para el procesamiento de grandes cantidades de datos para entrenar un cerebro electrónico? Y cómo está la almacenación de entradas del usuario y la salida de imágenes y textos? Extracto de uno de mis conferencias.

Introducción

Quienes poco entienden de Inteligencia Artificial, suelen utilizar términos como ChatGPT como lugar común para parecer interesantes. Muchas personas creen que ChatGPT es una búsqueda en línea. Spoiler: Eso es completamente absurdo. ChatGPT tiene un conjunto de datos de hace mucho tiempo según los estándares actuales. Eso es intención y voluntad. Porque ChatGPT sirve como máquina de respuesta y no para encontrar conocimiento actualizado.

Quien entiende más de Inteligencia Artificial y tenía el mercado de acciones en su mirada, se compró acciones de Nvidia hace un tiempo y desde entonces ha podido observar una gigantesca subida en sus cotizaciones. Pues Nvidia es fabricante de tarjetas gráficas que son los reyes del mercado cuando se trata de aplicaciones de Inteligencia Artificial.

Predigo el derrumbe del mercado de acciones en su forma actual porque pronto cualquier predicción sobre cotizaciones bursátiles podrá acertar con una probabilidad superior al 50%.
Mi teoría junto con la suposición de que esto mismo me sucederá pronto.

¿En qué consiste esto? Sencillamente: Una tarjeta gráfica como la Nvidia Geforce RTX 3070 tiene 5888 núcleos en su GPU. La GPU es el procesador de la tarjeta gráfica. A diferencia de eso, está la CPU, el clásico procesador de un ordenador. Los buenos procesadores Intel actuales tienen 10 o unos cuantos más núcleos.

Un núcleo Intel es matemáticamente algo así como un Albert Einstein (que podía hacer cuentas muy bien como físico). Un núcleo de GPU Nvidia es un matemático moderadamente dotado. Los algoritmos de inteligencia artificial se basan casualmente en operaciones aritméticas que se ejecutan especialmente bien en procesadores de tarjetas gráficas (GPUs). Mientras el Albert Einstein-Kern realiza una multiplicación con facilidad y se aburre la mitad del tiempo, el matemático de GPU está muy ocupado pero termina casi tan rápido con esta operación aritmética sencilla.

Desafortunadamente necesitan 5888 matemáticos trabajando en paralelo para realizar, digamos, 100.000 multiplicaciones simples menos tiempo que 10 Einsteins enfadados al mismo tiempo. Mientras el PC equipado con una tarjeta gráfica ya ha terminado de calcular la K, se cree que el PC impulsado solo por Intel habría quedado atascado. Se puede esperar un aumento de rendimiento de un factor de 50 o más en la tarjeta gráfica. La tarjeta gráfica no se utiliza para mostrar imágenes o videos ni jugar, sino solo para calcular. Eso es lo que se escucha al ruido del ventilador de la tarjeta, que puede eclipsar cualquier ventilador de PC.

Mientras en Villariba todavía la CPU está caliente y solo se ha descargado el 20 por ciento de los productos, todo brilla en Villabaj.
Por favor, perdonen el comparativo tonto con estos dos pueblos ficticios, que podrían ser conocidos por la publicidad y sobre los cuales se sabe más que sobre algoritmos de inteligencia artificial actuales.

La tarjeta gráfica ya hace una gran diferencia en algoritmos que se entrenan durante 10 días seguidos para tareas más complejas, o que necesitan 10 segundos en una GPU para generar una imagen, mientras que en una CPU convencional tarda 8 minutos. Seguro que ya habrán escuchado hablar de DALL-E o Midjourney y saben que no tienen que esperar 10 minutos por una imagen.

Funcionamiento de una inteligencia artificial actual

El sistema de Inteligencia Artificial como ChatGPT se basa en redes neuronales artificiales. Una red neuronal también se encuentra en la cabeza o cerebro humano. Funciona aproximadamente así:

Grobe Funktionsweise menschlicher Intelligenz.

Se muestra la forma en que las personas procesan información y cómo surge la inteligencia. Casi exactamente lo mismo de lo que se puede ver, entendemos por qué hay inteligencia en absoluto. Sostengo que no sabemos nada al respecto, sino que nos maravillamos de por qué los neuronas con sus conexiones son capaces de hacer surgir algo como la inteligencia. Spoiler: No tiene nada que ver con Dios, como pronto mostraré.

En la imagen anterior se ven a la izquierda una serie de influencias ambientales, es decir, señales. Pueden ser ruidos, tonos, imágenes estáticas, imágenes en movimiento, olores, movimientos de aire, etc. Las murciélagos conocen muy bien el ultrasonido. En el centro se encuentra nuestro cerebro, que recibe y procesa todas estas señales. A la derecha se ve la red neuronal, donde las señales son procesadas y almacenadas.

Un Neurona es comparable con un simple núcleo de procesamiento. Entre las neuronas existen conexiones, y en total son muy muchas. Son muchas billones. Si un neurona dispara, o está activa, se determina por el potencial de acción que se genera desde otras neuronas conectadas hacia una neurona objetivo.

Ahora llegamos a la realización técnica de los algoritmos de IA actuales.

Grundaufbau eines modernen KI-Algorithmus.

Enlaces en la imagen ven lo mismo que arriba con el hombre.

En el centro ven ustedes el cerebro electrónico, más arriba estaba el humano.

A la derecha de la imagen se ve el red neuronal en forma digital, que en el ser humano existe de manera biológica y por tanto es más análoga.

Así que hasta ahora todo igual. Pero aún más igual. Los cerebros electrónicos convierten gracias al enfoque del Transformer (conocido desde el año 2017) todas las señales en series de números, vectores llamados. Exactamente lo mismo hace el cerebro humano. Al menos es cualitativamente lo mismo. Que haya diferencias sutiles entre la implementación general de biología y electrónica es prácticamente igual y solo sirve para mejorar ligeramente la eficiencia de la biología con respecto a la electrónica. Seguro que conocen el Ley de Moore: Cada 12 a 24 meses se duplica la capacidad de cálculo de un procesador, a menudo al mismo tiempo que disminuye su precio. Por lo tanto, el ganador en términos de eficiencia es la máquina, y desde ahora (aproximadamente año 2023).

La inteligencia artificial es revolucionaria

Estos vectores, es decir, series de números que representan imágenes, textos o videos u otros elementos, pueden ahora compararse entre sí. Ahora se pueden comparar textos con textos, imágenes con imágenes, videos con videos, textos con imágenes, imágenes con videos, textos y señales de audio con imágenes o videos, etc. Ahora saben cómo funcionan generadores de imágenes como Dall-E o Midjourney. Ahora saben que con Más rápidamente y de la manera más sencilla posible (más rápidamente y más fácilmente) se pueden programar aplicaciones hasta ahora exclusivas como SoundHound, que pueden identificar canciones en pocos segundos.

He demostrado yo mismo que se puede programar aplicaciones geniales de la manera más rápida y sencilla posible:

Transcripción de audio de mi podcast: Audio a texto, en una calidad inimaginablemente buena. Para 30 minutos de habla sale automáticamente un transcripción generada por inteligencia artificial, en la que quizás tenga que corregir manualmente cinco palabras. Partes de oración y palabras desconocidas como "todo el mundo", "Hömmele" (sí, así se llama!) o "Megafail de Microsoft, que tenían un herramienta de IA de Twitter" son reconocidas sin esfuerzo.
La generación de video a partir de una entrada de imagen y audio: Mi foto bidimensional en muy mala calidad más la voz de un presidente americano como única entrada me dan mi cabeza animada tridimensional y mi boca que se mueve sincronizada con la voz como animación de video.
Image generator: Conocido en otras aplicaciones. Pero hace una diferencia, si el técnico sabe que se está calculando algo en la nube de Microsoft, Dall-E o cualquier otro lugar, o en un sistema local. Las diferencias son: Localmente no pago nada. En la nube puedo perder 100.000 euros por error en un mes (ejemplo: llamada recursiva infinita no deseada). Localmente tengo el control total sobre todos los datos. En Microsoft y Google, incluso rezar no ayuda, sino más bien un calmante o alcohol puro para olvidar o liberarse de las preocupaciones con los "monstruos de datos" por un tiempo.
Objeto reconocimiento: ¿Qué objetos se pueden identificar en una imagen? ¿Cuáles son los contornos de cada objeto individual? ¿Cómo se llama el objeto? ¿Qué tal si marcas todas las tazas de té en la imagen o busca imágenes en las que dos o más personas discutan y estén sentadas en sillas en un despacho? ¿O reemplaza la cara en la imagen con la de Norman Reedus, mi doble, dicen muchos…).
Búsqueda semántica: En lugar de buscar por términos o instrucciones SQL enigmáticas, ahora se busca sobre oraciones en lenguaje natural o se comparan documentos enteros entre sí.

He calculado hace poco unos cuantos miles de imágenes en mi computadora. Aquí está el resultado en forma de mosaico (cada piedra del mosaico es en realidad una imagen con una resolución de 512 x 512 píxeles):

Aus ca. 400 Bildern generiertes Mosaik. Jedes Bild wurde auf meiner lokalen Hardware von einer KI generiert. Das Gesamtbild wurde für die schnellere Ladezeit verkleinert.

Las imágenes individuales del mosaico surgieron de un cálculo de Inteligencia Artificial. Se mezclaron las imágenes de dos artistas que conozco. La Diversidad de variaciones no es aún óptima aquí, porque fueron primeros intentos. Va a ir mucho mejor, como descubrí al día siguiente. Lo que en el mercado de la Inteligencia Artificial es una eternidad y media, es para algunas autoridades de protección de datos un período de tiempo que no conocen (¿Qué es un día? Algunas autoridades solo conocen los términos temporales "año", "siglo" y "nunca")?

Sistemas Locales como solución

Como se ha mostrado anteriormente, muchas cálculos exigentes pueden realizarse en propios ordenadores. Por favor, no corran de nuevo a Microsoft, AWS o Google solo porque alguien quiere jugar al Bingo con basura y esparce términos ingleses y marcas para ocultar la ignorancia.

Quien ahora todavía contrata un servicio en la nube por cada pequeño problema, es un pobre diablo y tiene menos idea de inteligencia artificial que de protección de datos e aplicaciones de Internet. No sería malo no saberlo todo, pero los falsos asesores son malos.

Una inteligencia artificial no es adecuada para declaraciones precisas. Es tan fiable como un hombre de una inteligencia sobresaliente.

Algunos problemas son tan complejos que no pueden ejecutarse en hardware estándar. Por ejemplo, la versión 4 de ChatGPT. Este sistema ni siquiera existe como código abierto, por lo que nadie puede tentarlo a hacerlo todo correctamente.

Algunos son entonces lo suficientemente razonables y no vierten sus Secretos comerciales en un chatbot de Microsoft o Google. Con quien haga eso, personalmente no quiero tener nada que ver.

Como un ejemplo particularmente plastico de gasto computacional sea BloombergGPT nombrado. Es es un Large Language Model (LLM) del emisor financiero Bloomberg. Es tan poderoso que requirió 1,3 millones de horas de cálculo hasta que el modelo estuvo listo para ser calculado. Un modelo es un cerebro electrónico.

El cerebro de Bloomberg estaba ya listo después de 148 años de tiempo de cálculo solo porque se utilizaron 512 tarjetas gráficas de alta capacidad cada una con 40 GB de memoria gráfica (NO: memoria principal del ordenador). Cada una de estas 512 tarjetas gráficas cuesta aproximadamente 14.000 euros. Quien quiera aumentar la RAM de su PC de 16 a 32 GB lo pagará de su bolsillo. Quien quiera aumentar el almacenamiento de una tarjeta gráfica de 8 a 16 GB pagará un pequeño patrimonio (ligeramente exagerado).

Consideraciones legales

Me limito a algunos puntos clave que he extraído de las declaraciones del abogado Jonas Breyer. No es casualidad que su apellido le sea conocido (palabra clave: "las direcciones IP son datos personales").

Derechos de autor

Mal para nosotros todos, cuando se trata de la inteligencia artificial. Hay peligro de que Europa sea campeón del mundo en regulaciones. Luego, en algunos campos (procesamiento de imágenes?), pocos negocios europeos podrán tener éxito con la IA. En su lugar, compraremos a los amigos americanos, quienes hacen lo que quieren sin ser castigados (ni pueden serlo).

Ein Anwalt für Urheberrecht auf der Jagd nach Beute. Der Prompt für dieses KI-Bild wurde ebenfalls automatisiert erzeugt. So können zigtausende Bilder selbst in hoher Auflösung auf einem lokalen Computer erzeugt werden.

La premisa más importante: lo que como ser humano puedo hacer y no hacer, una inteligencia artificial puede hacerlo igual o menos.

Dibujar una imagen desde la cabeza es tan permitido para un ser humano como para una inteligencia artificial. Si el resultado tiene demasiada semejanza con una obra protegida por derechos de autor, no está permitido. Así están protegidos todos los trabajos que tienen un nivel mínimo de creación. Son casi todos los dibujos o fotos en las que se ve algo más que un cuadrado o círculo.

Por cierto, según § 44b UrhG, está permitido almacenar obras de otros durante un breve período para analizarlas según patrones. Eso es lo que hace la Inteligencia Artificial normalmente.

El caso LAION

Aquí llegamos al caso de LAION e.V., una asociación alemana, que fue demandada por un fotógrafo alemán. LAION ha reunido más de 5 mil millones de imágenes en un conjunto de entrenamiento para aplicaciones de visión artificial y lo ha hecho público. El conjunto de datos contiene solo los enlaces a las imágenes originales públicamente accesibles.

El conjunto de datos LAION 5B es muy popular a nivel mundial y la base para cada segundo generador de imágenes que vale la pena.
Mi propia observación después de investigar varios algoritmos de Stable Diffusion.

LAION había descargado y utilizado estas imágenes una vez para calcular un cerebro electrónico. Después de eso, según sus propias declaraciones, LAION eliminó las imágenes. Con el cerebro se pueden calcular imágenes como la anterior o la siguiente.

Daryl Dixon im Origami-Stil, von einer KI auf meinem lokalen System generiert.

Un fotógrafo ha encontrado ahora en el conjunto de datos LAIOn algunas de sus fotos. Como dije, solo las referencias y no los originales. El fotógrafo pidió a LAION que eliminara su material de los datos de entrenamiento. Lo que exactamente se quiere decir con eso, aún no lo he podido averiguar. Quizás al fotógrafo le preocupa que las conclusiones obtenidas a partir de sus fotos sean borradas del cerebro electrónico.

Aquí la base de datos de imágenes LAION como esquema y con las observaciones originales (extracto):

Das Bild links unten stammt von https://www.outdoorphotographer.com/images/gallery/full/131/417131.jpg (Bild und Domäne seit dem 30.07.2023 nicht mehr aufrufbar). Das Bild rechts unten ist daraus generiert worden und neuartig.

La cuestión ahora es si LAION debe borrar las conclusiones de imágenes almacenadas y analizadas brevemente o no. LAION significa "no" y le envió al fotógrafo una factura de abogado con una demanda de perjuicios por valor de aproximadamente 850 euros en respuesta a su solicitud de eliminación.

Derecho a la protección de datos

Los datos personales están protegidos por la RGPD. Las aplicaciones de IA siempre implican un procesamiento automático. Por lo tanto, siempre están sujetas a la RGPD cuando hay datos personales en juego.

Las personas pueden ser objeto no solo de textos sino también de imágenes. Creo que la información pública puede disfrutar de un sólo leve o ningún derecho a la privacidad importante. Las afirmaciones falsas generadas por una IA tienen relación con la privacidad al principio. El derecho de autor es algo diferente a la privacidad.

Entonces veo la protección de datos como problema subordinado, cuando se trata de aplicaciones de Inteligencia Artificial. Tiene aquí su muy buena justificación y no impide, sino que protege. De otra manera lo veo más bien en el derecho del autor o en el derecho de marca.

Otros preceptos legales

El derecho de marca protege explícitamente (artículo 3 del Reglamento de Marcas) y las marcas implícitamente protegidas (artículo 4, número 2 del Reglamento de Marcas, etc.).

Hay junto a marcas de palabras y imágenes también marcas de olores, sonidos, formas y probablemente algunas más.

La patente, el modelo de utilidad y algunos diseños están igualmente protegidos. Incluso una forma de botella puede estar protegida.

El Acto de Datos todavía solo está en el borrador de la Comisión. Obliga a las grandes empresas a proporcionar sus datos si alguien los solicita. Esto suena extraño y es así.

También hay un proyecto de comisión para una regulación de la Inteligencia Artificial. En cuestión está si se debería dar la vuelta a la carga de la prueba cuando alguien utiliza un trabajo generado por inteligencia artificial. ¿Se creó este trabajo de manera legal? Para demostrar esto, por ejemplo, en un generador de imágenes, habría que guardar el estado del sistema de IA como respaldo para poder demostrarlo más tarde. Esto impide la IA y no la permite.

La regulación protege a las grandes empresas que pueden permitirse abogados y personal para procesos complejos. Las pequeñas empresas son así reprimidas.

Mejor que la regulación, que considero prácticamente imposible, encuentro la disuasión y la sancionamiento. Dos palabras desconocidas para las autoridades de protección de datos como la hessiana (y algunos tribunales de allí) . ¿Dónde se estacionan menos coches mal? Allí donde incluso en la calle de los cabarets se castiga con 800 euros el aparcamiento incorrecto (pero nunca se recibe un ticket) o allí donde uno de cada cinco que aparcan mal es denunciado?

Recomendaciones

Utilicen sistemas de Inteligencia Artificial locales. El mundo puede ser tan simple como eso. Ya no más problemas con Google y Microsoft. ¿Qué era ese Privacy Shield? ¿Lo hay todavía? No, ya no existe. Estados Unidos están fuera.

No confundan los chatbots con búsquedas de motores. Sin embargo, se puede encontrar cualquier documento o imagen mejor que antes mediante una búsqueda semántica, sin ChatGPT en absoluto. Sin OpenAI ni Microsoft en absoluto.

Verifique los datos de práctica: Solo con datos propios o seleccionados a mano se evitan problemas legales. Difícil, porque la inteligencia artificial se basa en grandes cantidades de datos. Por suerte hay salidas. Lo mejor es que (normalmente) solo se utilicen datos públicamente accesibles si no son los propios.

Entradas del usuario no deben ser almacenadas sin motivo. Pueden contener datos personales. El motivo debe, si se almacena, elegirse y legitimarse muy cuidadosamente. Por cierto, ChatGPT fue prohibido en Italia por un breve período por esa razón.

Gastos, que genera una IA, varían según la forma en que se manejan. Las salidas de texto no son trabajos científicos. Mire el caso del abogado neoyorquino, quien se dejó engañar por ChatGPT con 12 sentencias que nunca existieron. Tonto si luego presenta estos resultados ante un tribunal y actúa como si fuera la verdad.

El discurso al que me refiero lo pronuncié en un congreso de protección de datos en la Deutsche Flugsicherung a finales de mayo de 2023.

Mensajes clave

Las tarjetas gráficas (GPUs) son mucho mejores que los procesadores tradicionales (CPUs) para realizar los cálculos complejos que necesita la inteligencia artificial.

Las inteligencias artificiales actuales funcionan de manera similar al cerebro humano, procesando información a través de redes neuronales artificiales que convierten las señales en números.

La inteligencia artificial está avanzando rápidamente y permite hacer cosas increíbles, como generar imágenes, transcribir audio y buscar información de forma más natural.

Es mejor realizar cálculos complejos de inteligencia artificial en tu propio ordenador que depender de servicios en la nube.

La inteligencia artificial puede aprender de imágenes existentes, pero hay debate sobre si esto infringe los derechos de autor cuando se usan para crear nuevas imágenes.

Para evitar problemas legales con IA, es mejor usar sistemas locales en vez de depender de grandes empresas como Google o Microsoft.

Es importante usar datos confiables y públicos al entrenar modelos de inteligencia artificial, y ser conscientes de los riesgos de usar salidas de IA como información definitiva.

Acerca de