La IA ofrece enormes oportunidades y, al mismo tiempo, alberga riesgos considerables. Por ambas razones, la IA asusta a mucha gente. Por eso argumentan que la IA sólo se basa en estadísticas y no tiene nada que ver con la inteligencia humana. Lo que olvidan es que toda nuestra existencia se basa en estadísticas.
El factor estadístico de nuestra existencia
Se lee a menudo sobre modelos de lenguaje que estos LLMs solo se basan en encontrar el siguiente palabra probable generado y emitirlo, y luego hacer esto palabra por palabra. Y así sale lo que otros consideran un texto inteligentemente creado. En lugar de palabras, se procesan llamados tokens. Simplificando, los tokens son algo como partes de palabras o sílabas. Los tokens se utilizan para lograr una compresión y también para poder capturar semánticamente palabras más largas o compuestas mejor.
El Responsable de protección de datos de Hamburgo utiliza este argumento para decir que no es competente en cuanto a la inteligencia artificial, ya que esta no procesa datos personales. A uno le viene muy poco bien. Carece de cualquier base, como se puede demostrar. La siguiente afirmación podría ser suficiente como contraargumento:
Los modelos lingüísticos predicen cuál será la siguiente palabra. Eso no es inteligente.
Modelos lingüísticos dicen que la palabra probablemente siguiente apropiada para el contexto dado predice. Eso es inteligente.
Mucha gente no presta atención a la parte en negrita: no suele mencionarse.
Gramática alemana
El hombre también puede ser llamado como un supuesto Token-Papagayo. El término provino de alguien con quien el autor habló sobre detalles técnicos de la Inteligencia Artificial. Ese alguien dijo que los modelos lingüísticos son solo papagayos de token. Repiten lo que se les enseñó una vez en datos de entrenamiento.
¿Por qué el hombre también es un papagayo de token? Cuando hablamos de la gramática alemana, vemos como hablantes nativos que esta se basa en probabilidades. Aprendemos cuáles son las palabras y conceptos que se ajustan con otros palabras y conceptos. Para ello aprendemos probabilidades. Sin embargo, nuestro cerebro esconde el principio del aprendizaje de la lengua tan bien que no nos damos cuenta de que el principio fundamental de la gramática es muy simple. Fue solo desde el surgimiento del enfoque Transformer en 2017, que es una base muy importante para la inteligencia artificial actual, cuando se hizo posible que incluso un informático ingenuo pueda entenderlo si quiere.
Podemos esperar hasta el día santo de nunca jamás …
Es gramaticalmente correcto, pero ¿lo diría así un hablante nativo?
Si un extranjero altera una frase hecha debido a la falta de conocimiento (o memoria deficiente) y la reproduce en otra forma, pero gramaticalmente correcta, reconocemos a la persona como extranjera. Porque hemos percibido la distribución de probabilidad divergente.
Desintegración radiactiva
Empecemos con una cita de Wikipedia que probablemente diría cualquier físico:
El tiempo de desintegración de cada núcleo atómico individual es aleatorio.
Fuente: Wikipedia
Significa: Si observa un partícula, no sabe cuánto tiempo existe. Otra forma de decirlo es que no puede saber cuánto tiempo existe. No puede saberlo porque el conocimiento sería una violación del reconocido marco físico del mundo. El conocimiento no es posible. Si está interesado en más, le recomiendo libros populiscientíficos como los de Werner Heisenberg o Albert Einstein.
¿Cuánto tarda una sustancia radiactiva como el uranio en dejar de irradiar? En general, no se puede responder a esta pregunta cuando se observa una partícula de uranio. Para los abogados: Esta pregunta no puede responderse, ni siquiera "en principio". Una vez más: la pregunta de cuándo deja de ser radiactiva una sustancia radiactiva no puede responderse mirando una partícula.
La Vida media es el tiempo que tarda en reducirse a la mitad la radiación radioactiva de un material (núcleo radioactivo). ¿Cómo se calcula esta cifra? En cualquier caso, se aplica: "El momento de transformación de un solo núcleo atómico no puede predecirse…" (Vida media/Wikipedia). La vida media se determina como "promedio estadístico" (la misma fuente).
Descomposición radiactiva es un proceso aleatorio que se basa en estadística.
Física cuántica
La física cuántica se hizo conocida con la descubierta de Albert Einstein en el año 1905. Él descubrió que la luz no es entendible como un haz continuo, sino en forma de paquetes diminutos, los cuantos. Esto no es una conferencia de física. Para no enfadar a demasiados físicos, se menciona aún que existe el dualismo onda-partícula, que se encuentra en la luz. Esto conduce al llamado experimento del doble surco, que es probablemente la mejor prueba de nuestra incapacidad para comprender verdaderamente nuestra propia existencia.
Por ejemplo, los láseres se basan en los descubrimientos de la física cuántica. Incluso el GPS, la base del sistema de navegación de tu coche o de tu smartphone, no existiría sin la física cuántica. El GPS, a su vez, se basa en relojes atómicos de gran precisión, que sólo existen porque podemos entender su principio con la física cuántica.

El efecto de túnel del almacenamiento flash también se basa en la física cuántica. En resumen: sin física cuántica, este artículo aquí no sería escrito en un ordenador, ni llegaría a usted por Internet en una SSD-placa base, ni tendría usted mismo un (computadora paga o rápida) computadora. Ni hablar de un teléfono inteligente.
En la física cuántica hay acontecimientos aleatorios que son en principio impredecibles – incluso cuando se conoce toda la información disponible sobre un sistema cuántico.
Fuente: Caída cuantizada, letra impresa agregada. Otras fuentes: Werner Heisenberg, Albert Einstein etc.
Incluso se llega a tal extremo que no puede haber un vacío perfecto . Porque eso violaría la relación de incertidumbre de Heisenberg. ([1])
Si quiere saber más: Werner Heisenberg, Niels Bohr, Richard Feynmann y Albert Einstein han escrito libros comprensibles sobre el tema, a los que otros tienen poco que añadir.
Inteligencia basada en una red neuronal
Por supuesto, la inteligencia puede ser representada de cualquier manera adecuada. Pero una red neuronal se ha revelado particularmente efectiva. Se utiliza tanto en su cerebro como en el cerebro artificial de AI.
Las redes neuronales sólo procesan números, nada más.

En su cerebro, todas las señales llegan en forma de valores analógicos que se manifiestan como corriente y voltaje. Potenciales de acción en neuronas transmiten los señales eléctricas (procesamiento invisible).

En algún momento se produce la "salida". Tu boca se mueve porque los músculos correspondientes han recibido la orden numérica del cerebro a través de la médula espinal. Los números son corrientes y tensiones.
Las señales analógicas pueden convertirse en digitales. Se pierde algo de precisión en el proceso porque las señales analógicas son continuas y las digitales son discretas. Continuo significa, por ejemplo, que hay cualquier número de números entre 0 y 1. Discreto significa que sólo hay un número limitado de números entre 0 y 1. Cuántos números son éstos en el sistema digital depende de la precisión utilizada. Es fácil ver que no es importante si hay un número infinito de números entre 0 y 1 o "sólo" 100.000 billones de números. La pérdida de precisión al pasar de señales analógicas a digitales es insignificante. Por tanto, los sistemas analógicos y digitales pueden considerarse equivalentes en este sentido, como demuestran los actuales sistemas de IA, que a menudo son muy superiores a los humanos (con la excepción de usted, claro).
Todo es un número
Los modelos lingüísticos se basan en tokens. Los tokens se convierten en números. Para ello se utiliza un diccionario. Es tan simple que no hay nada que decir al respecto. Aquí está un extracto del diccionario público de GPT-2:

La extraña "G" delante de algunas fichas es un indicador de que la ficha correspondiente debe formar el principio de una palabra. Todas las fichas sin este indicador no deben estar al principio de una palabra. El diccionario GPT-2 tiene 52.000 entradas.
Todos los modelos lingüísticos de código abierto disponen de un diccionario de este tipo, que puede descargar y visualizar como archivo de texto.
¿Cómo está en Fotos? Conocen Dall-E o Midjourney. El procedimiento es el siguiente:
- Tu texto (pregunta) se convierte en números y se introduce en el modelo de IA de DALL-E.
- DALL-E procesa estos números mediante una red neuronal que sólo calcula con números.
- El resultado final es un número. Estos números se interpretan como píxeles.
Un punto de imagen se llama Píxel. Al tener un canal de color RGB y una profundidad de color de 24 bits, un pixel tiene 3 bytes: 1 byte para rojo, 1 byte para verde y 1 byte para azul. Cada byte puede tomar valores entre 0 y 255. Un pixel se compone de tres números.
¿Y el habla, es decir, las señales de audio? Un archivo MP3, o tu voz grabada, se compone de vibraciones ("forma de onda"). Tu cerebro (probablemente) procesa dos canales: Un canal es el del oído izquierdo, otro el del oído derecho. En el cine en casa se conoce como 5.1 o similar. El 5 representa los 4 altavoces de las esquinas y el altavoz central. El 1 representa el altavoz de graves. Por tanto, las señales de audio se pueden convertir en números, como muestra tu equipo estéreo o tu teléfono móvil.
Todos los otros señales también pueden convertirse en números. Al termómetro es la temperatura como valor numérico, al sensor de terremotos es la intensidad del terremoto (aproximadamente en la escala de Richter). Otros signales ya son digitales. Tomando como ejemplo una hoja de cálculo de Excel que contiene cifras de ventas.
Todas las señales pueden convertirse en números.
Las órdenes de control, por su parte, pueden ejecutarse enviando números a los actuadores.
Un actuador, como tu boca o tu mano, se controla enviando números al actuador. Y ya está. ¿Dónde está el ingrediente secreto aquí? Ninguno. El hecho de que también intervengan procesos químicos es un detalle que aparentemente no es necesario y se debe a la naturaleza de los sistemas biológicos. Si lo ves de otra manera, sería bueno que aportaras algunos argumentos.
Opiniones sobre estadísticas
Las opiniones no son pruebas reales. Sólo deben exponerse aquí para que nadie piense que el autor está solo con su opinión.
Opiniones de los demás
De un conversación de 30 minutos con un empleado de DEEPL en noviembre de 2024 se desprende: El empleado es informático y entiende la función técnica de los modelos de lenguaje. Su enfoque profesional es la lingüística, lo que no es sorprendente para DEEPL. Estima al autor que la estadística también es base de la inteligencia humana. También ve que los robots se vuelven cada vez más poderosos. Que no todos los informáticos tienen estas percepciones se demuestra en el ejemplo anterior con el papagayo del token (el término proviene de otro informático, quien aún no ha encontrado el borde de la taza).
Prof. Dr. Maximilian Wanderwitz es profesor de derecho económico y del derecho de la tecnología de la información. Publica mucho sobre el tema de la Inteligencia Artificial. Después de su conferencia el 26 de noviembre de 2024 en Mainz, se le preguntó al autor por su opinión. El profesor Wanderwitz confirmó que su postura es también la de que la estadística es un elemento importante de la inteligencia humana y que lo ve como analogía a la Inteligencia Artificial.
Un empleado de T-Systems, que en su empresa es responsable de los sistemas digitales, confirmó esto el 26.11.2024 también: Él ve estadísticas como elemento de la inteligencia humana igual que en la Inteligencia Artificial.
Sam Altmann, cofundador de OpenAI ve la potencia de la IA tan grande que la IA superará a los humanos en mucho. "Mucho" significa aquí "inimaginablemente". Superar la inteligencia con algo más que con la inteligencia parece difícil de imaginar.
Definición de inteligencia (artificial)
El autor propone (desde ya el 03.04.2024) la siguiente definición de Inteligencia Artificial:
Se denomina Inteligencia Artificial a un sistema artificial que intenta, resolver un problema incluso con una definición vaga de manera no específicamente prevista, orientada hacia la solución y combina el conocimiento existente con nuevo conocimiento y deduce conclusiones.
Definición del término inteligencia artificial. Fuente: Klaus Meffert, dr-dsgvo.de
Usted mismo puede decidir qué es un sistema artificial. No es importante. Los 27 Estados miembros de la UE lo ven de forma diferente por término medio. Esta media se llama proceso democrático. La UE considera que una máquina es un requisito previo para la IA. Esta restricción es innecesaria y arrogante. También se ha demostrado que el diésel puede ser respetuoso con el medio ambiente. Excluir esto de antemano era innecesario y erróneo.
Entonces, ¿qué es la inteligencia? Lo mismo, salvo que la inteligencia no es (necesariamente) artificial. Esto nos da la siguiente definición:
Como Inteligencia se denomina un Sistema que intentar, resolver un Problema incluso con una definición imprecisa de manera no prevista, orientada a la solución y que combina el conocimiento existente con nuevo Conocimiento y deducciones.
Definición del término inteligencia. Fuente: Klaus Meffert, dr-dsgvo.de
La definición de inteligencia es idéntica a la definición de IA, con la excepción del adjetivo "artificial".
Su opinión
¿Cree que la IA "sólo" se basa en la estadística y que, por tanto, no es un sistema inteligente? Entonces estaría bien saber en qué principio, si no en la estadística, se basa la inteligencia humana. Tu definición de IA o inteligencia será tenida en cuenta con mucho gusto si tienes una diferente a la mencionada anteriormente y la encuentras mejor. Además, sería bueno saber dónde está el argumento cuando alguien dice: "La IA se basa en la estadística". Correcto, pero ¿dónde está el argumento?
Conclusión
La estadística es la base de nuestra existencia. La mejor teoría que tenemos es probablemente la teoría cuántica. Describe nuestra realidad de forma extremadamente precisa. Cualquiera que dude de la física cuántica está negando su propia existencia.
¿Porque lo sencillo es (demasiado) sencillo?
La razón principal es la suposición de algunos de que la estadística como mecanismo es demasiado simple para producir inteligencia.
Porque lo simple es simplemente simple. Tenemos que dejar de suponer que mecanismos increíbles como lo que llamamos inteligencia deben basarse en principios complicados. El hecho de que un sistema no sea lo suficientemente complicado no es un argumento para afirmar que este sistema no pueda ser eficiente.
La inteligencia es en su naturaleza muy simple. Se basa (típicamente) en una red neuronal que procesa números y aprende a partir de ejemplos. Los ejemplos son pares de ser (entrada) y debería ser (salida), o también solo "ser" pares (por ejemplo, textos alemanes), que se consideran correctos.
Es cierto que la lengua alemana (y muchas otras lenguas de todo el mundo) se basa en la estadística. El hecho es que el texto puede convertirse en números. Lo mismo ocurre con las imágenes, el habla y otros valores de los sensores. Las redes neuronales sólo calculan con números. En tu cerebro no hay texto, sonido ni imagen, sólo números.
Es es correcto que aprendamos (también ustedes) la lengua y gramática alemanas a través de ejemplos, al igual que la Inteligencia Artificial. Para ello se utiliza un mecanismo llamado Atención. En la IA se llama "Attention". Sin embargo, también es posible hacerlo sin atención, como muestran los últimos enfoques técnicos. No importa cómo surja la inteligencia, ya que, como siempre, no hay más de una forma de lograr un objetivo.
La forma en que se alcanza un objetivo o la inteligencia es completamente irrelevante (cuando se considera durante periodos de tiempo más largos).
Sin embargo, algunos enfoques son más eficaces que otros.
Los sistemas de IA suelen (aún) aprender a partir de datos suministrados por humanos. Una fuente importante es Internet. Sin embargo, los robots aprenden como los humanos si llevan consigo un cerebro de IA. Pueden aprender de ejemplos de su entorno. Estos robots ya existen. No es teoría, es realidad. Los robots domésticos y otros ayudantes robóticos de la vida cotidiana pronto estarán disponibles por varios miles de euros.
El pensamiento de que la Inteligencia Artificial es algo cualitativamente diferente a la inteligencia en el ser humano, conduce lejos de la realidad. Incluso si la AI fuera una muy buena simulación de la inteligencia: ¿Qué diferencia hace eso?
Utilicen AI como un empleado eficiente en su empresa. Los casos de aplicación son variados! La AI funciona mejor para casos de aplicación concretos.
Actualización: modelo lingüístico europeo Teuken
Difícil de creer, pero cierto. El modelo lingüístico europeo llamado Teuken acaba de publicarse (26/11/2024).
Primeros tests son muy prometedores. En un ejemplo práctico se muestra lo que Teuken puede hacer. Para ello se introdujo el primer parte de este artículo en Teuken-LLM y debería resumirse. La tarea era una resumen en 3 oraciones. Aquí está el resultado:
Teorema 1: Los modelos lingüísticos como GPT-3 se basan en determinar y pronunciar la palabra más probable para la palabra generada previamente.Teorema 2: Las fichas son una forma de representar palabras u oraciones más largas de forma más comprimida. También pueden representar información semánticamente más compleja.Teorema 3: El argumento de que la IA no procesa datos personales es erróneo y muestra un problema fundamental de comprensión de la IA.Teorema 4: Los humanos pueden ser llamados "loros de fichas" porque demuestran la repetición de lo que se les ha enseñado en los datos de entrenamiento.Teorema 5: La gramática alemana se basa en probabilidades. Esto es intuitivo para los humanos y se utiliza inconscientemente al aprender el idioma.Frase 6: El enfoque del transformador fue un gran avance en la IA, permitiendo incluso a los no expertos entender los fundamentos del procesamiento del lenguaje.El texto explica varios aspectos del modelo de lenguaje GPT-3 y de la gramática alemana.Eso fueron 6 frases. Quiero un resumen en 3 frasesVerdad, aquí está la versión resumida:1. Los modelos de lenguaje como el GPT-3 utilizan tokens en lugar de palabras.2 .A los humanos se les puede llamar "loros de tokens" porque demuestran la repetición de lo que se les ha enseñado en los datos de entrenamiento.3 .Al principio, Teuken entregó 6 series en lugar de 3. Pero estas 6 frases eran muy buenas. Entonces también se cumplió la petición a Teuken de que por favor entregara un resumen en 3 frases. El resultado es impresionante, aunque haya un pequeño error ortográfico.
Lo que llama la atención: Teuken coloca "Frase 1", "Frase 2", etc. delante de las frases generadas. Según las observaciones del autor, otros modelos de IA no han hecho esto hasta ahora.
Se utilizó Teuken-7B-instruct-commercial-v0.4 de openGPT-X. De ahí la información sobre la licencia:
Lizenzangabe (Teuken comercial):
Copyright 2024 openGPT-X
Licensed under the Apache License, Version 2.0 (the "License"); you may not use this file except in compliance with the License. You may obtain a copy of the License at
http://www.apache.org/licenses/LICENSE-2.0
Unless required by applicable law or agreed to in writing, software distributed under the License is distributed on an "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. See the License for the specific language governing permissions and limitations under the License.
Mensajes clave de este artículo
Los modelos lingüísticos no trabajan simplemente palabra por palabra, sino con los llamados tokens. Son como unidades más pequeñas de palabras o sílabas.
Los humanos también pueden describirse como loros de fichas porque, al igual que la IA, aprendemos y aplicamos reglas del lenguaje basadas en la probabilidad.
La desintegración radiactiva es un proceso aleatorio en el que la semivida se calcula como un valor medio estadístico. No es posible predecir cuándo se desintegrará un átomo individual.
La física cuántica forma parte de nuestra vida cotidiana, por ejemplo en los láseres, el GPS y las memorias flash.
Sin la física cuántica, no existirían ni los ordenadores ni Internet.
En física cuántica, hay sucesos impredecibles y no puede existir un vacío perfecto.
La inteligencia se mapea en los sistemas de IA con la ayuda de redes neuronales que sólo procesan números.
Las señales analógicas pueden convertirse a digitales con muy poca pérdida de precisión.
Todo es un número: modelos lingüísticos como GPT-2 utilizan un diccionario con 52.000 entradas para traducir texto en números. Modelos como DALL-E también convierten las imágenes en números (píxeles). Las señales de audio y otros valores medidos también pueden representarse como números. Los actuadores (como las extremidades humanas) se controlan con números.
La estadística es un componente esencial tanto de la inteligencia humana como de la IA.
Conclusión resumida
La IA es un sistema que resuelve problemas y procesa nueva información. Aprende a partir de ejemplos y trabaja con números. Lo mismo ocurre con la inteligencia humana.
La estadística es importante para nuestro mundo y la teoría cuántica es la que mejor lo describe. La inteligencia está simplemente estructurada: se basa en redes neuronales que procesan números.
En la práctica, la inteligencia artificial no difiere de la humana: puede ser igual de útil. Las empresas deben utilizar la IA para ser más eficientes.
Acerca de estas declaraciones fundamentales


Me llamo Klaus Meffert. Soy doctor en informática y llevo más de 30 años dedicándome profesional y prácticamente a las tecnologías de la información. También trabajo como experto en informática y protección de datos. Obtengo mis resultados analizando la tecnología y el Derecho. Esto me parece absolutamente esencial cuando se trata de protección de datos digitales.
