KI bietet enorme Möglichkeiten und birgt gleichzeitig erhebliche Risiken. Aus beiden Gründen ist KI vielen unheimlich. Daher führen sie an, dass KI nur auf Statistik basiere und nichts mit menschlicher Intelligenz zu tun habe. Dabei wird vergessen, dass unsere gesamte Existenz auf Statistik basiert.
Der Statistik-Faktor unserer Existenz
Zu Sprachmodellen liest man oft, dass diese LLMs nur darauf beruhten, das nächste wahrscheinliche Wort zum zuletzt generierten Wort zu ermitteln und auszugeben. Das wird dann Wort für Wort gemacht. Und so käme das raus, was andere für einen intelligent erstellten Text halten. Statt Worten werden in Wirklichkeit sogenannte Token verarbeitet. Vereinfacht gesagt, sind Token so etwas wie Wortteile oder Silben. Token werden verwendet, um eine Kompression zu bewirken und auch, um längere oder zusammengesetzt Worte semantisch besser erfassen zu können.
Sogar der Hamburgische Datenschutzbeauftragte nutzt dieses Argument, um danach zu sagen, er sei für KI ja gar nicht zuständig. Denn KI verarbeite gar keine personenbezogenen Daten. Dazu fällt einem nur sehr wenig Positives ein. Es entbehrt schlichtweg jeder Grundlage, wie man beweisen kann. Die folgende Aussage reicht vielleicht schon als Gegenbeweis:
Sprachmodelle sagen das wahrscheinlich nächste Wort voraus. Das ist nicht intelligent.
Sprachmodelle sagen das wahrscheinlich nächste Wort passend zum gegebenen Kontext voraus. Das ist intelligent.
Den fett gedruckten Teil beachten viele nicht: er wird meistens nicht erwähnt.
Deutsche Grammatik
Auch der Mensch kann als sogenannter Token-Papagei bezeichnet werden. Der Begriff kam von jemandem, mit dem der Autor über technische Details von KI sprach. Derjenige meinte, Sprachmodelle seien nur Token-Papageien. Sie würden also das nachplappern, was sie einmal über Trainingsdaten eingetrichtert bekamen.
Warum ist der Mensch auch ein Token-Papagei? Wenn wir von der deutschen Grammatik sprechen, dann sehen wir als Muttersprachler, dass diese auf Wahrscheinlichkeiten basiert. Wir lernen, welche Worte und Begriffe mit welchen anderen Worten und Begriffen zusammenpassen. Dazu lernen wir Wahrscheinlichkeiten. Nur versteckt unser Gehirn das Prinzip des Sprachelernens so gut vor uns, dass wir nicht bemerken, dass das Grundprinzip der Grammatik sehr einfach ist. Erst seit Aufkommen des Transformer-Ansatzes im Jahr 2017, der eine sehr wichtige Grundlage für die heutige KI ist, wurde es möglich, dass sogar der naive Informatiker das verstehen kann, wenn er will.
Da können wir bis zum heiligen Nimmerleinstag warten …
Ist doch grammatikalisch richtig, aber würde es ein Muttersprachler so sagen?
Wenn ein Ausländer eine Redewendung aus Unwissen (oder mangelhaftem Gedächtnis) abwandelt und sie in anderer, aber grammatikalisch korrekter Form wiedergibt, dann erkennen wir die Person als Ausländer. Denn wir haben die abweichende Wahrscheinlichkeitsverteilung wahrgenommen.
Radioaktiver Zerfall
Beginnen wir mit einem Zitat von Wikipedia, das wohl jeder Physik so geben würde:
Der Zerfallszeitpunkt jedes einzelnen Atomkerns ist zufällig.
Quelle: Wikipedia
Das bedeutet: Wenn Sie ein Teilchen beobachten, dann wissen Sie nicht, wie lange dieses Teilchen existiert. Oder anders: Sie können nicht wissen, wie lange dieses Teilchen existiert. Sie können es nicht wissen, weil das Wissen einen Verstoß gegen das anerkannte physikalische Weltbild wäre. Die Kenntnis ist also nicht möglich. Bei Interesse nach mehr empfehle ich populärwissenschaftliche Bücher wie die von Werner Heisenberg oder Albert Einstein.
Wie lange dauert es, bis ein radioaktiver Stoff wie Uran, nicht mehr strahlt? Bei Betrachtung eines Teilchens Urans können Sie diese Frage generell nicht beantworten. Für Juristen: Diese Frage kann nicht beantwortet werden, auch nicht "grundsätzlich" nicht. Nochmal: Die Frage, wann ein radioaktiver Stoff nicht mehr radioaktiv ist, kann bei Betrachtung eines Teilchens nicht beantwortet werden.
Die Halbwertszeit ist die Zeit, nach der sich die radioaktive Strahlung eines Stoffs (radioaktives Nuklid) halbiert hat. Wie berechnet man diese Zahl? Jedenfalls gilt: "Der Zeitpunkt der Umwandlung eines einzelnen Atomkerns kann nicht vorhergesagt werden, …" (Quelle: Halbwertszeit/Wikipedia). Die Halbwertszeit wird als "statistischer Mittelwert" (selbe Quelle) ermittelt.
Radioaktiver Zerfall ist ein Zufallsprozess, der auf Statistik basiert.
Quantenphysik
Die Quantenphysik wurde mit der Entdeckung Albert Einsteins im Jahre 1905 bekannt. Er entdeckte, dass Licht nicht als kontinuierlicher Strahl zu verstehen ist, sondern in Form von winzigen Paketen, den Quanten. Dies hier ist kein Physik-Vortrag. Um nicht zu viele Physiker zu erzürnen, sei noch erwähnt, dass es den Welle-Teilchen-Dualismus gibt, der bei Licht anzutreffen ist. Dies mündet in das sogenannte Doppelspalt-Experiment, dem wohl besten Beleg für unsere Unfähigkeit, unsere eigene Existenz wirklich zu begreifen.
Beispielsweise basiert der Laser auf Erkenntnissen, die die Quantenphysik liefert. Auch das GPS, die Basis des Navigationssystems in Ihrem Auto oder auf Ihrem Smartphone, wäre ohne Quantenphysik nicht da. GPS wiederum basiert auf höchstgenauen Atomuhren, die nur deswegen existieren, weil wir deren Prinzip mit Quantenphysik verstehen können.

Auch der Tunnel-Effekt von Flash-Speicher basiert auf Quanrenphysik. Kurzum: Ohne Quantenphysik würde dieser Beitrag hier weder auf einem Computer geschrieben werden, noch würde er auf einer SSD-Festplatte über das Internet zu Ihnen gelangen, noch würden Sie selbst einen (bezahlbaren oder schnellen) Computer besitzen. Über ein Smartphone brauchen wir dann gar nicht erst reden.
In der Quantenphysik gibt es allerdings zufällige Ereignisse, die prinzipiell unvorhersagbar sind – auch dann, wenn man alle verfügbare Information kennt, die es über ein Quanten-System überhaupt gibt.
Quelle: Quantenzufall, Fettdruck hinzugefügt. Andere Quellen: Werner Heisenberg, Albert Einstein usw.
Es geht sogar so weit, dass es das perfekte Vakuum nicht geben kann. Denn das würde gegen die Heisenbergsche Unschärferelation verstoßen.
Wenn Sie mehr dazu wissen wollen: Werner Heisenberg, Niels Bohr, Richard Feynmann und Albert Einstein haben verständliche Bücher dazu geschrieben, denen andere grundsätzlich wenig hinzuzufügen haben.
Intelligenz basiert auf einem neuronalen Netz
Selbstverständlich kann Intelligenz auf jede geeignete Weise abgebildet werden. Aber ein neuronales Netz hat sich als besonders effektiv herausgestellt. Es kommt sowohl in Ihrem Gehirn als auch im künstlichen KI-Gehirn zum Einsatz.
Neuronale Netze verarbeitet nur Zahlen, sonst nichts.

In Ihrem Gehirn landen alle Signale in Form analoger Werte, die sich in Strom und Spannung manifestieren. Aktionspotentiale in Neuronen leiten die elektrischen Signale weiter („unsichtbare Verarbeitung").

Irgendwann kommt es zur „Ausgabe“. Ihr Mund bewegt sich deswegen, weil die entsprechenden Muskeln den Zahlen-Befehl über das Rückenmark aus dem Gehirn bekamen. Die Zahlen sind Ströme und Spannungen.
Analoge Signale können in digitale Signale überführt werden. Dabei geht etwas Genauigkeit verloren, weil analoge Signale kontinuierlich sind und digital Signale diskret. Kontinuierlich heißt: Es gibt beispielsweise beliebig viele Zahlen zwischen 0 und 1. Diskret heißt: Es gibt nur eine begrenzte Anzahl an Zahlen zwischen 0 und 1. Wie viele Zahlen dies im digitalen System sind, hängt von der verwendeten Genauigkeit ab. Es ist leicht einzusehen, dass es nicht entscheidend ist, ob zwischen 0 und 1 nun unendlich viele Zahlen liegen oder „nur“ 100.000 Milliarden Zahlen. Der Genauigkeitsverlust bei Überführung von analogen in digitale Signale ist verschwindend gering. Somit können analoge und digitale Systeme diesbezüglich als gleichwertig betrachtet werden, wie auch aktuelle KI-Systeme belegen, die dem Menschen (natürlich mit Ausnahme von Ihnen) oft weit überlegen sind.
Alles ist eine Zahl
Sprachmodelle basieren auf Token. Token werden zu Zahlen. Dazu nutzt man ein Wörterbuch. Das ist so einfach, dass man darüber eigentlich gar nicht reden muss. Hier ein Auszug aus dem öffentlich verfügbaren Wörterbuch von GPT-2:

Das merkwürdige „G“ vor manchen Token ist ein Kennzeichen dafür, dass das jeweilige Token den Anfang eines Wortes bilden muss. Alle Token ohne dieses Kennzeichen dürfen hingegen nicht am Wortanfang stehen. Das Wörterbuch von GPT-2 hat 52.000 Einträge.
Alle Open-Source Sprachmodelle haben ein Wörterbuch dieser Art, welches Sie herunterladen und als Textdatei ansehen können.
Wie sieht es bei Bildern aus? Sie kennen Dall-E oder Midjourney. Das Vorgehen ist wie folgt:
- Ihr Text (Prompt) wird in Zahlen umgewandelt und in das KI-Modell von DALL-E reingegeben.
- DALL-E verarbeitet diese Zahlen über ein neuronales Netzwerk, in dem nur mit Zahlen gerechnet wird.
- Am Ende kommen Zahlen als Ergebnis heraus. Diese Zahlen werden als Bildpunkte interpretiert.
Ein Bildpunkt heißt Pixel. Bei einem RGB-Farbkanal und einer Farbtiefe von 24 Bit hat ein Pixel 3 Bytes: 1 Byte für Rot, ein Byte für Grün und ein Byte für Blau. Jedes Byte kann Werte zwischen 0 und 255 annehmen. Ein Pixel besteht als aus drei Zahlen.
Und was ist mit Sprache, also Audiosignalen? Eine MP3-Datei, oder auch Ihre aufgenommene Stimme, besteht aus Schwingungen („Waveform“). Ihr Gehirn verarbeitet (wahrscheinlich) zwei Kanäle: Ein Kanal ist das linke Ohr, ein anderer das rechte Ohr. Beim Heimkino kennen Sie 5.1 oder ähnliches. Die 5 steht für die 4 Ecklautsprecher und den Center-Speaker. Die 1 steht für die Bassbox. Audiosignale können also, wie Ihre Stereoanlage oder Ihr Handy zeigen, in Zahlen umgewandelt werden.
Alle anderen Signale können ebenfalls in Zahlen umgewandelt werden. Beim Thermometer
Viele Artikel in PDF-Form · Kompakte Kernaussagen für Beiträge · Offline-KI · Freikontingent+ für Website-Checks
KI-Beratung, KI-Lösungen
Leistungsangebot:
- Erstberatung inkl. Machbarkeitsaussagen
- Schulungen und Workshops für Führungskräfte, Berufsgeheimnisträger, Angestellte, Entwickler
- KI-Lösungen mit und ohne ChatGPT/Azure. Cloud oder eigener KI-Server

gekennzeichnet.


Mein Name ist Klaus Meffert. Ich bin promovierter Informatiker und beschäftige mich seit über 30 Jahren professionell und praxisbezogen mit Informationstechnologie. In IT & Datenschutz bin ich auch als Sachverständiger tätig. Ich stehe für pragmatische Lösungen mit Mehrwert. Meine Firma, die 
Auch wenn ich Ihren Ansatz durchaus plausibel finde, halte ich die Antwort dennoch für komplexer. Intelligenz mag auf Statistik beruhen, jedoch nicht ausschließlich. Aus diesem Grund ist die Frage weder rein naturwissenschaftlich (empirisch) noch rein rechtswissenschaftlich zu beantworten, sondern sie hat auch eine philosophische Dimension. In diesem Zusammenhang würde ich das Buch "Künstliche Intelligenz und der Sinn des Lebens" von R.D. Precht empfehlen. Möglicherweise kann die Frage nur an der Schnittstelle dieser Disziplinen und letztlich wieder nur als Hypothese beantwortet werden.
Ja, das sehe ich auch so. Mir ging es hier vor allem darum, dass Statistik ein wesentlicher Bestandteil von Intelligenz ist, und nicht ein Ausschlusskriterium.
Man findet auch in früheren Büchern von bekannten Naturwissenschaftlern einige interessante Impulse.
Sobald Roboter die Welt erobern (sowohl positiv als auch negativ), wird die Disziplin "Philosophie" sich neu definieren müssen, ist meine starke Annahme. Ich sehe nämlich den Menschen als Automaten an. Roboter werden zeigen, ob ich richtig liege. Wer wettet dagegen?