Drücke „Enter”, um zum Inhalt zu springen.
Hinweis zu diesem Datenschutz-Blog:
Anscheinend verwenden Sie einen Werbeblocker wie uBlock Origin oder Ghostery, oder einen Browser, der bestimmte Dienste blockiert.
Leider wird dadurch auch der Dienst von VG Wort blockiert. Online-Autoren haben einen gesetzlichen Anspruch auf eine Vergütung, wenn ihre Beiträge oft genug aufgerufen wurden. Um dies zu messen, muss vom Autor ein Dienst der VG Wort eingebunden werden. Ohne diesen Dienst geht der gesetzliche Anspruch für den Autor verloren.

Ich wäre Ihnen sehr verbunden, wenn Sie sich bei der VG Wort darüber beschweren, dass deren Dienst anscheinend so ausgeprägt ist, dass er von manchen als blockierungswürdig eingestuft wird. Dies führt ggf. dazu, dass ich Beiträge kostenpflichtig gestalten muss.

Durch Klick auf folgenden Button wird eine Mailvorlage geladen, die Sie inhaltlich gerne anpassen und an die VG Wort abschicken können.

Nachricht an VG WortMailtext anzeigen

Betreff: Datenschutzprobleme mit dem VG Wort Dienst(METIS)
Guten Tag,

als Besucher des Datenschutz-Blogs Dr. DSGVO ist mir aufgefallen, dass der VG Wort Dienst durch datenschutzfreundliche Browser (Brave, Mullvad...) sowie Werbeblocker (uBlock, Ghostery...) blockiert wird.
Damit gehen dem Autor der Online-Texte Einnahmen verloren, die ihm aber gesetzlich zustehen.

Bitte beheben Sie dieses Problem!

Diese Nachricht wurde von mir persönlich abgeschickt und lediglich aus einer Vorlage generiert.
Wenn der Klick auf den Button keine Mail öffnet, schreiben Sie bitte eine Mail an info@vgwort.de und weisen darauf hin, dass der VG Wort Dienst von datenschutzfreundlichen Browser blockiert wird und dass Online Autoren daher die gesetzlich garantierten Einnahmen verloren gehen.
Vielen Dank,

Ihr Klaus Meffert - Dr. DSGVO Datenschutz-Blog.

PS: Wenn Sie meine Beiträge oder meinen Online Website-Check gut finden, freue ich mich auch über Ihre Spende.
Ausprobieren Online Webseiten-Check sofort das Ergebnis sehen
Externe Links sind mit dem Symbol Externer Link Symbol gekennzeichnet. Datenschutzinfo

Statistik: Die intelligente Verbindung zwischen KI und dem menschlichen Gehirn

Deutsche Version (Original)
2
Dr. DSGVO Newsletter erkannt: Erweiterte Funktionen verfügbar
Artikel als PDF · Mehr Inhalte & kompakte Kernaussagen · Webseiten-Checks · Offline-KI Live
Standardansicht: Dr. DSGVO Newsletter nicht erkannt. Erweiterte Funktionen nur für Abonnenten:
Artikel als PDF · Mehr Inhalte & kompakte Kernaussagen · Webseiten-Checks · Offline-KI Live
📄 Artikel als PDF (nur für Newsletter-Abonnenten)
🔒 Premium-Funktion
Der aktuelle Beitrag kann in PDF-Form angesehen und heruntergeladen werden

📊 Download freischalten
Der Download ist nur für Abonnenten des Dr. DSGVO-Newsletters möglich

KI bietet enorme Möglichkeiten und birgt gleichzeitig erhebliche Risiken. Aus beiden Gründen ist KI vielen unheimlich. Daher führen sie an, dass KI nur auf Statistik basiere und nichts mit menschlicher Intelligenz zu tun habe. Dabei wird vergessen, dass unsere gesamte Existenz auf Statistik basiert.

Der Statistik-Faktor unserer Existenz

Zu Sprachmodellen liest man oft, dass diese LLMs nur darauf beruhten, das nächste wahrscheinliche Wort zum zuletzt generierten Wort zu ermitteln und auszugeben. Das wird dann Wort für Wort gemacht. Und so käme das raus, was andere für einen intelligent erstellten Text halten. Statt Worten werden in Wirklichkeit sogenannte Token verarbeitet. Vereinfacht gesagt, sind Token so etwas wie Wortteile oder Silben. Token werden verwendet, um eine Kompression zu bewirken und auch, um längere oder zusammengesetzt Worte semantisch besser erfassen zu können.

Sogar der Hamburgische Datenschutzbeauftragte nutzt dieses Argument, um danach zu sagen, er sei für KI ja gar nicht zuständig. Denn KI verarbeite gar keine personenbezogenen Daten. Dazu fällt einem nur sehr wenig Positives ein. Es entbehrt schlichtweg jeder Grundlage, wie man beweisen kann. Die folgende Aussage reicht vielleicht schon als Gegenbeweis:

Sprachmodelle sagen das wahrscheinlich nächste Wort voraus. Das ist nicht intelligent.

Sprachmodelle sagen das wahrscheinlich nächste Wort passend zum gegebenen Kontext voraus. Das ist intelligent.

Den fett gedruckten Teil beachten viele nicht: er wird meistens nicht erwähnt.

Deutsche Grammatik

Auch der Mensch kann als sogenannter Token-Papagei bezeichnet werden. Der Begriff kam von jemandem, mit dem der Autor über technische Details von KI sprach. Derjenige meinte, Sprachmodelle seien nur Token-Papageien. Sie würden also das nachplappern, was sie einmal über Trainingsdaten eingetrichtert bekamen.

Warum ist der Mensch auch ein Token-Papagei? Wenn wir von der deutschen Grammatik sprechen, dann sehen wir als Muttersprachler, dass diese auf Wahrscheinlichkeiten basiert. Wir lernen, welche Worte und Begriffe mit welchen anderen Worten und Begriffen zusammenpassen. Dazu lernen wir Wahrscheinlichkeiten. Nur versteckt unser Gehirn das Prinzip des Sprachelernens so gut vor uns, dass wir nicht bemerken, dass das Grundprinzip der Grammatik sehr einfach ist. Erst seit Aufkommen des Transformer-Ansatzes im Jahr 2017, der eine sehr wichtige Grundlage für die heutige KI ist, wurde es möglich, dass sogar der naive Informatiker das verstehen kann, wenn er will.

Da können wir bis zum heiligen Nimmerleinstag warten …

Ist doch grammatikalisch richtig, aber würde es ein Muttersprachler so sagen?

Wenn ein Ausländer eine Redewendung aus Unwissen (oder mangelhaftem Gedächtnis) abwandelt und sie in anderer, aber grammatikalisch korrekter Form wiedergibt, dann erkennen wir die Person als Ausländer. Denn wir haben die abweichende Wahrscheinlichkeitsverteilung wahrgenommen.

Radioaktiver Zerfall

Beginnen wir mit einem Zitat von Wikipedia, das wohl jeder Physik so geben würde:

Der Zerfallszeitpunkt jedes einzelnen Atomkerns ist zufällig.

Quelle: Wikipedia

Das bedeutet: Wenn Sie ein Teilchen beobachten, dann wissen Sie nicht, wie lange dieses Teilchen existiert. Oder anders: Sie können nicht wissen, wie lange dieses Teilchen existiert. Sie können es nicht wissen, weil das Wissen einen Verstoß gegen das anerkannte physikalische Weltbild wäre. Die Kenntnis ist also nicht möglich. Bei Interesse nach mehr empfehle ich populärwissenschaftliche Bücher wie die von Werner Heisenberg oder Albert Einstein.

Wie lange dauert es, bis ein radioaktiver Stoff wie Uran, nicht mehr strahlt? Bei Betrachtung eines Teilchens Urans können Sie diese Frage generell nicht beantworten. Für Juristen: Diese Frage kann nicht beantwortet werden, auch nicht "grundsätzlich" nicht. Nochmal: Die Frage, wann ein radioaktiver Stoff nicht mehr radioaktiv ist, kann bei Betrachtung eines Teilchens nicht beantwortet werden.

Die Halbwertszeit ist die Zeit, nach der sich die radioaktive Strahlung eines Stoffs (radioaktives Nuklid) halbiert hat. Wie berechnet man diese Zahl? Jedenfalls gilt: "Der Zeitpunkt der Umwandlung eines einzelnen Atomkerns kann nicht vorhergesagt werden, …" (Quelle: Halbwertszeit/Wikipedia). Die Halbwertszeit wird als "statistischer Mittelwert" (selbe Quelle) ermittelt.

Radioaktiver Zerfall ist ein Zufallsprozess, der auf Statistik basiert.

Quantenphysik

Die Quantenphysik wurde mit der Entdeckung Albert Einsteins im Jahre 1905 bekannt. Er entdeckte, dass Licht nicht als kontinuierlicher Strahl zu verstehen ist, sondern in Form von winzigen Paketen, den Quanten. Dies hier ist kein Physik-Vortrag. Um nicht zu viele Physiker zu erzürnen, sei noch erwähnt, dass es den Welle-Teilchen-Dualismus gibt, der bei Licht anzutreffen ist. Dies mündet in das sogenannte Doppelspalt-Experiment, dem wohl besten Beleg für unsere Unfähigkeit, unsere eigene Existenz wirklich zu begreifen.

Beispielsweise basiert der Laser auf Erkenntnissen, die die Quantenphysik liefert. Auch das GPS, die Basis des Navigationssystems in Ihrem Auto oder auf Ihrem Smartphone, wäre ohne Quantenphysik nicht da. GPS wiederum basiert auf höchstgenauen Atomuhren, die nur deswegen existieren, weil wir deren Prinzip mit Quantenphysik verstehen können.

Quelle: https://www.srf.ch/wissen/technik/skurrile-teilchen-wo-die-quantenphysik-in-unserem-alltag-steckt

Auch der Tunnel-Effekt von Flash-Speicher basiert auf Quanrenphysik. Kurzum: Ohne Quantenphysik würde dieser Beitrag hier weder auf einem Computer geschrieben werden, noch würde er auf einer SSD-Festplatte über das Internet zu Ihnen gelangen, noch würden Sie selbst einen (bezahlbaren oder schnellen) Computer besitzen. Über ein Smartphone brauchen wir dann gar nicht erst reden.

In der Quantenphysik gibt es allerdings zufällige Ereignisse, die prinzipiell unvorhersagbar sind – auch dann, wenn man alle verfügbare Information kennt, die es über ein Quanten-System überhaupt gibt.

Quelle: Quantenzufall, Fettdruck hinzugefügt. Andere Quellen: Werner Heisenberg, Albert Einstein usw.

Es geht sogar so weit, dass es das perfekte Vakuum nicht geben kann. Denn das würde gegen die Heisenbergsche Unschärferelation verstoßen.

Wenn Sie mehr dazu wissen wollen: Werner Heisenberg, Niels Bohr, Richard Feynmann und Albert Einstein haben verständliche Bücher dazu geschrieben, denen andere grundsätzlich wenig hinzuzufügen haben.

Intelligenz basiert auf einem neuronalen Netz

Selbstverständlich kann Intelligenz auf jede geeignete Weise abgebildet werden. Aber ein neuronales Netz hat sich als besonders effektiv herausgestellt. Es kommt sowohl in Ihrem Gehirn als auch im künstlichen KI-Gehirn zum Einsatz.

Neuronale Netze verarbeitet nur Zahlen, sonst nichts.

Neuronales Netz: Entweder in Ihrem Kopf oder im KI-Modell. Quelle: Klaus Meffert

In Ihrem Gehirn landen alle Signale in Form analoger Werte, die sich in Strom und Spannung manifestieren. Aktionspotentiale in Neuronen leiten die elektrischen Signale weiter („unsichtbare Verarbeitung").

Quelle: https://www.spektrum.de/video/wie-uebertragen-neurone-signale/1521535

Irgendwann kommt es zur „Ausgabe“. Ihr Mund bewegt sich deswegen, weil die entsprechenden Muskeln den Zahlen-Befehl über das Rückenmark aus dem Gehirn bekamen. Die Zahlen sind Ströme und Spannungen.

Analoge Signale können in digitale Signale überführt werden. Dabei geht etwas Genauigkeit verloren, weil analoge Signale kontinuierlich sind und digital Signale diskret. Kontinuierlich heißt: Es gibt beispielsweise beliebig viele Zahlen zwischen 0 und 1. Diskret heißt: Es gibt nur eine begrenzte Anzahl an Zahlen zwischen 0 und 1. Wie viele Zahlen dies im digitalen System sind, hängt von der verwendeten Genauigkeit ab. Es ist leicht einzusehen, dass es nicht entscheidend ist, ob zwischen 0 und 1 nun unendlich viele Zahlen liegen oder „nur“ 100.000 Milliarden Zahlen. Der Genauigkeitsverlust bei Überführung von analogen in digitale Signale ist verschwindend gering. Somit können analoge und digitale Systeme diesbezüglich als gleichwertig betrachtet werden, wie auch aktuelle KI-Systeme belegen, die dem Menschen (natürlich mit Ausnahme von Ihnen) oft weit überlegen sind.

Alles ist eine Zahl

Sprachmodelle basieren auf Token. Token werden zu Zahlen. Dazu nutzt man ein Wörterbuch. Das ist so einfach, dass man darüber eigentlich gar nicht reden muss. Hier ein Auszug aus dem öffentlich verfügbaren Wörterbuch von GPT-2:

Wörterbuch von ChatGPT-2

Das merkwürdige „G“ vor manchen Token ist ein Kennzeichen dafür, dass das jeweilige Token den Anfang eines Wortes bilden muss. Alle Token ohne dieses Kennzeichen dürfen hingegen nicht am Wortanfang stehen. Das Wörterbuch von GPT-2 hat 52.000 Einträge.

Alle Open-Source Sprachmodelle haben ein Wörterbuch dieser Art, welches Sie herunterladen und als Textdatei ansehen können.

Wie sieht es bei Bildern aus? Sie kennen Dall-E oder Midjourney. Das Vorgehen ist wie folgt:

  1. Ihr Text (Prompt) wird in Zahlen umgewandelt und in das KI-Modell von DALL-E reingegeben.
  2. DALL-E verarbeitet diese Zahlen über ein neuronales Netzwerk, in dem nur mit Zahlen gerechnet wird.
  3. Am Ende kommen Zahlen als Ergebnis heraus. Diese Zahlen werden als Bildpunkte interpretiert.

Ein Bildpunkt heißt Pixel. Bei einem RGB-Farbkanal und einer Farbtiefe von 24 Bit hat ein Pixel 3 Bytes: 1 Byte für Rot, ein Byte für Grün und ein Byte für Blau. Jedes Byte kann Werte zwischen 0 und 255 annehmen. Ein Pixel besteht als aus drei Zahlen.

Und was ist mit Sprache, also Audiosignalen? Eine MP3-Datei, oder auch Ihre aufgenommene Stimme, besteht aus Schwingungen („Waveform“). Ihr Gehirn verarbeitet (wahrscheinlich) zwei Kanäle: Ein Kanal ist das linke Ohr, ein anderer das rechte Ohr. Beim Heimkino kennen Sie 5.1 oder ähnliches. Die 5 steht für die 4 Ecklautsprecher und den Center-Speaker. Die 1 steht für die Bassbox. Audiosignale können also, wie Ihre Stereoanlage oder Ihr Handy zeigen, in Zahlen umgewandelt werden.

Alle anderen Signale können ebenfalls in Zahlen umgewandelt werden. Beim Thermometer

Ganzen Artikel jetzt über kostenfreien Dr. DSGVO Newsletter lesen.
Weitere Extras für Abonnenten:
Viele Artikel in PDF-Form · Kompakte Kernaussagen für Beiträge · Offline-KI · Freikontingent+ für Website-Checks
Schon Abonnent? Link im Newsletter anklicken & diese Seite auffrischen.
Newsletter abonnieren

KI-Beratung, KI-Lösungen

Umfassende Beratung (fachlich, rechtlich, technisch):

Leistungsangebot:

  • Erstberatung inkl. Machbarkeitsaussagen
  • Schulungen und Workshops für Führungskräfte, Berufsgeheimnisträger, Angestellte, Entwickler
  • KI-Lösungen mit und ohne ChatGPT/Azure. Cloud oder eigener KI-Server

Ihre Anfrage

Oder Mail an ki@dr-dsgvo.de

Wer schreibt hier?
Mein Name ist Klaus Meffert. Ich bin promovierter Informatiker und beschäftige mich seit über 30 Jahren professionell und praxisbezogen mit Informationstechnologie. In IT & Datenschutz bin ich auch als Sachverständiger tätig. Ich stehe für pragmatische Lösungen mit Mehrwert. Meine Firma, die IT Logic GmbH, berät Kunden und bietet Webseiten-Checks sowie optimierte & sichere KI-Lösungen an.
Bitte nutzen Sie bei Verwendung meiner Ergebnisse die Quellenangabe oder verlinken Sie gut wahrnehmbar auf diesen Artikel:
Einen Kurzlink oder eine Bestätigung für Ihre Quellenangabe erhalten Sie kurzfristig auf Anfrage. Ein Teilen oder Verteilen dieses Beitrags ist natürlich ohne weiteres möglich und gewünscht.

Kommentare von Lesern

Die Kommentare drücken die Meinungen der jeweiligen Kommentargeber aus
  1. M.

    Auch wenn ich Ihren Ansatz durchaus plausibel finde, halte ich die Antwort dennoch für komplexer. Intelligenz mag auf Statistik beruhen, jedoch nicht ausschließlich. Aus diesem Grund ist die Frage weder rein naturwissenschaftlich (empirisch) noch rein rechtswissenschaftlich zu beantworten, sondern sie hat auch eine philosophische Dimension. In diesem Zusammenhang würde ich das Buch "Künstliche Intelligenz und der Sinn des Lebens" von R.D. Precht empfehlen. Möglicherweise kann die Frage nur an der Schnittstelle dieser Disziplinen und letztlich wieder nur als Hypothese beantwortet werden.

    • Dr. DSGVO

      Ja, das sehe ich auch so. Mir ging es hier vor allem darum, dass Statistik ein wesentlicher Bestandteil von Intelligenz ist, und nicht ein Ausschlusskriterium.
      Man findet auch in früheren Büchern von bekannten Naturwissenschaftlern einige interessante Impulse.
      Sobald Roboter die Welt erobern (sowohl positiv als auch negativ), wird die Disziplin "Philosophie" sich neu definieren müssen, ist meine starke Annahme. Ich sehe nämlich den Menschen als Automaten an. Roboter werden zeigen, ob ich richtig liege. Wer wettet dagegen?

Schreiben Sie einen Kommentar

Ihre Mail-Adresse wird nicht veröffentlicht.

Die KI-Transformation: Wie Unternehmen und Behörden digitaler werden