Drücke „Enter”, um zum Inhalt zu springen.
Hinweis zu diesem Datenschutz-Blog:
Anscheinend verwenden Sie einen Werbeblocker wie uBlock Origin oder Ghostery, oder einen Browser, der bestimmte Dienste blockiert.
Leider wird dadurch auch der Dienst von VG Wort blockiert. Online-Autoren haben einen gesetzlichen Anspruch auf eine Vergütung, wenn ihre Beiträge oft genug aufgerufen wurden. Um dies zu messen, muss vom Autor ein Dienst der VG Wort eingebunden werden. Ohne diesen Dienst geht der gesetzliche Anspruch für den Autor verloren.

Ich wäre Ihnen sehr verbunden, wenn Sie sich bei der VG Wort darüber beschweren, dass deren Dienst anscheinend so ausgeprägt ist, dass er von manchen als blockierungswürdig eingestuft wird. Dies führt ggf. dazu, dass ich Beiträge kostenpflichtig gestalten muss.

Durch Klick auf folgenden Button wird eine Mailvorlage geladen, die Sie inhaltlich gerne anpassen und an die VG Wort abschicken können.

Nachricht an VG WortMailtext anzeigen

Betreff: Datenschutzprobleme mit dem VG Wort Dienst(METIS)
Guten Tag,

als Besucher des Datenschutz-Blogs Dr. DSGVO ist mir aufgefallen, dass der VG Wort Dienst durch datenschutzfreundliche Browser (Brave, Mullvad...) sowie Werbeblocker (uBlock, Ghostery...) blockiert wird.
Damit gehen dem Autor der Online-Texte Einnahmen verloren, die ihm aber gesetzlich zustehen.

Bitte beheben Sie dieses Problem!

Diese Nachricht wurde von mir persönlich abgeschickt und lediglich aus einer Vorlage generiert.
Wenn der Klick auf den Button keine Mail öffnet, schreiben Sie bitte eine Mail an info@vgwort.de und weisen darauf hin, dass der VG Wort Dienst von datenschutzfreundlichen Browser blockiert wird und dass Online Autoren daher die gesetzlich garantierten Einnahmen verloren gehen.
Vielen Dank,

Ihr Klaus Meffert - Dr. DSGVO Datenschutz-Blog.

PS: Wenn Sie meine Beiträge oder meinen Online Website-Check gut finden, freue ich mich auch über Ihre Spende.
Ausprobieren Online Webseiten-Check sofort das Ergebnis sehen

Статистика: розумний зв'язок між ШІ та людським мозком

0
Dr. DSGVO Newsletter detected: Extended functionality available
More articles · Website-Checks · Live Offline-AI
📄 Стаття у форматі PDF (тільки для передплатників новин)
🔒 Premium-Funktion
Der aktuelle Beitrag kann in PDF-Form angesehen und heruntergeladen werden

📊 Download freischalten
Der Download ist nur für Abonnenten des Dr. DSGVO-Newsletters möglich

Штучний інтелект відкриває величезні можливості і водночас приховує в собі значні ризики. З обох причин ШІ лякає багатьох людей. Тому вони стверджують, що ШІ базується лише на статистиці і не має нічого спільного з людським інтелектом. При цьому вони забувають, що все наше існування засноване на статистиці.

Статистичний фактор нашого існування

Зу мовних моделях часто читається, що ці LLMs залежать лише від того, щоб знайти наступне вірогідне слово, яке слід було згенерувати після попереднього слова і вивести його. Це робиться потім за словами одне за одною. І так вийде щось, чого інші вважають розумно створеним текстом. Замість слів насправді обробляються так звані токени. Упрощено кажучи, токени є чимось подібним до частин слів або складів. Токени використовуються для того, щоб здійснити компресію та також, щоб краще семантично вловити довші чи поєднані слова.

Гамбурзький комісар із захисту даних навіть використовує цей аргумент, щоб сказати, що він не має повноважень щодо КІ. Поки що ніщо позитивне мені не спадає на думку щодо цього. Це просто відсутнє підстави, як можна довести це . Нижче наведена заява може бути досить достатнім протиставлення ([1]) :

Мовні моделі передбачають, яким буде наступне слово. Це не розумно.

Моделі мови передбачають наступне слово підібране до даного контексту. Це розумно.

Багато хто не звертає уваги на частину, виділену жирним шрифтом: про неї зазвичай не згадують.

Граматика німецької мови

Чоловік теж може бути названий так званим Token-Папугаєм. Поняття виникло від людини, з якою автор розмовляв про технічні деталі штучного інтелекту. Той чоловік сказав, що мовні моделі є лише Token-папугаями. Вони повторюють все, чого вони раніше навчалися на тренувальних даних.

Чому людина також є токен-папугаєм? Коли ми говоримо про німецьку граматику, тоді бачимо, що вона заснована на вірогідностіх. Ми вчимося, які слова та поняття поєднуються з іншими словами та поняттями. Для цього ми вивчаемо вірогідність. Але наш мозок приховує від нас принцип навчання мови так добре, що ніщо не вказує на те, що основний принцип граматики дуже простий. Лише після появи підхід трансформера в 2017 році, який є дуже важливим фундаментом сучасної КІ, стало можливим навіть для простого інформатика зрозуміти його, якщо він хоче.

Ми можемо почекати до святого дня ніколи-ніколи …

Граматично правильно, але чи скаже так носій мови?

Якщо іноземець змінює Ідіома через відсутність знань (або погане пам'ять) і знову передає її іншою, але граматично правильною формою, тоді ми визнаємо людину за іноземця. бо ми помітили відхилення розподілу ймовірностей.

Радіоактивний розпад

Почнемо з цитати з Вікіпедії, яку, напевно, скаже будь-який фізик:

Час розпаду кожного окремого атомного ядра є випадковим.

Джерело: Вікіпедія

Досліджуючи частинку, ви не знаєте, скільки часу вона існує. Або інакше: ви не можете знати, скільки часу вона існує. Ви не можете знати, бо знання було б порушенням прийнятого фізичного світогляду. Знання таким чином неможливе. Якщо цікавитесь більше, рекомендую популярно-наукові книги, наприклад, від Вільгельма Гейзенберга або Альберта Ейнштейна.

Скільки часу потрібно, щоб радіоактивна речовина, така як уран, перестала випромінювати? На це питання неможливо відповісти, дивлячись на частинку урану. Для юристів: на це питання не можна відповісти навіть "в принципі". Ще раз: на питання, коли радіоактивна речовина перестає бути радіоактивною, не можна відповісти, дивлячись на частинку.

Вивільчувальна доба — час, протягом якого кількість радіоактивної випромінювання речовини (радіонукліду) зменшується вдвічі. Як розрахувати цю цифру? У будь-якому разі діє таке: "Час перетворення окремого ядра не можна передбачити…" (Halbwertszeit/Wikipedia). Вивільчувальну добу називають "статистичним середнім" (та ж джерело).

Радіоактивний розпад є завданим процесом, який ґрунтується на статистиці.

Квантова фізика

Квантова фізика була відкрита Альбертом Ейнштейном у 1905 році. Він відкрив, що світло не можна розуміти як неперервний потік, а саме в вигляді дуже малих пакетів, які називаються квантами. Це не фізичний лекційний матеріал. Для того щоб не розсердити багатьох фізиків, згадується ще одне питання: існує дuality хвильової та часткової природи світла. Ця ідея закінчується відомим Двоїм спліт-експериментом, який є найкращим свідченням нашої неспроможності повністю зрозуміти власну існуваність.

Наприклад, лазери базуються на висновках квантової фізики. Навіть GPS, основа навігаційної системи у вашому автомобілі чи смартфоні, не існувала б без квантової фізики. GPS, у свою чергу, базується на високоточному атомному годиннику, який існує лише тому, що ми можемо зрозуміти його принцип за допомогою квантової фізики.

Джерело: @@Х1@@ (зображення було перекладено автоматично).

Також ефект тунелювання від флеш-пам'яті ґрунтується на квантійній фізиці. Усього лише: без квантійської фізики цей матеріал тут не був би написаний на комп'ютері, ні він би не дійшов до вас через інтернет на SSD-жорсткій диску, ні ви самі володіли б (доступним або швидким) комп'ютером. Про смартфон навіть мова бути не може.

У квантовій фізиці існують випадкові події, які в принципі непередбачувані – навіть тоді, коли людина має всі наявні дані про певне квантове система.

Джерело: Квантова випадковість, жирний шрифт доданий. Інші джерела: Вернер Гейзенберг, Альберт Ейнштейн тощо.

Є навіть така можливість, що ідеальне вакуум не існує. Для цього б було порушено Heisenbergsку нерівність невизначеності.

Якщо ви хочете знати більше: Вернер Гейзенберг, Нільс Бор, Річард Фейнман і Альберт Ейнштейн написали зрозумілі книги на цю тему, до яких інші мало що можуть додати.

Інтелект на основі нейронної мережі

Самовідомлення розуму можна відобразити будь-якою відповідною манерою. Але нейронна мережа виявилася особливо ефективною. Вона використовується як у вашому Голові, так і в штучному КІ-Голові.

Нейронні мережі обробляють тільки числа, і нічого більше.

Нейронна мережа: або у вашій голові, або в моделі ШІ. Джерело: Клаус Мефферт (зображення було перекладено автоматично).

У вашому мозку всі сигнали приземлюються у вигляді аналогових значень, які проявляються в току і напрузі. Акціонові потенціали в нейронах передають електричні сигнали далі („невидима обробка").

Джерело: @@Х1@@ (зображення було перекладено автоматично).

У певний момент відбувається "вихід". Ваш рот рухається, тому що відповідні м'язи отримали числову команду від мозку через спинний мозок. Числа – це струм і напруга.

Аналогові сигнали можна перетворити на цифрові. При цьому втрачається певна точність, оскільки аналогові сигнали є неперервними, а цифрові – дискретними. Безперервність означає, наприклад, що існує будь-яка кількість чисел між 0 і 1. Дискретність означає, що існує лише обмежена кількість чисел між 0 і 1. Кількість цих чисел у цифровій системі залежить від точності, яка використовується. Легко помітити, що не важливо, чи існує нескінченна кількість чисел між 0 і 1, чи "лише" 100 000 мільярдів чисел. Втрата точності при перетворенні аналогових сигналів в цифрові незначна. Тому аналогові та цифрові системи можна вважати еквівалентними в цьому відношенні, як це доводять сучасні системи штучного інтелекту, які часто набагато перевершують людину (за винятком вас, звичайно).

Все – це число

Моделі мови базуються на токенах. Токени перетворюються на числа. Для цього використовується Словник. Це таке просте, що про це майже нічого не потрібно говорити. Наприклад, видалення публічно доступного словника GPT-2:

Словник ChatGPT-2 (зображення було перекладено автоматично).

Дивна літера "G" перед деякими лексемами є індикатором того, що відповідна лексема має бути на початку слова. Всі лексеми без цієї позначки не повинні стояти на початку слова. Словник GPT-2 містить 52 000 статей.

Всі моделі мов з відкритим вихідним кодом мають словник такого типу, який ви можете завантажити і переглянути у вигляді текстового файлу.

Як виглядає це з Зображеннями? Ви знаєте Dall-E чи Midjourney. Порядок дій такий:

  1. Ваш текст (підказка) перетворюється на цифри і подається в модель штучного інтелекту DALL-E.
  2. DALL-E обробляє ці числа за допомогою нейронної мережі, яка обчислює тільки числами.
  3. Кінцевим результатом є число. Ці числа інтерпретуються як пікселі.

Назвемо такий точці Піксель. При RGB-каналі та глибині кольору 24 біта один піксель містить 3 байти: 1 байт для червоного, 1 байт для зеленого і 1 байт для синього. Кожен байт може приймати значення від 0 до 255. Піксель складається з трьох чисел.

А як щодо мови, тобто звукових сигналів? MP3-файл, або ваш записаний голос, складається з вібрацій ("хвильової форми"). Ваш мозок (ймовірно) обробляє два канали: Один канал – ліве вухо, інший – праве. У домашньому кінотеатрі ви знаєте 5.1 або подібне. Цифра 5 означає 4 кутові колонки і центральну колонку. Цифра 1 означає низькочастотний динамік. Таким чином, аудіосигнали можуть бути перетворені в цифри, як це показує ваша стереосистема або мобільний телефон.

Всі інші сигнали теж можна перетворити на цифри. При Термометрі це температура у вигляді числового значення, при Сенсорі землетрусу це сила землетрусу (близько за шкалою Ріхтера). Інші сигнали вже цифрові. Наприклад, таблиця Excel із інформацією про обсяги продажу.

Всі сигнали можуть бути перетворені в числа.

Команди керування, з іншого боку, можуть бути виконані шляхом надсилання чисел до виконавчих механізмів.

Керування виконавчим механізмом, наприклад, вашим ротом або рукою, здійснюється за допомогою надсилання чисел до виконавчого механізму. І все. Де тут секретний інгредієнт? Його немає. Той факт, що хімічні процеси також задіяні, – це деталь, яка, очевидно, не є необхідною і зумовлена природою біологічних систем. Якщо ви бачите це по-іншому, було б добре, якби ви могли навести кілька аргументів.

Думки щодо статистики

Думки не є справжніми доказами. Вони повинні бути викладені тут лише для того, щоб ніхто не подумав, що автор залишився наодинці зі своєю думкою.

Думки інших

З навідки 30-хвилинного розмови із працівником DEEPL у листопаді 2024 року вийшло таке: Працівник є інформатиком та розуміє технічну функціональність мовних моделей. Його фаховий напрямок — лінгвістика, що для DEEPL не дуже несподіване. Він погоджується із автором, що статистика також є основою людської інтелекту. Він бачить також, що роботизовані системи стають все більш потужними. Що не кожен інформатик має такі розуміння, показує приклад із токен-папугаєм (термін походив від іншого інформатика, який ще не знайшов межі свого розуміння).

Prof. Dr. Максиміліан Вандервітц — професор з економічного права та права інформаційних технологій. Він публікує багато матеріалів щодо теми штучного інтелекту. Після свого виступу 26 листопада 2024 року у Майнці його запитали про його думку. Пан Вандервітц підтвердив, що його погляд такий же, як і той, що статистика є важливим елементом людської інтелігенції та він бачить її аналогічно до штучного інтелекту.

Т-Systems працівник, який у своєму підприємстві відповідав за цифрові системи, підтвердив це 26 листопада 2024 року: Він вважає статистику як елемент людської інтелекту так само, як і в штучній інтелект.

Сем Альманн, співзасновник OpenAI вважає могутність КІ настільки великою, що вона перевершить людину на величезну відстань. "Величезна" тут означає "невідповідно велика". Перевершити інтелект яким-небудь іншим чином ніж за допомогою інтелекту здається майже неможливим.

Визначення (штучного) інтелекту

Автор пропонує (з початку вже 03.04.2024) наступну definicija від Künstlicher Intelligenz:

Як Культурна Інтелект називається кібернетичний систем, який спробує, вирішити проблему навіть при неясній умові на непередбачуваний, спрямований на рішення спосіб і для цього існуючого поєднати з новим знання та виключення висновків.

Визначення терміну "штучний інтелект". Джерело: Клаус Мефферт, dr-dsgvo.de

Ви можете вирішити для себе, що таке штучна система. Це не має значення. 27 країн-членів ЄС в середньому бачать це по-різному. Це середнє значення називається демократичним процесом. ЄС розглядає машину як обов'язкову умову для ШІ. Це обмеження є непотрібним і зарозумілим. Також було показано, що дизель може бути екологічно чистим. Виключати це заздалегідь було непотрібно і неправильно.

Так що ж таке інтелект? Те саме, за винятком того, що інтелект не є (обов'язково) штучним. Це дає нам наступне визначення:

Як інтелект називається система, яка спробує, вирішити проблему навіть при неясній вказівці, на немовно конкретизованій, спрямованій на рішення спосіб і поєднує існуюче з новим знанням та робить висновки.

Визначення терміну "розвідка". Джерело: Клаус Мефферт, dr-dsgvo.de

Визначення інтелекту ідентичне визначенню ШІ, за винятком прикметника "штучний".

Твій погляд

Ви вважаєте, що ШІ "лише" ґрунтується на статистиці і тому не є інтелектуальною системою? Тоді було б непогано дізнатися, на якому принципі, якщо не на статистиці, базується людський інтелект. Ми з радістю розглянемо ваше визначення ШІ або інтелекту, якщо у вас є відмінне від наведеного вище, і ви вважаєте його кращим. Крім того, було б добре знати, де аргумент, коли хтось каже: "ШІ ґрунтується на статистиці". Правильно, але в чому сенс?

Результат

Статистика – основа нашого існування. Найкраща теорія, яку ми маємо – це, мабуть, квантова теорія. Вона надзвичайно точно описує нашу реальність. Той, хто ставить під сумнів квантову фізику, заперечує власне існування.

Тому що просте – це (занадто) просто?

Основною причиною є припущення деяких, що статистика як механізм є занадто простим для отримання розвідданих.

Тому що просте – це просто просте. Ми повинні відмовитися від припущення, що неймовірні механізми, такі як те, що ми називаємо інтелектом, повинні базуватися на складних принципах. Той факт, що система недостатньо складна, не є аргументом на користь того, що ця система не може бути ефективною.

Інтелегенція дуже просто в своїй сутності. Вона ґрунтується (як правило) на нейронному мережі, яка обробляє числа та навчиться за допомогою прикладів. Прикладами є пари "іст" (вхід) та "соль" (виход), або навіть лише "іст"-пари (наприклад німецькі тексти), які вважаються вірними.

Це правда, що німецька мова (і багато інших мов світу) базується на статистиці. Справа в тому, що текст можна перетворити на цифри. Те саме стосується зображень, мови та інших сенсорних значень. Нейронні мережі завжди обчислюють тільки з числами. У вашому мозку немає ні тексту, ні звуку, ні зображення, тільки числа.

Правда також у тому, що ми (а саме ви теж) навчаємося німецької мови та граматики за допомогою прикладів. Так само як і КІ. Для цього використовується механізм під назвою Увага. У КІ він називається "Attention". Але й без Attention можна, як показують сучасні технічні підходи. Також не має значення, яким чином виникає інтелект, адже часто є декілька шляхів досягнення однієї мети.

Те, як досягається мета або як досягається розвідка, абсолютно не має значення (якщо розглядати її в довгостроковій перспективі).

Однак деякі підходи є більш ефективними, ніж інші.

Системи штучного інтелекту зазвичай (все ще) навчаються на основі даних, наданих людиною. Одним з основних джерел є інтернет. Однак роботи навчаються, як люди, якщо у них є штучний мозок. Вони можуть вчитися на прикладах зі свого звичного середовища. Такі роботи вже існують. Це не теорія, а реальність. Побутових роботів та інших роботизованих помічників незабаром можна буде придбати за кілька тисяч євро.

Ідея про те, що штучна інтелект щось зовсім інше, ніж людська інтелектуальність, веде далі від реалій. А навіть якщо КІ була дуже доброю імітцією інтелекту: Що це змінить?

Використовуйте AI як ефективного співробітника у своєму підприємстві. Варіанти застосування дуже різноманітні! Найкраще працює AI для конкретних випадків застосування.

Оновлення: Європейська мовна модель Teuken

Важко повірити, але це правда. Європейська мовна модель під назвою Teuken щойно була опублікована (26/11/2024).

Перші випробування дуже вишкільбовані. На практичному прикладі показано, чого може досягнути Teuken. Для цього перший розділ цієї статті був введений в Teuken-LLM і мав бути підсумований. Завдання було зробити підсумок у 3 речення. Тут результат:

Теза 1: Мовні моделі, такі як GPT-3, базуються на визначенні та вимові найбільш ймовірного слова для попередньо згенерованого слова.Теза 2: Токени – це спосіб представлення довших слів або речень у більш стислій формі. Вони також можуть представляти семантично складнішу інформацію.Теорема 3: Аргумент про те, що ШІ не обробляє персональні дані, є хибним і свідчить про фундаментальну проблему розуміння ШІ.Теорема 4: Людей можна назвати "папугами-жетонами", оскільки вони демонструють повторення того, чого їх навчили на навчальних даних.Теорема 5: Граматика німецької мови заснована на ймовірностях. Це інтуїтивно зрозуміло людині і використовується несвідомо при вивченні мови.6 речення: Трансформаторний підхід став проривом в ШІ, дозволивши навіть неспеціалістам зрозуміти основи обробки мови.Текст пояснює різні аспекти мовної моделі GPT-3 і німецької граматики.>>>> це було 6 речень. я хочу резюме в 3 реченняхТак, ось стислий варіант:1. мовні моделі, такі як GPT-3, використовують маркери замість слів.2.Людей можна назвати "папугами токенів", тому що вони демонструють повторення того, чого їх навчили в навчальних даних.3.

Спочатку Teuken доставив 6 наборів замість 3. Але ці 6 речень були дуже хорошими. Прохання до Teuken надати резюме у 3 реченнях також було виконано. Результат вражає, навіть якщо є невелика орфографічна помилка.

Що вражає: Teuken розміщує "Речення 1", "Речення 2" і т.д. перед згенерованими реченнями. За спостереженнями автора, інші моделі ШІ поки що цього не роблять.

Використано Teuken-7B-instruct-commercial-v0.4 від openGPT-X. Звідси інформація про ліцензію:

Lizenzangabe (реклама Teuken):

Copyright 2024 openGPT-X

Licensed under the Apache License, Version 2.0 (the "License"); you may not use this file except in compliance with the License. You may obtain a copy of the License at

http://www.apache.org/licenses/LICENSE-2.0

Unless required by applicable law or agreed to in writing, software distributed under the License is distributed on an "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. See the License for the specific language governing permissions and limitations under the License.

Основні тези цієї статті

Мовні моделі працюють не просто слово в слово, а з так званими токенами. Це як менші одиниці слів або складів.

Людей також можна описати як папуг-жетонів, тому що, як і ШІ, ми вивчаємо і застосовуємо правила мови, засновані на ймовірності.

Радіоактивний розпад – це випадковий процес, в якому період напіврозпаду розраховується як середнє статистичне значення. Неможливо передбачити, коли розпадеться окремий атом.

Квантова фізика є частиною нашого повсякденного життя, наприклад, у лазерах, GPS та флеш-пам'яті.

Без квантової фізики не було б ні комп'ютерів, ні інтернету.

У квантовій фізиці існують непередбачувані події, і ідеальний вакуум не може існувати.

Інтелект відображається в системах штучного інтелекту за допомогою нейронних мереж, які обробляють лише числа.

Аналогові сигнали можуть бути перетворені в цифрові з дуже малою втратою точності.

Все є число: мовні моделі, такі як GPT-2, використовують словник на 52 000 записів для перекладу тексту в цифри. Зображення також перетворюються на числа (пікселі) такими моделями, як DALL-E. Звукові сигнали та інші виміряні величини також можуть бути представлені у вигляді чисел. Актуатори (наприклад, людські кінцівки) контролюються за допомогою чисел.

Статистика – важливий компонент як людського інтелекту, так і ШІ.

Короткий висновок

ШІ – це система, яка вирішує проблеми та обробляє нову інформацію. Він вчиться на прикладах і працює з числами. Так само і з людським інтелектом.

Статистика важлива для нашого світу, і квантова теорія описує її найкраще. Інтелект має просту структуру: він базується на нейронних мережах, які обробляють числа.

Штучний інтелект на практиці нічим не відрізняється від людського – він може бути таким же корисним. Компанії повинні використовувати ШІ, щоб стати більш ефективними.

Про ці основні твердження
About the author on dr-dsgvo.de
My name is Klaus Meffert. I have a doctorate in computer science and have been working professionally and practically with information technology for over 30 years. I also work as an expert in IT & data protection. I achieve my results by looking at technology and law. This seems absolutely essential to me when it comes to digital data protection. My company, IT Logic GmbH, also offers consulting and development of optimized and secure AI solutions.

Трансформація штучного інтелекту: як компанії та державні органи стають більш цифровими