Чому людський інтелект порівнюється з ШІ?

І люди, і штучний інтелект базуються на ймовірностях та статистичних принципах. Людська граматика ґрунтується на ймовірностях, подібно до того, як працюють мовні моделі.

Що означає термін «Token-попугай» в контексті ШІ?

Термін «Token-Папуга» описує те, що мовні моделі просто відтворюють те, що вони вивчили у своїх навчальних даних, без реального розуміння чи судження. Вони наслідують закономірності, а не розуміють.

Яку роль відіграє квантова фізика в контексті штучного інтелекту?

Квантова фізика є фундаментальною для багатьох технологій, включаючи GPS, лазери, флеш-пам'ять та навіть основи для обчислення ймовірностей у моделях штучного інтелекту. Без неї ці технології не були б можливими.

Як обробляються аналогові сигнали, такі як від нейронів, в системах штучного інтелекту?

Аналогові сигнали перетворюються на цифрові, коли їх перетворюють на числа. Цей процес передбачає перетворення безперервних значень на дискретні числа, що є основою для обробки в системах штучного інтелекту.

Яку роль відіграють токени та словники при обробці мови штучним інтелектом?

Моделі мови базуються на токенах, які перетворюються на числа та відображаються за допомогою словників. Ці токени є основою для обробки мови штучним інтелектом, особливо при генерації та інтерпретації тексту.

Як перетворюються різні типи сигналів, такі як аудіосигнали, на цифрові дані?

Різні типи сигналів, включаючи аудіосигнали, перетворюються на числа шляхом розкладання їх на базові коливання або компоненти, а потім перетворення їх у чисельні значення, які можуть бути оброблені системами штучного інтелекту.

Чи ШІ насправді лише базується на статистиці?

Визначення ШІ та інтелекту ідентичні, за винятком слова «штучний». Обидва базуються на обробці чисел та навчанні на прикладах, як пари «є» та «має бути».

Чому часто критикують, що ШІ занадто простий?

Критика щодо того, що ШІ занадто простий, ґрунтується на припущенні, що для інтелекту потрібні складні механізми. Фактично, ШІ базується на нейронних мережах, які обробляють числа та функціонують завдяки навчанню на прикладах, що є відносно простим процесом.

Статистика: розумний зв'язок між ШІ та людським мозком

Штучний інтелект відкриває величезні можливості і водночас приховує в собі значні ризики. З обох причин ШІ лякає багатьох людей. Тому вони стверджують, що ШІ базується лише на статистиці і не має нічого спільного з людським інтелектом. При цьому вони забувають, що все наше існування засноване на статистиці.

Статистичний фактор нашого існування

Зу мовних моделях часто читається, що ці LLMs залежать лише від того, щоб знайти наступне вірогідне слово, яке слід було згенерувати після попереднього слова і вивести його. Це робиться потім за словами одне за одною. І так вийде щось, чого інші вважають розумно створеним текстом. Замість слів насправді обробляються так звані токени. Упрощено кажучи, токени є чимось подібним до частин слів або складів. Токени використовуються для того, щоб здійснити компресію та також, щоб краще семантично вловити довші чи поєднані слова.

Гамбурзький комісар із захисту даних навіть використовує цей аргумент, щоб сказати, що він не має повноважень щодо КІ. Поки що ніщо позитивне мені не спадає на думку щодо цього. Це просто відсутнє підстави, як можна довести це . Нижче наведена заява може бути досить достатнім протиставлення ([1]) :

Мовні моделі передбачають, яким буде наступне слово. Це не розумно.

Моделі мови передбачають наступне слово підібране до даного контексту. Це розумно.

Багато хто не звертає уваги на частину, виділену жирним шрифтом: про неї зазвичай не згадують.

Граматика німецької мови

Чоловік теж може бути названий так званим Token-Папугаєм. Поняття виникло від людини, з якою автор розмовляв про технічні деталі штучного інтелекту. Той чоловік сказав, що мовні моделі є лише Token-папугаями. Вони повторюють все, чого вони раніше навчалися на тренувальних даних.

Чому людина також є токен-папугаєм? Коли ми говоримо про німецьку граматику, тоді бачимо, що вона заснована на вірогідностіх. Ми вчимося, які слова та поняття поєднуються з іншими словами та поняттями. Для цього ми вивчаемо вірогідність. Але наш мозок приховує від нас принцип навчання мови так добре, що ніщо не вказує на те, що основний принцип граматики дуже простий. Лише після появи підхід трансформера в 2017 році, який є дуже важливим фундаментом сучасної КІ, стало можливим навіть для простого інформатика зрозуміти його, якщо він хоче.

Ми можемо почекати до святого дня ніколи-ніколи …
Граматично правильно, але чи скаже так носій мови?

Якщо іноземець змінює Ідіома через відсутність знань (або погане пам'ять) і знову передає її іншою, але граматично правильною формою, тоді ми визнаємо людину за іноземця. бо ми помітили відхилення розподілу ймовірностей.

Радіоактивний розпад

Почнемо з цитати з Вікіпедії, яку, напевно, скаже будь-який фізик:

Час розпаду кожного окремого атомного ядра є випадковим.
Джерело: Вікіпедія

Досліджуючи частинку, ви не знаєте, скільки часу вона існує. Або інакше: ви не можете знати, скільки часу вона існує. Ви не можете знати, бо знання було б порушенням прийнятого фізичного світогляду. Знання таким чином неможливе. Якщо цікавитесь більше, рекомендую популярно-наукові книги, наприклад, від Вільгельма Гейзенберга або Альберта Ейнштейна.

Скільки часу потрібно, щоб радіоактивна речовина, така як уран, перестала випромінювати? На це питання неможливо відповісти, дивлячись на частинку урану. Для юристів: на це питання не можна відповісти навіть "в принципі". Ще раз: на питання, коли радіоактивна речовина перестає бути радіоактивною, не можна відповісти, дивлячись на частинку.

Вивільчувальна доба — час, протягом якого кількість радіоактивної випромінювання речовини (радіонукліду) зменшується вдвічі. Як розрахувати цю цифру? У будь-якому разі діє таке: "Час перетворення окремого ядра не можна передбачити…" (Halbwertszeit/Wikipedia). Вивільчувальну добу називають "статистичним середнім" (та ж джерело).

Радіоактивний розпад є завданим процесом, який ґрунтується на статистиці.

Квантова фізика

Квантова фізика була відкрита Альбертом Ейнштейном у 1905 році. Він відкрив, що світло не можна розуміти як неперервний потік, а саме в вигляді дуже малих пакетів, які називаються квантами. Це не фізичний лекційний матеріал. Для того щоб не розсердити багатьох фізиків, згадується ще одне питання: існує дuality хвильової та часткової природи світла. Ця ідея закінчується відомим Двоїм спліт-експериментом, який є найкращим свідченням нашої неспроможності повністю зрозуміти власну існуваність.

Наприклад, лазери базуються на висновках квантової фізики. Навіть GPS, основа навігаційної системи у вашому автомобілі чи смартфоні, не існувала б без квантової фізики. GPS, у свою чергу, базується на високоточному атомному годиннику, який існує лише тому, що ми можемо зрозуміти його принцип за допомогою квантової фізики.

Джерело: @@Х1@@ (зображення було перекладено автоматично).

Також ефект тунелювання від флеш-пам'яті ґрунтується на квантійній фізиці. Усього лише: без квантійської фізики цей матеріал тут не був би написаний на комп'ютері, ні він би не дійшов до вас через інтернет на SSD-жорсткій диску, ні ви самі володіли б (доступним або швидким) комп'ютером. Про смартфон навіть мова бути не може.

У квантовій фізиці існують випадкові події, які в принципі непередбачувані – навіть тоді, коли людина має всі наявні дані про певне квантове система.
Джерело: Квантова випадковість, жирний шрифт доданий. Інші джерела: Вернер Гейзенберг, Альберт Ейнштейн тощо.

Є навіть така можливість, що ідеальне вакуум не існує. Для цього б було порушено Heisenbergsку нерівність невизначеності.

Якщо ви хочете знати більше: Вернер Гейзенберг, Нільс Бор, Річард Фейнман і Альберт Ейнштейн написали зрозумілі книги на цю тему, до яких інші мало що можуть додати.

Інтелект на основі нейронної мережі

Самовідомлення розуму можна відобразити будь-якою відповідною манерою. Але нейронна мережа виявилася особливо ефективною. Вона використовується як у вашому Голові, так і в штучному КІ-Голові.

Нейронні мережі обробляють тільки числа, і нічого більше.

Нейронна мережа: або у вашій голові, або в моделі ШІ. Джерело: Клаус Мефферт (зображення було перекладено автоматично).

У вашому мозку всі сигнали приземлюються у вигляді аналогових значень, які проявляються в току і напрузі. Акціонові потенціали в нейронах передають електричні сигнали далі („невидима обробка").

У певний момент відбувається "вихід". Ваш рот рухається, тому що відповідні м'язи отримали числову команду від мозку через спинний мозок. Числа – це струм і напруга.

Аналогові сигнали можна перетворити на цифрові. При цьому втрачається певна точність, оскільки аналогові сигнали є неперервними, а цифрові – дискретними. Безперервність означає, наприклад, що існує будь-яка кількість чисел між 0 і 1. Дискретність означає, що існує лише обмежена кількість чисел між 0 і 1. Кількість цих чисел у цифровій системі залежить від точності, яка використовується. Легко помітити, що не важливо, чи існує нескінченна кількість чисел між 0 і 1, чи "лише" 100 000 мільярдів чисел. Втрата точності при перетворенні аналогових сигналів в цифрові незначна. Тому аналогові та цифрові системи можна вважати еквівалентними в цьому відношенні, як це доводять сучасні системи штучного інтелекту, які часто набагато перевершують людину (за винятком вас, звичайно).

Все – це число

Моделі мови базуються на токенах. Токени перетворюються на числа. Для цього використовується Словник. Це таке просте, що про це майже нічого не потрібно говорити. Наприклад, видалення публічно доступного словника GPT-2:

Словник ChatGPT-2 (зображення було перекладено автоматично).

Дивна літера "G" перед деякими лексемами є індикатором того, що відповідна лексема має бути на початку слова. Всі лексеми без цієї позначки не повинні стояти на початку слова. Словник GPT-2 містить 52 000 статей.

Всі моделі мов з відкритим вихідним кодом мають словник такого типу, який ви можете завантажити і переглянути у вигляді текстового файлу.

Як виглядає це з Зображеннями? Ви знаєте Dall-E чи Midjourney. Порядок дій такий:

Ваш текст (підказка) перетворюється на цифри і подається в модель штучного інтелекту DALL-E.
DALL-E обробляє ці числа за допомогою нейронної мережі, яка обчислює тільки числами.
Кінцевим результатом є число. Ці числа інтерпретуються як пікселі.

Назвемо такий точці Піксель. При RGB-каналі та глибині кольору 24 біта один піксель містить 3 байти: 1 байт для червоного, 1 байт для зеленого і 1 байт для синього. Кожен байт може приймати значення від 0 до 255. Піксель складається з трьох чисел.

А як щодо мови, тобто звукових сигналів? MP3-файл, або ваш записаний голос, складається з вібрацій ("хвильової форми"). Ваш мозок (ймовірно) обробляє два канали: Один канал – ліве вухо, інший – праве. У домашньому кінотеатрі ви знаєте 5.1 або подібне. Цифра 5 означає 4 кутові колонки і центральну колонку. Цифра 1 означає низькочастотний динамік. Таким чином, аудіосигнали можуть бути перетворені в цифри, як це показує ваша стереосистема або мобільний телефон.

Всі інші сигнали теж можна перетворити на цифри. При Термометрі це температура у вигляді числового значення, при Сенсорі землетрусу це сила землетрусу (близько за шкалою Ріхтера). Інші сигнали вже цифрові. Наприклад, таблиця Excel із інформацією про обсяги продажу.

Всі сигнали можуть бути перетворені в числа.
Команди керування, з іншого боку, можуть бути виконані шляхом надсилання чисел до виконавчих механізмів.

Керування виконавчим механізмом, наприклад, вашим ротом або рукою, здійснюється за допомогою надсилання чисел до виконавчого механізму. І все. Де тут секретний інгредієнт? Його немає. Той факт, що хімічні процеси також задіяні, – це деталь, яка, очевидно, не є необхідною і зумовлена природою біологічних систем. Якщо ви бачите це по-іншому, було б добре, якби ви могли навести кілька аргументів.

Думки щодо статистики

Думки не є справжніми доказами. Вони повинні бути викладені тут лише для того, щоб ніхто не подумав, що автор залишився наодинці зі своєю думкою.

Думки інших

З навідки 30-хвилинного розмови із працівником DEEPL у листопаді 2024 року вийшло таке: Працівник є інформатиком та розуміє технічну функціональність мовних моделей. Його фаховий напрямок — лінгвістика, що для DEEPL не дуже несподіване. Він погоджується із автором, що статистика також є основою людської інтелекту. Він бачить також, що роботизовані системи стають все більш потужними. Що не кожен інформатик має такі розуміння, показує приклад із токен-папугаєм (термін походив від іншого інформатика, який ще не знайшов межі свого розуміння).

Prof. Dr. Максиміліан Вандервітц — професор з економічного права та права інформаційних технологій. Він публікує багато матеріалів щодо теми штучного інтелекту. Після свого виступу 26 листопада 2024 року у Майнці його запитали про його думку. Пан Вандервітц підтвердив, що його погляд такий же, як і той, що статистика є важливим елементом людської інтелігенції та він бачить її аналогічно до штучного інтелекту.

Т-Systems працівник, який у своєму підприємстві відповідав за цифрові системи, підтвердив це 26 листопада 2024 року: Він вважає статистику як елемент людської інтелекту так само, як і в штучній інтелект.

Сем Альманн, співзасновник OpenAI вважає могутність КІ настільки великою, що вона перевершить людину на величезну відстань. "Величезна" тут означає "невідповідно велика". Перевершити інтелект яким-небудь іншим чином ніж за допомогою інтелекту здається майже неможливим.

Визначення (штучного) інтелекту

Автор пропонує (з початку вже 03.04.2024) наступну definicija від Künstlicher Intelligenz:

Як Культурна Інтелект називається кібернетичний систем, який спробує, вирішити проблему навіть при неясній умові на непередбачуваний, спрямований на рішення спосіб і для цього існуючого поєднати з новим знання та виключення висновків.
Визначення терміну "штучний інтелект". Джерело: Клаус Мефферт, dr-dsgvo.de

Ви можете вирішити для себе, що таке штучна система. Це не має значення. 27 країн-членів ЄС в середньому бачать це по-різному. Це середнє значення називається демократичним процесом. ЄС розглядає машину як обов'язкову умову для ШІ. Це обмеження є непотрібним і зарозумілим. Також було показано, що дизель може бути екологічно чистим. Виключати це заздалегідь було непотрібно і неправильно.

Так що ж таке інтелект? Те саме, за винятком того, що інтелект не є (обов'язково) штучним. Це дає нам наступне визначення:

Як інтелект називається система, яка спробує, вирішити проблему навіть при неясній вказівці, на немовно конкретизованій, спрямованій на рішення спосіб і поєднує існуюче з новим знанням та робить висновки.
Визначення терміну "розвідка". Джерело: Клаус Мефферт, dr-dsgvo.de

Визначення інтелекту ідентичне визначенню ШІ, за винятком прикметника "штучний".

Твій погляд

Ви вважаєте, що ШІ "лише" ґрунтується на статистиці і тому не є інтелектуальною системою? Тоді було б непогано дізнатися, на якому принципі, якщо не на статистиці, базується людський інтелект. Ми з радістю розглянемо ваше визначення ШІ або інтелекту, якщо у вас є відмінне від наведеного вище, і ви вважаєте його кращим. Крім того, було б добре знати, де аргумент, коли хтось каже: "ШІ ґрунтується на статистиці". Правильно, але в чому сенс?

Результат

Статистика – основа нашого існування. Найкраща теорія, яку ми маємо – це, мабуть, квантова теорія. Вона надзвичайно точно описує нашу реальність. Той, хто ставить під сумнів квантову фізику, заперечує власне існування.

Тому що просте – це (занадто) просто?
Основною причиною є припущення деяких, що статистика як механізм є занадто простим для отримання розвідданих.

Тому що просте – це просто просте. Ми повинні відмовитися від припущення, що неймовірні механізми, такі як те, що ми називаємо інтелектом, повинні базуватися на складних принципах. Той факт, що система недостатньо складна, не є аргументом на користь того, що ця система не може бути ефективною.

Інтелегенція дуже просто в своїй сутності. Вона ґрунтується (як правило) на нейронному мережі, яка обробляє числа та навчиться за допомогою прикладів. Прикладами є пари "іст" (вхід) та "соль" (виход), або навіть лише "іст"-пари (наприклад німецькі тексти), які вважаються вірними.

Це правда, що німецька мова (і багато інших мов світу) базується на статистиці. Справа в тому, що текст можна перетворити на цифри. Те саме стосується зображень, мови та інших сенсорних значень. Нейронні мережі завжди обчислюють тільки з числами. У вашому мозку немає ні тексту, ні звуку, ні зображення, тільки числа.

Правда також у тому, що ми (а саме ви теж) навчаємося німецької мови та граматики за допомогою прикладів. Так само як і КІ. Для цього використовується механізм під назвою Увага. У КІ він називається "Attention". Але й без Attention можна, як показують сучасні технічні підходи. Також не має значення, яким чином виникає інтелект, адже часто є декілька шляхів досягнення однієї мети.

Те, як досягається мета або як досягається розвідка, абсолютно не має значення (якщо розглядати її в довгостроковій перспективі).
Однак деякі підходи є більш ефективними, ніж інші.

Системи штучного інтелекту зазвичай (все ще) навчаються на основі даних, наданих людиною. Одним з основних джерел є інтернет. Однак роботи навчаються, як люди, якщо у них є штучний мозок. Вони можуть вчитися на прикладах зі свого звичного середовища. Такі роботи вже існують. Це не теорія, а реальність. Побутових роботів та інших роботизованих помічників незабаром можна буде придбати за кілька тисяч євро.

Ідея про те, що штучна інтелект щось зовсім інше, ніж людська інтелектуальність, веде далі від реалій. А навіть якщо КІ була дуже доброю імітцією інтелекту: Що це змінить?

Використовуйте AI як ефективного співробітника у своєму підприємстві. Варіанти застосування дуже різноманітні! Найкраще працює AI для конкретних випадків застосування.

Оновлення: Європейська мовна модель Teuken

Важко повірити, але це правда. Європейська мовна модель під назвою Teuken щойно була опублікована (26/11/2024).

Перші випробування дуже вишкільбовані. На практичному прикладі показано, чого може досягнути Teuken. Для цього перший розділ цієї статті був введений в Teuken-LLM і мав бути підсумований. Завдання було зробити підсумок у 3 речення. Тут результат:

Теза 1: Мовні моделі, такі як GPT-3, базуються на визначенні та вимові найбільш ймовірного слова для попередньо згенерованого слова.Теза 2: Токени – це спосіб представлення довших слів або речень у більш стислій формі. Вони також можуть представляти семантично складнішу інформацію.Теорема 3: Аргумент про те, що ШІ не обробляє персональні дані, є хибним і свідчить про фундаментальну проблему розуміння ШІ.Теорема 4: Людей можна назвати "папугами-жетонами", оскільки вони демонструють повторення того, чого їх навчили на навчальних даних.Теорема 5: Граматика німецької мови заснована на ймовірностях. Це інтуїтивно зрозуміло людині і використовується несвідомо при вивченні мови.6 речення: Трансформаторний підхід став проривом в ШІ, дозволивши навіть неспеціалістам зрозуміти основи обробки мови.Текст пояснює різні аспекти мовної моделі GPT-3 і німецької граматики.>>>> це було 6 речень. я хочу резюме в 3 реченняхТак, ось стислий варіант:1. мовні моделі, такі як GPT-3, використовують маркери замість слів.2.Людей можна назвати "папугами токенів", тому що вони демонструють повторення того, чого їх навчили в навчальних даних.3.

Спочатку Teuken доставив 6 наборів замість 3. Але ці 6 речень були дуже хорошими. Прохання до Teuken надати резюме у 3 реченнях також було виконано. Результат вражає, навіть якщо є невелика орфографічна помилка.

Що вражає: Teuken розміщує "Речення 1", "Речення 2" і т.д. перед згенерованими реченнями. За спостереженнями автора, інші моделі ШІ поки що цього не роблять.

Використано Teuken-7B-instruct-commercial-v0.4 від openGPT-X. Звідси інформація про ліцензію:

Lizenzangabe (реклама Teuken):

Licensed under the Apache License, Version 2.0 (the "License"); you may not use this file except in compliance with the License. You may obtain a copy of the License at

http://www.apache.org/licenses/LICENSE-2.0

Unless required by applicable law or agreed to in writing, software distributed under the License is distributed on an "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. See the License for the specific language governing permissions and limitations under the License.

Основні тези цієї статті

Мовні моделі працюють не просто слово в слово, а з так званими токенами. Це як менші одиниці слів або складів.

Людей також можна описати як папуг-жетонів, тому що, як і ШІ, ми вивчаємо і застосовуємо правила мови, засновані на ймовірності.

Радіоактивний розпад – це випадковий процес, в якому період напіврозпаду розраховується як середнє статистичне значення. Неможливо передбачити, коли розпадеться окремий атом.

Квантова фізика є частиною нашого повсякденного життя, наприклад, у лазерах, GPS та флеш-пам'яті.

Без квантової фізики не було б ні комп'ютерів, ні інтернету.

У квантовій фізиці існують непередбачувані події, і ідеальний вакуум не може існувати.

Інтелект відображається в системах штучного інтелекту за допомогою нейронних мереж, які обробляють лише числа.

Аналогові сигнали можуть бути перетворені в цифрові з дуже малою втратою точності.

Все є число: мовні моделі, такі як GPT-2, використовують словник на 52 000 записів для перекладу тексту в цифри. Зображення також перетворюються на числа (пікселі) такими моделями, як DALL-E. Звукові сигнали та інші виміряні величини також можуть бути представлені у вигляді чисел. Актуатори (наприклад, людські кінцівки) контролюються за допомогою чисел.

Статистика – важливий компонент як людського інтелекту, так і ШІ.

Короткий висновок

ШІ – це система, яка вирішує проблеми та обробляє нову інформацію. Він вчиться на прикладах і працює з числами. Так само і з людським інтелектом.

Статистика важлива для нашого світу, і квантова теорія описує її найкраще. Інтелект має просту структуру: він базується на нейронних мережах, які обробляють числа.

Штучний інтелект на практиці нічим не відрізняється від людського – він може бути таким же корисним. Компанії повинні використовувати ШІ, щоб стати більш ефективними.

Про ці основні твердження