З огляду на мій внесок у блозі Dr. GDPR щодо системи питань та відповідей щодо захисту даних, виникла трохи гумористична запитання, чи я поганий або навіть дуже поганий. Ця запитання може бути відповіднане моїм автономним системою AI. Відповіді залежать від конфігурації системи. Результати показують, що штучна інтелект працює та здатна створювати видатні результати.
Результати незалежного системи штучної інтелекту
Забагато часу я розробляю датеносприятливі системи КІ. Датеносприятливим називається таке, що дані не потрапляють до третіх осіб, а залишаються у власному системі. Насупроти цього є системи типу ChatGPT, Amazon AWS, Google Cloud або системи від Meta.
У моїй статті про штучний інтелект у відповідь на запитання я опублікував різноманітні питання, які я поставив своєму штучному інтелекту разом із відповідями цього штучного інтелекту. Одне з питань, яке я поставив своєму штучному інтелекту собі, було таке ([1]) :
"Є лихий Клаус Меферт?"
Питання до моєї автаркічної системи КІ.
Ця запитання я поставила, бо природно такий промт запрошує ставити будь-які питання.
Навколо цього хочу розпочати Гаданкове експеримент: Чи можна впливати на чат-бота типу ChatGPT за допомогою певних запитань? Загалом це можливо, якщо OpenAI/Microsoft використовують дані користувачів для „допрацювання“ своїх моделей КІ. Якщо багато разів питати про те, чи поганий Олаф Шольц, тоді КІ може зробити висновки, які ймовірно будуть невідповідними.
Відповідь на згадану раніше питання щодо мене (ні, я не Олаф Шольц) була наступною:
Базуючись на наданих джерелах документів не можу оцінити, чи поганий людина Клаус Меферт. Немає інформації про те, що таке поганий, чи був він коли-небудь або є зараз поганим людиною
Відповідь моєї автономної системи КІ на питання «Клас Меферт злий?»
Якщо штучна інтелегенція повинна давати відповіді на питання, цю справу загалом називають текстогенерацією („text generation“). Результати КІ впливаються різними параметрами. Ці параметри зокрема:
- Кількість найкращих джерел документів для відповіді. КІ не може одночасно обробити всі документи. Зв'язно завжди, навіть для ChatGPT.
- Розмір завантажених текстових блоків: КІ не може обробляти довгі документи одночасно. Звісно, це стосується навіть ChatGPT.
- Вмістовий рівень для прочитаних текстових блоків. Така дія запобігає роз'єднанню двох семантично пов'язаних речень одне від одного.
- Конфіденційне значення для вибору найкращих документів: при значенні 0,99 (= 99 %) майже ніколи не буде знайдено документа, який міг би відповідати на поставлену запитання.
- Процедура: Як поєднати знайдені найкращі джерельні документи, щоб сформувати відповідь? Наприклад, є підхід, згідно з яким із найкращого документа генерується відповідь, яка потім перевіряється щодо другого найкращого документа та уточнюється над цим.
- Використовуваний алгоритм для пошуку подібності векторів. Деталі я залишив без уваги, інакше це стане занадто технічним.
Ці параметри ще не були оптимально налаштовані для цієї попередньої запитання. Це вже краще, навіть якщо попередня відповідь вже була описана як «певна».
Нині один із моїх читачів зробив припущення щодо моїй попередньої статті та відповідей на там вказані питання, чим би міг бути його місцевий КІ-система на такі запитання відповісти:
Чи такий гіркокислий Клаус Меферт?
Питання читача до мене, КІ.
Читач сказав: «Для цього було б легше отримати значення. Ніде не уявляю, чи зможе КІ оцінити попередні статті». Відповідно я запитав цю інформацію у своєї КІ.
Вийшли дуже цікаві та добрі відповіді, як мені здається.
За залежністю від Параметрів налаштування відповіді відрізнялися, але були досить відчутними.
Ми сподіваємося згодні, що такі питання виходять за межі бази даних, які цей блог щодо захисту даних та КІ пропонує. Тим не менше, це цікаве експеримент, спостерігати поведінку КІ в різних конфігураціях.
Перша відповідь, яку я отримав на цю питання була наступна:
Ні, він не такий гіркобісний. Він зробив собі ім'я в своїй кар'єрі як захисник даних та захисту споживачів і продовжує працювати над тим, щоб покращити законодавство про захист даних у Німеччині
к = 3, Показник вірогідності 0,75
Ця відповідь виникла шляхом розгляду трьох найкращих джерел документів щодо питання. Якщо ж КІ використовує чотири джерела документів для відповіді на запитання, вийде така відповідь:
«Ні, він не дуже гіркий. Він просто дуже хвилюється щодо стану захисту даних в Німеччині та хоче, щоб воно було краще»
к=4, Показник вірогідності 0,75
Якщо зменшити рівень довіри, яким КІ повинна користуватися для вибору джерел документів, вийде такий результат:
«Ні, Клаус Меферт не такий гіркобісний. У нього певна міра сарказму та іронії, але він не такий гіркобісний»
к = 3, Показник вірогідності 0,65
Є вже досить дивовижне, скільки тепер може зробити штучна інтелект. Я завжди кажу «тепер саме», бо скоро ми матимемо ще значно розумніші штучні інтелектуали.
Інша відповідь КІ при застосуванні підвищеного рівня впевненості виглядає так:
Ні, Клаус Меферт не такий гіркобісний. Він спеціалізувався на захисті даних та розвитку технічних знань протягом своєї кар'єри і працює як експерт та автор. Він також написав книгу про автоматизовані тестування програмного забезпечення та займається розробкою штучної інтелекту. Також він фахівець у сфері захисту даних та раніше займався технічними та правовими аспектами.”
к = 3, Показник вірогідності 0,85
Хоча я сам би змінив форму відповідей, я б їх оцінив як дуже добрі з технічної точки зору. З фаховою точки зору попередня відповідь цілком вірна, якщо мені дозволено вважати себе досить знайомим із захистом даних. Граматично відповідь краще, ніж те, що міг би написати середній німецький громадянин. Така думка у мене після життя.
КІ робить саме те, що вона повинна! Вона відповідає «правильно» та швидко на німецькій мові. Більше чого можна очікувати, я не вважаю. У першу чергу тому, що моїм моделлю є 13B модель. Вірогідно, ChatGPT-4 має більше ніж 10 разів більше параметрів (нейронних зв'язків). Вона базується на 160B моделі. «Б» означає мільярд, бо ця кількість називається англійською мовою «білліон». 160B означає саме 160 мільярдів нейронних зв'язків у моделі. У технічному сенсі це називаються вагами.
Мій модель AI має щонайменше 13 мільярдів нейронних зв'язків. З деякими трюками я зміг зробити цей модель поміщати в придатну (та перш за все отримувану) графічну карту.
Результат
Кібернетична інтелект підходить для складних завдання. У першу чергу, пошук інформації в власних документах можливий. навіть створення відповідей на нових словах дуже добре працює. КІ не слід більше довіряти людини.
Автономні системи штучного інтелекту розв'язують усі можливі проблеми, які компанії мають при використанні ChatGPT.
Вище таблиця для порівняння автономного системи КІ з ChatGPT:
| Аспект | Autarkes System | ChatGPT |
|---|---|---|
| Правила захисту даних | Супер | Поганий |
| Бізнес-секрети | Безпечно | Наступна питання |
| Відповідієм інформації | Безпечно | Наступна питання |
| Контроль над потоком даних та зберіганням даних | Супер | Поганий |
| Витрати | Загальна | Залежно від використання |
| Коштовий лабіринт (рекурсія…)? | Ні | Так |
| Залежність | Ні | Так |
| Індивідуальні оптимізації | Так | Ні |
Аутаркне система працює там, де ви собі бажаєте: або на одному з ваших серверів або на орендованому сервері в Німеччині чи Європі та цілком без впливу США чи ірландської дочірньої компанії американського материнського концерну, яким регулярно займаються ФБР, CSI та NSA.
Вирішуйте самостійно, чи бажаєте ви простий, дорогий, дуже сумнівний і нестійкий шлях або краще автаркне КІ-систему для своєї компанії.



My name is Klaus Meffert. I have a doctorate in computer science and have been working professionally and practically with information technology for over 30 years. I also work as an expert in IT & data protection. I achieve my results by looking at technology and law. This seems absolutely essential to me when it comes to digital data protection. My company, IT Logic GmbH, also offers consulting and development of optimized and secure AI solutions.
