Drücke „Enter”, um zum Inhalt zu springen.
Hinweis zu diesem Datenschutz-Blog:
Anscheinend verwenden Sie einen Werbeblocker wie uBlock Origin oder Ghostery, oder einen Browser, der bestimmte Dienste blockiert.
Leider wird dadurch auch der Dienst von VG Wort blockiert. Online-Autoren haben einen gesetzlichen Anspruch auf eine Vergütung, wenn ihre Beiträge oft genug aufgerufen wurden. Um dies zu messen, muss vom Autor ein Dienst der VG Wort eingebunden werden. Ohne diesen Dienst geht der gesetzliche Anspruch für den Autor verloren.

Ich wäre Ihnen sehr verbunden, wenn Sie sich bei der VG Wort darüber beschweren, dass deren Dienst anscheinend so ausgeprägt ist, dass er von manchen als blockierungswürdig eingestuft wird. Dies führt ggf. dazu, dass ich Beiträge kostenpflichtig gestalten muss.

Durch Klick auf folgenden Button wird eine Mailvorlage geladen, die Sie inhaltlich gerne anpassen und an die VG Wort abschicken können.

Nachricht an VG WortMailtext anzeigen

Betreff: Datenschutzprobleme mit dem VG Wort Dienst(METIS)
Guten Tag,

als Besucher des Datenschutz-Blogs Dr. DSGVO ist mir aufgefallen, dass der VG Wort Dienst durch datenschutzfreundliche Browser (Brave, Mullvad...) sowie Werbeblocker (uBlock, Ghostery...) blockiert wird.
Damit gehen dem Autor der Online-Texte Einnahmen verloren, die ihm aber gesetzlich zustehen.

Bitte beheben Sie dieses Problem!

Diese Nachricht wurde von mir persönlich abgeschickt und lediglich aus einer Vorlage generiert.
Wenn der Klick auf den Button keine Mail öffnet, schreiben Sie bitte eine Mail an info@vgwort.de und weisen darauf hin, dass der VG Wort Dienst von datenschutzfreundlichen Browser blockiert wird und dass Online Autoren daher die gesetzlich garantierten Einnahmen verloren gehen.
Vielen Dank,

Ihr Klaus Meffert - Dr. DSGVO Datenschutz-Blog.

PS: Wenn Sie meine Beiträge oder meinen Online Website-Check gut finden, freue ich mich auch über Ihre Spende.
Ausprobieren Online Webseiten-Check sofort das Ergebnis sehen

Кібернетична інтелект: Право використання, яке немає

0
Dr. DSGVO Newsletter detected: Extended functionality available
More articles · Website-Checks · Live Offline-AI
📄 Стаття у форматі PDF (тільки для передплатників новин)
🔒 Premium-Funktion
Der aktuelle Beitrag kann in PDF-Form angesehen und heruntergeladen werden

📊 Download freischalten
Der Download ist nur für Abonnenten des Dr. DSGVO-Newsletters möglich

Німецький законодавець визначив у § 44b УРГ можливість для авторів захистити свої матеріали від кібер-краулінгу, але ця можливість відсутня і призводить до подальшої нищечі німецької мови в моделях мовних технологій. Наша вітчизняна економіка страждатиме від цього.

Вступ

Уміст вебсторінок, з публічно доступних PDF-документів та інших подібних документів можуть бути прочитані та використовувані для цілей обробки даних за допомогою штучної інтелекту, зокрема для чатботів, навіть тимчасово збережені для навчання КІ. Це дозволяє згідно з § 44b UrhG.

У цьому місці також вказується, що читання вмісту для мовних моделей КІ не повинно бути дозволено, якщо автор встановлює умовний використовуваний обмеження, яке можна прочитати машинами. Я вважаю генеративні моделі КІ за "дата-майнинг" згідно зі статтею 44б Уголовного кодексу Німеччини. Більше про це в майбутньому статті, оскільки тут здається, що є інші думки щодо цього питання. Відповідно до цієї статті проблема полягає у тому…

Цей тип використання умовного права немає, як я спробую показати. Окрім чатботів існують інші дуже цікаві та актуальні застосування штучної інтелегенції. До них належить аналіз даних, автоматичне висновування або отримання знань за допомогою комп'ютера. Поки німецька мова буде ще більш безвпливною, усі інші у світі зможуть отримувати автоматичні пізнання та винаходи, а ми в Німеччині зможемо тільки тоді, коли не спілкуватимемося з системами штучної інтелегенції німецькою мовою.

Що означає "машинночитаний"?

Машинно-читабельним є згідно з підставою 35 директиви ЄС 2019/1024 документ, "якщо він знаходиться у форматі файлу, який організований таким чином, що програми для комп'ютера можуть легко ідентифікувати, розпізнати та виводити конкретні дані. …"

Якщо хто-небудь завантажує вміст вебсторінок для застосування КІ ("Crawler"), згідно з бажанням німецького законодавця, йому потрібно довести, що жодна умовність використання не була вказана у інформаційній сторінці або умовах користування сторінки.

Цей доказ: лише ручний, тому автоматизм, який необхідний для застосувань КІ, не працює.

Машинно-читима, звичайно, є файл robots.txt. Він регулює, які крейтери можуть прочитати вміст, а саме для формування suchmaschinen.

Німецький законодавець бачить це інакше. Він розуміє під "машинно-читабельним" щось, що мене змусило здогадуватися, що німецькому законодавцю або були дуже наївні та некомпетентні радники, або він не звернув увагу на їх поради.

Німецький законодавець, здається, вважає дані в Імпресум або АГБ машинночитаними. Див. Доклад 19/27426 німецького парламенту щодо проєкту закону § 44b УРГ (там: С. 89, абз. 2), жирний шрифт від мене:

"Навколовідповідний умов має бути відкрито оголошено та здійснено у такий спосіб, який відповідатиме автоматизованим процесам при обробці тексту та даних з метою їхнього видобутку. У разі доступності робіт онлайн умови виключення будуть чинити дію лише тоді, коли вони виконуються у машинно-читабельній формі (порівняти із ErwG 18 Підпункт 2 Додаток DSM-RL). Він також може бути міститися в інформаційному листі або загальних умовах бізнесу (AGB), якщо він також є машинно-читабельним."

Я кажу, що це європейське законодавство порушує, але я не хочу перешкоджати юридичному дискурсу. Тут слід зауважити, що згідно моїх відомостей у Німеччині дозволено укладати навіть неможливі договори. Це було б таким прикладом.

Як погані радники, свідчить вебсайт відомого німецького юридичного послуги. Там у розділі "Контакти" добросовісно оголошується про використання згідно зі ст. 44b Уголівного кодексу Німеччини. Ця заява також знаходиться як неофіційний коментар в robots.txt файлу вказаної вебсайту.

Наче ж, у файлі з роботами забули згадати про найвідомішу КІ-систему (ChatGPT) та другу за відомістю систему (від Google), виключивши їх простими технічними засобами.

Вище всього просто дуже просте.

Вказаний правовий сервіс має достатні ресурси для оплати консультантів.

Я бачу у німецькому законодавці справі зокрема особливе партійне питання, а не одне із процесу законодавства в цілому. Хто вже коли-небудь побачив консультацію німецького Бундестагу або політичних фахових комісій на рівні країни в телевізорі, може знати, про що я говорю. Тут головне:

  • Експерти не наважуються сказати правду.
  • Експерти не експерти.
  • Експерти мають лише трохи часу на свої відповіді.
  • Експерти можуть відповідати лише на поставлені запитання, але не повинні далі мислити.
  • Весь захід триває лише короткий час.
  • Відповідь експертів часто зрозуміла лише для півекспертів, а не для політиків, які хочуть все розуміти і вважати за необхідне.
  • Є неподібне, нещирі правди говорити, і хто хоче вже порушувати позитивні хвилі?

Проблеми над проблемами

Представлені вимоги німецького законодавця є брехнею з декілька причин. Причини провалу німецького законодавця:.

Відбиток і AGB не можна розпізнати з упевненістю

Імпресум та сторінка з АГБ не можуть бути швидко автоматизовано виявлені. Зокрема, це відбувається ненадійним чином. Це повинно було відбутися. Поки що ні одне підприємство зі штучного інтелекту більше не буде довіряти німецьким вебсторінкам для застосувань зі штучним інтелектом. На сторінці, яку згадується вище, на сторінці 89 також написано: "Безпека доказу щодо відсутності обмеження використання несумісного користувача [=Crawler].".

Я розмовляю з досвіду. Ім'я видавця – це сторінка, як будь-яка інша сторінка вебсайту. Страница з умовами користування теж є нею, але часто вона знаходиться у форматі PDF. Хто тільки один раз займався завантаженням PDF і автоматичним виділенням тексту із нього, той знає: це не просто.

Інформація про авторів та умови використання сторінки НЕ можуть бути надійно розпізнані.

Говорить фахівець, який вже багато вебсторінок прочитав з допомогою крейлерів.

Умови використання та інформація про власника повинні, можливо, навіть не читатися

Якщо кроулер використовує Глибокий посилання, щоб завантажити документ (наприклад, PDF), то часто він не читає додаткові сторінки вебсторінки. Він повинен це робити, щоб знайти інформацію про ім'я видавця та умови використання.

Але ще гірше буде.

Штучний інтелект дурний

Краулер — це краулер. Зазвичай немає штучного інтелекту. Цей штучний інтелект повинен виникнути лише після того, як достатньо даних для навчання будуть наявні. Краулер повинен надавати ці дані навіть раніше.

Нав'язливий та глупий аргумент деяких людей, сьогодні можна було б все зрозуміти програмно, справді дуже глупий або наївний. У кінцевому підсумку це означало б, що треба брати в оренду ChatGPT, щоб відправляти всі можливі дані туди і запитувати у нього за гроші: "Де знаходиться інформація про авторське право?" або "Є ли там умову використання?" або "Тепер нам потрібно обов'язково перевірити умови користування, люба ChatGPT, але будь ласка, не зберігаєть даних, бо треба ще визначити, чи є умову використання."

Аналогія була б (мірно нічого краще мені не спадає): Ви мають термін у дві години в місці, яке розташоване за 500 км повітряної лінії від вашого поточного місця перебування, де ви теж потрапили до терміну. Ви приїжджаєте пізно і отримуєте за це догану, оскільки ви могли б взяти вертоліт. Вертоліт відповідає тут ChatGPT, тільки що вертоліт має менше вразливостей щодо конфіденційності.

КІ-краулер такий же глупий, як ті, хто вважає, що будь-який німецький речення можна інтерпретувати та зрозуміти за допомогою програми.

У соціальній мережі одна жінка вказала свій умовний згоджувальний запис щодо КІ-сканування наступним чином: «Всі дані використовуються лише для отримання інформації в людських нейронних мережах»

Я дуже сумнівався, що крейсер зможе це зрозуміти. Так само я сумніваюся, що мовний модуль зможе це зрозуміти. І ще більше мене хвилює те, що більшість людей цього не розуміють.

Дилема

Новина: Кроулер – це кроулер. Кроулер читає вміст і зберігає його. Довго. Все, що далі відбувається, роблять інші компоненти програмного забезпечення.

Краулер, який читає вміст для Серпня, повинен і має лише дотримуватися файлу robots.txt та умов використання, які там вказані.

Той же веб-скаванер повинен бути здатний виконувати багато іншого згідно бажання німецького законодавця після того, як вміти використовувати зміст лише для навчання моделей штучного інтелекту. Веб-скаванер повинен вміти не тільки розуміти дуже просту robots.txt файл, який завжди знаходиться в одному місці на кожній сторінці. Ні, той самий веб-скаванер повинен виконувати ще багато іншого:

  1. Вебсайт продовжує завантажувати вміст далі, ніж можливо було заплановано, щоб виявити місце розташування інформації про видавця та умови використання.
  2. Правила використання.
  3. Текст з інформаційної сторони виводити.
  4. Аналізувати текст Рот і спробувати зрозуміти.
  5. Нічого не знайдено щодо обмеження використання, тоді перейти до Лотереї (Шаг 6)
  6. Умови використання завантажити
  7. Якщо PDF: встановити PDF-читач. Надіяюся, що умови використання без приміток і найкраще в одній колонці.
  8. Використовувати текст з умов використання.
  9. Аналізувати текст Рот і спробувати зрозуміти.
  10. Немає обмеження щодо використання, тоді перейди на Лотерею (Шаг 11).
  11. Надійне та перевірене правовим шляхом збереження даних
    • Сторінка з інформацією про видавництво
    • Страница умов використання
    • Сторінка, за якої сторінки для інформаційної сторінки та умов користування були визначені.

Велика радість і, перш за все: великий успіх!

Рішення

Рішення потребує три конвенції:

  1. Назва конвенції (URL): Тут знаходиться файл, в якому вказаний умовний використовуваний ліцензійний договір.
  2. Конвенція структури (світло): Така є організація файлу
  3. Назвова конвенція (Зміст): Так називаються параметри, які виражають умови використання. Можливо бути загальним умовою використання, але також і спеціальним (для окремих ІІС).

Діючий стан відомої та перевіреної robots.txt файли задовольняють усі ці вимоги. Відсутнє лише одне умовне положення щодо загального використання. Ця умова повинна бути зроблена лише один раз, щоб стати звичаєм. Досить добре. Витрачає мені 10 секунд часу (дивіться нижче), тому це не інтелектуальна висота.

Натомість місця, вказані німецьким законодавцем помилково, виконують усі три конвенції НІКАРЕ:

  1. Немає чіткого місця розташування інформації про видавця та умов користування на вебсторінці. Умови користування часто відсутні.
  2. Ім'я видавця організовано дуже хаотично. Що до умов використання як правового тексту, навіть про це не хочемо говорити.
  3. Вид 2: Імпресум вмістовується хаотично, АГБ аналогічно.

Німецький шлях є таким Ірвейком. Німецька регулювання щодо використання умовного права проти КІ-сканування обречене на провал. Воно також забезпечує те, що німецька мова в світі штучної інтелегенції буде занепадати, або тільки великі компанії зі штучною інтелегенцією зможуть собі дозволити не дотримуватися німецьких правил. Дякуємо, Німеччина.

Чи чому німецька мова добре в мовних моделях?

Чат-боти в формі, якими користується приватний користувач, не є проблемою, якщо ні про що чутливих даних немає. Для цього існує ChatGPT та подібні речі.

Для інтелектуальної пошукової системи пошуку документів вже існують добре розроблені мовні моделі, які навіть працюють локально. Добре для тих, хто вже збережений місцеві LLMs. Поки світ дізнається про німецький помилковий шлях, новіші версії мовних моделей будуть містити менше німецьких текстів.

Вперше всього ж для машинного висновку мовні моделі дуже цікаві, актуальні та економічно дуже важливі. Також дослідники радіють новим відкриттям, які без мовних моделей КІ не було б. Наприклад, ось приклад можливостей, яких вже тепер можна досягти.

Наприклад, це дано німецькою мовою. Воно працюватиме так із вільними мовними моделями у майбутньому тільки тоді, коли німецька помилка не викликає страху. У іншому випадку ви змушені будуть виражати все англійською, іспанською, бенгальською або іншою дуже важливою мовою. Прошу про вибачення за більшу проблему для вас. Дякуйте німецькому законодавцю.

Визначте компанії, які торгуються на біржі та виробляють продукти, що мають значення для застосування штучної інтеллекту. Визначте конкурентів цих компаній. Знайти всі ці компанії також їх постачальників, які особливо цінні частини поставляють. Цінні є частини, за якими існує лише кілька виробників у світі. Знайти найбільш прибуткові компанії серед цих та назвати їх разом із продуктами, які вони виготовляють.

Приклад вигаданого змісту, який у реальності був би сформульований інакше.

Загалом так само, як у прикладі вказано, працює машинне висновування ("Reasoning"). За допомогою сучасних відкритих джерел можна розбити питання на окремі завдання, виконати їх поодинці, поєднати результати та отримати остаточну відповідь. На такий спосіб досліджень були здобуті нові знання в галузі матеріалознавства під назвою MechGPT. Це відбулося головним чином завдяки вивченню наукових досліджень (у англійській мові!) та знаходженню зв'язків між ними. Результатом було отримання нових відкриттів, які раніше були розкидані по окремих англійських статтях. Кошмарно, що німецька мова все більше втрачає своє значення.

Висновок

Німецький законодавець дурний. Всі ті, хто вважає § 44b УРГ актуальним і здійсненим, є наївними або дурними або хочуть висловити своє ставлення до речей, про які краще мовчати.

Ви не зможете виконувати німецькі тексти в моделях мовних інтерфейсів за допомогою штучного інтелекту, оскільки § 44b УРГ не здійснився і власник крейлера повинен буде довести, що зробив усе правильно. Чат-бот є лише добре, як дані, які він отримує під час навчання. Німецька мова в майбутньому буде розташовуватися у кам'яну добу. Якщо ви плануєте аналізувати тексти інтернету за допомогою штучного інтелекту (наприклад, для передбачення ринку акцій), краще пишіть усе англійською, китайською або бенгальською мовою.

Повість про КІ: Ніяке ефективне мовне моделювання КІ не зможе бути добре без захисту авторських прав даних. Ніяке чудове мовне моделювання штучного інтелекту не є законним.

Огляді автора, станом на 09.07.2024

Рішенням буде: у файлі robots.txt потрібно встановити умову використання проти сканування КІ.

Цей підхід вже існує фактично, оскільки компанії як OpenAI або Google вже повідомляють про те, як можна встановити умову використання в robots.txt. Тут конкретні приклади з практики:

Nutzungsvorbehalt gegen KI-Crawler, ungleich der Vorgabe des deutschen Gesetzgebers.

Ця файли знаходиться під адресою dr-dsgvo.de/robots.txt. Загалом: їх-вебсайт.de/robots.txt. Так просто.

Вже тому що просто треба бути дуже простим, а в Німеччині все має бути складним, німецький законодавець зробив щось просте якимось чином складнішим.

Проблема полягає в невідомих або ще зовсім не існуючих КІ-краулерах, запис для яких у robots.txt не відомий. Якщо ви хочете створити модель КІ, дуже малоймовірно, що ви зможете чи навіть захочете забезпечити те, щоб весь світ (або навіть Німеччина) знав технічну назву вашого КІ-краулера та яким чином умовність використання можна було спеціально сформулювати проти вашого КІ-краулера.

Можливою розв'язком може бути універсальний запис, наприклад такий:

AI-Agent *
Deny

Таким чином, було б оголошено заборону на використання для всіх КІ-роботів-парсерів, але не для пошукових систем. Імagination щодо конкретної реалізації немає ніяких обмежень.

Якщо майбутні пошукові системи будуть подібними до мовних моделей КІ або хоча б до векторних пошуку КІ, то це вже не матиме значення.

Мій порад: найкраще IGNORE використовувати умову використання і створити власні моделі мовної мови AI. Цієї ніхто не бачить ззовні. Крім того, можна їх так побудувати, щоб у відповідях не виникли проблеми із захистом авторських прав текстів та таким чином жодного питання не виникає.

About the author on dr-dsgvo.de
My name is Klaus Meffert. I have a doctorate in computer science and have been working professionally and practically with information technology for over 30 years. I also work as an expert in IT & data protection. I achieve my results by looking at technology and law. This seems absolutely essential to me when it comes to digital data protection. My company, IT Logic GmbH, also offers consulting and development of optimized and secure AI solutions.

Прагматичний підхід переважає правові та організаційні вимоги: два приклади