Drücke „Enter”, um zum Inhalt zu springen.
Hinweis zu diesem Datenschutz-Blog:
Anscheinend verwenden Sie einen Werbeblocker wie uBlock Origin oder Ghostery, oder einen Browser, der bestimmte Dienste blockiert.
Leider wird dadurch auch der Dienst von VG Wort blockiert. Online-Autoren haben einen gesetzlichen Anspruch auf eine Vergütung, wenn ihre Beiträge oft genug aufgerufen wurden. Um dies zu messen, muss vom Autor ein Dienst der VG Wort eingebunden werden. Ohne diesen Dienst geht der gesetzliche Anspruch für den Autor verloren.

Ich wäre Ihnen sehr verbunden, wenn Sie sich bei der VG Wort darüber beschweren, dass deren Dienst anscheinend so ausgeprägt ist, dass er von manchen als blockierungswürdig eingestuft wird. Dies führt ggf. dazu, dass ich Beiträge kostenpflichtig gestalten muss.

Durch Klick auf folgenden Button wird eine Mailvorlage geladen, die Sie inhaltlich gerne anpassen und an die VG Wort abschicken können.

Nachricht an VG WortMailtext anzeigen

Betreff: Datenschutzprobleme mit dem VG Wort Dienst(METIS)
Guten Tag,

als Besucher des Datenschutz-Blogs Dr. DSGVO ist mir aufgefallen, dass der VG Wort Dienst durch datenschutzfreundliche Browser (Brave, Mullvad...) sowie Werbeblocker (uBlock, Ghostery...) blockiert wird.
Damit gehen dem Autor der Online-Texte Einnahmen verloren, die ihm aber gesetzlich zustehen.

Bitte beheben Sie dieses Problem!

Diese Nachricht wurde von mir persönlich abgeschickt und lediglich aus einer Vorlage generiert.
Wenn der Klick auf den Button keine Mail öffnet, schreiben Sie bitte eine Mail an info@vgwort.de und weisen darauf hin, dass der VG Wort Dienst von datenschutzfreundlichen Browser blockiert wird und dass Online Autoren daher die gesetzlich garantierten Einnahmen verloren gehen.
Vielen Dank,

Ihr Klaus Meffert - Dr. DSGVO Datenschutz-Blog.

PS: Wenn Sie meine Beiträge oder meinen Online Website-Check gut finden, freue ich mich auch über Ihre Spende.
Ausprobieren Online Webseiten-Check sofort das Ergebnis sehen

Intelligence artificielle: fondements techniques et juridiques

0
Dr. DSGVO Newsletter detected: Extended functionality available
More articles · Website-Checks · Live Offline-AI
📄 Article au format PDF (uniquement pour les abonnés à la newsletter)
🔒 Premium-Funktion
Der aktuelle Beitrag kann in PDF-Form angesehen und heruntergeladen werden

📊 Download freischalten
Der Download ist nur für Abonnenten des Dr. DSGVO-Newsletters möglich

Comment fonctionne l'intelligence artificielle (IA) et pourquoi est-elle révolutionnaire à partir de maintenant ? Quels sont les conditions juridiques pour le traitement de données massives pour l'apprentissage d'un cerveau électronique ? Et comment se passent la sauvegarde des entrées utilisateur et la sortie d'images et de textes ? Extrait d'une de mes conférences.

Introduction

Qui peu comprend de l'intelligence artificielle utilise souvent des termes comme ChatGPT pour paraître intéressant. Beaucoup pensent que ChatGPT est une rechercheur. Spoiler: C'est complètement absurde. ChatGPT a un ensemble de données d'une antiquité selon les normes actuelles. C'est intentionnel et voulu. Car ChatGPT sert comme machine à réponse et non pour trouver des informations actuelles.

Qui comprend mieux l'intelligence artificielle et qui avait les yeux sur le marché des actions a acheté des actions Nvidia il y a quelques temps et peut depuis alors constater une augmentation gigantesque du cours. Car Nvidia est le fabricant de cartes graphiques qui sont considérées comme des champions sans égal pour les applications d'intelligence artificielle.

Je prédicte la chute du marché des actions dans sa forme actuelle, car bientôt tout le monde pourra prédire les cours d'actions avec une probabilité de plus de 50 %.

Ma théorie avec l'hypothèse selon laquelle cela me réussira bientôt.

Qu'est-ce qui se passe là ? Tout simplement: Une carte graphique comme la Nvidia Geforce RTX 3070 a 5888 noyaux dans sa GPU. La GPU est le processeur de la carte graphique. En revanche, la CPU, le classique processeur d'un ordinateur, n'a que 10 ou quelques noyaux.

Un noyau Intel est mathématiquement quelque chose comme un Albert Einstein (qui pouvait faire des calculs très bien en tant que physicien). Un cœur de processeur graphique Nvidia est un mathématicien moyen. Les algorithmes d'intelligence artificielle reposent par hasard sur des opérations arithmétiques qui sont particulièrement exécutables sur les processeurs graphiques (GPUs). Alors que le noyau Albert Einstein effectue une multiplication avec facilité et s'ennuie la moitié du temps, le mathématicien GPU est fortement sollicité mais arrive presque aussi vite à terminer cette opération arithmétique simple.

Malheureusement, 5888 mathématiciens travaillant en parallèle pour effectuer des multiplications simples nécessitent moins de temps que 10 Einsteins furieux travaillant simultanément. Pendant que le PC équipé d'une carte graphique a déjà terminé les calculs K, on pense que le PC purement Intel serait encore bloqué. On peut compter sur une augmentation de la puissance de la carte graphique d'un facteur 50 ou plus. La carte graphique n'est pas utilisée pour afficher des images ou des vidéos ou des jeux, mais uniquement pour calculer. C'est pourquoi on entend le bruit du ventilateur de la carte qui dépasse tous les ventilateurs de PC.

Tandis que la CPU de Villariba est encore en feu et qu'il n'a été déballé que 20 pour cent des produits, tout brille déjà à Villabaj.

Veuillez excuser le comparaison ridicule avec ces deux villages fictifs, qui sont connus de la publicité et dont on sait plus que des algorithmes d'intelligence artificielle actuels.

La carte graphique fait déjà une différence considérable pour les algorithmes qui doivent être entraînés pendant 10 jours d'affilée pour des tâches plus exigeantes, ou qui nécessitent 10 secondes sur une GPU pour générer une image, mais 8 minutes sur une CPU. Vous avez probablement déjà entendu parler de DALL-E ou Midjourney et savez que vous n'avez pas à attendre 10 minutes pour obtenir une image.

Fonctionnement d'une intelligence artificielle actuelle

Le système de l'intelligence artificielle comme ChatGPT repose sur des réseaux neuronaux artificiels. Un réseau neuronal se trouve également dans la tête ou le cerveau humain. Il fonctionne approximativement ainsi:

Fonctionnement global de l'intelligence humaine. (l'image a été traduite automatiquement).

La représentation est la manière dont les gens traitent des informations et comment l'intelligence se crée. On comprend à peu près autant de choses que ce qui est visible dans l'image, quant à savoir pourquoi il y a de l'intelligence du tout. Je soutiens qu'on ne sait rien là-dessus, mais on s'étonne seulement de la capacité des neurones avec leurs connexions à faire naître quelque chose comme l'intelligence. Spoiler: Cela n'a rien à voir avec Dieu, comme je vais le montrer bientôt.

Dans l'image ci-dessus, on voit à gauche une série de influences environnementales, c'est-à-dire des signaux. Cela peut être des bruits, des sons, des images fixes, des images animées, des odeurs, des mouvements d'air etc. Les chauves-souris connaissent bien l'ultrason. Au milieu se trouve notre cerveau qui capte et traite tous ces signaux. À droite on voit le réseau neuronal où les signaux sont traités et stockés.

Un Neurone est comparable à un simple noyau de processeur. Entre les neurones existent des connexions, et il y en a très nombreuses. Il s'agit de plusieurs milliards. Si un neurone se déclenche, c'est-à-dire s'il est actif, cela est déterminé par le potentiel d'action qui est généré par d'autres neurones connectés vers un neurone cible.

Nous allons maintenant à la mise en œuvre technique des algorithmes d'intelligence artificielle actuels.

Structure de base d'un algorithme de IA moderne. (l'image a été traduite automatiquement).

Vous pouvez voir les mêmes liens que ci-dessus chez l'homme.

Au milieu, vous voyez le cerveau électronique, plus haut il y avait l'humain.

À droite de l'image, on voit le réseau neuronal sous forme numérique, qui existe biologiquement chez l'homme et est donc plus analogue.

Alors loin, aussi égal. Mais ça va encore être plus égal. Les cerveaux d'électrons transforment grâce à l'approche du Transformer (connue depuis 2017) tous les signaux en séries de chiffres, vecteurs appelés. Exactement la même chose fait le cerveau humain. En tout cas, c'est qualitativement la même chose. Que des différences fines existent dans l'implémentation générale de la biologie et de l'électronique, cela est presque égal et ne sert qu'à améliorer légèrement les performances de la biologie par rapport à l'électronique. Vous connaissez probablement le Loi de Moore: Tous les 12 à 24 mois, la puissance de calcul d'un processeur est doublée, souvent avec une baisse du prix simultanée. Ainsi, le vainqueur en matière de performances est la machine, et c'est maintenant (environ 2023).

Ces vecteurs, c'est-à-dire ces séries de nombres qui représentent des images, du texte ou des vidéos, etc., peuvent maintenant être comparés entre eux. On peut donc comparer du texte avec du texte, des images avec des images, des vidéos avec des vidéos, du texte avec des images, des images avec des vidéos, du texte et des signaux audio avec des images ou des vidéos, etc. Maintenant vous savez comment fonctionnent les générateurs d'images comme Dall-E ou Midjourney. Maintenant vous savez que La plus rapidement et la plus simplement (traduit par "d'une manière rapide et simple") des applications haut de gamme comme SoundHound, qui peuvent identifier des morceaux de musique en quelques secondes, peuvent être programmées.

J'ai prouvé moi-même que l'on peut programmer des applications rapidement et facilement:

  • La transcription audio de mes podcasts: Audio à texte, en qualité inattendement bonne. Pour 30 minutes de parole, un transcrit généré automatiquement par une intelligence artificielle sort, dont je dois peut-être encore corriger cinq mots manuellement. Les parties de phrase et les mots inconnus comme "tous les uns", "Hömmele" (oui, c'est ainsi qu'il est appelé !) ou "Megafail de Microsoft, qui avait un outil d'intelligence artificielle Twitter" sont reconnus sans difficulté.
  • La production de vidéos à partir d'une entrée visuelle et audio: Mon photo bidimensionnelle en très mauvaise qualité plus une voix d'un président américain comme seule entrée donne mon tête animée tridimensionnelle et ma bouche qui se déplace synchronisément avec la voix comme animation vidéo.
  • Générateur d'image: connu dans d'autres applications. Mais cela fait une différence, le technicien sait si on laisse quelque chose calculer dans un nuage de Microsoft, Dall-E ou ailleurs ou sur un système local. Les différences sont en effet: Local je ne paye rien. Dans le nuage, je peux détruire 100 000 euros par erreur en un mois (exemples: appel récursif infini non voulu). Local j'ai la pleine maîtrise de tous les données. Chez Microsoft et Google, il ne sert à rien de prier, mais plutôt un médicament ou du pur alcool pour oublier temporairement ces soucis avec les monstres des données ou même se faire une bonne tête pour oublier tout cela.
  • Reconnaissance d'objets: Quels objets sont identifiables sur une image ? Quels sont les contours de chaque objet individuel ? Quel est le nom de l'objet ? Comment serait-ce avec «Marquez toutes les tasses à thé sur l'image» ou «Cherchez-moi tous les images où deux personnes ou plus discutent dans un bureau et s'assoient sur des chaises» ou «Remplacez le visage sur l'image par celui de Norman Reedus, mon sosie, disent beaucoup…).
  • Recherche sémantique: Au lieu de chercher des mots-clés ou des instructions SQL cryptiques, on recherche maintenant par des phrases en langage naturel ou compare des documents entiers les uns avec les autres.

J'ai fait calculer quelques milliers d'images sur mon ordinateur. Voici le résultat sous forme de mosaïque (chaque tuile est en réalité une image avec une définition de 512 x 512 pixels):

Mosaïque composée d'environ 400 images générées par une intelligence artificielle sur mon matériel local. Chaque image a été réduite pour accélérer la charge du mosaïque. (l'image a été traduite automatiquement).

Les images individuelles du mosaïque sont issues d'un calcul de l'intelligence artificielle. Les images ont été mélangées de deux artistes que je connais bien. La variété de variations n'est pas encore optimale, car il s'agit de premiers essais. Il va beaucoup mieux, comme je l'ai constaté le jour suivant. Ce qui fait une éternité sur le marché de l'intelligence artificielle est pour certaines autorités de protection des données une unité de temps qu'elles ne connaissent pas (Qu'est-ce qu'un jour? Certaines autorités ne connaissent que les termes de temps "année", "décennie" et "jamais")

Systèmes locaux en tant que solution

Comme on l'a montré, de nombreuses calculs exigeants peuvent être effectués sur des ordinateurs personnels. S'il vous plaît, ne courez pas encore à Microsoft, AWS ou Google parce que quelqu'un veut jouer au Bingo avec des anglicismes et des marques pour cacher son ignorance.

Celui qui réserve encore un service Cloud pour chaque petit problème est un malheureux et sait moins de choses sur l'intelligence artificielle que sur la protection des données et les applications Internet. Ce n'est pas grave, il ne faut pas savoir tout. Mais les mauvais conseillers sont mauvais.

Une intelligence artificielle n'est pas adaptée pour des affirmations exactes. Elle est aussi fiable qu'un homme d'intelligence exceptionnelle.

Certains problèmes sont cependant si complexes qu'ils ne peuvent pas fonctionner sur des matérielles standards. Par exemple, la version 4 de ChatGPT. Ce système n'existe même pas sous forme d'open-source, afin que personne ne soit tenté de tout faire correctement.

Certains sont cependant suffisamment raisonnables pour ne pas déposer leurs Secrets commerciaux dans un chatbot de Microsoft ou Google. Avec ceux-là, je n'ai aucune envie d'avoir affaire.

Comme un exemple particulièrement plastique de coût de calcul, on peut citer BloombergGPT. C'est un Large Language Model (LLM) du diffuseur financier Bloomberg. Il est si puissant qu'il a fallu 1,3 million d'heures de calcul pour que le modèle soit prêt. Un modèle est un cerveau électronique.

Le cerveau Bloomberg était toutefois déjà prêt après 148 ans de calcul car 512 cartes graphiques haut de gamme, chacune avec 40 Go de mémoire graphique (ET PAS: mémoire vive), ont été utilisées. Chaque une de ces 512 cartes coûte environ 14 000 euros. Quelqu'un qui veut passer son PC de 16 à 32 Go de RAM paie ça de sa poche. Quelqu'un qui veut augmenter la mémoire graphique d'une carte de 8 à 16 Go paie un petit fortune (un peu exagéré).

Considérations juridiques

Je me limiterai essentiellement à quelques points que j'ai empruntés aux explications de l'avocat Jonas Breyer. Il n'est pas un hasard si son nom vous fait penser (mot-clé: «les adresses IP sont des données personnelles»).

Droit d'auteur

C'est bon et mauvais pour nous tous quand il s'agit d'IA. Il y a le risque que l'Europe reste championne du monde de la réglementation. Alors, dans certains domaines (traitement d'image ?), peu d'entreprises européennes réussiront avec l'IA. Au lieu de cela, nous allons acheter auprès des Américains qui font ce qu'ils veulent mais ne sont pas inquiétés (ne peuvent pas être inquiétés).

Un avocat du droit d'auteur à la chasse aux trésors. Le prompt de cette image créée par intelligence artificielle a également été généré automatiquement. Ainsi, des centaines de milliers d'images peuvent être créées même en haute définition sur un ordinateur local.

L'hypothèse la plus importante: ce que je peux ou ne peux pas faire en tant qu'humain, une intelligence artificielle peut le faire autant que peu.

Peindre un tableau à partir de la tête est aussi permis pour une personne que pour une intelligence artificielle. Si le résultat ressemble trop à un œuvre protégée par le droit d'auteur, il n'est pas autorisé. Tous les travaux qui ont une certaine valeur créative sont ainsi protégés. Cela concerne presque tous les tableaux ou photos qui ne montrent pas seulement un carré ou un cercle.

En outre, il est autorisé selon l'article 44b du UrhG, de stocker temporairement des œuvres d'autres personnes afin d'analyser ces dernières en fonction de modèles. C'est exactement ce que fait généralement l'intelligence artificielle.

L'affaire LAION

Nous arrivons au cas LAION e.V., une association allemande, qui a été poursuivie par un photographe allemand. LAION a réuni plus de 5 milliards d'images dans un ensemble de données d'entraînement pour des applications d'intelligence artificielle en images et les a rendues publiques. L'ensemble de données ne contient que les liens vers les images originales accessibles au public.

Le jeu de données LAION 5B est très populaire à l'échelle mondiale et la base de presque tous les générateurs d'images qui valent quelque chose.

Ma propre observation après avoir exploré plusieurs algorithmes de Stable Diffusion.

LAION avait téléchargé et utilisé ces images pour calculer un cerveau électronique. Après cela, LAION a supprimé les images selon ses propres dires. Avec le cerveau, on peut ensuite calculer des images comme celles ci-dessus ou celle qui suit.

Daryl Dixon en origami, généré par une IA sur mon système local.

Un photographe a retrouvé quelques-unes de ses photos dans le jeu de données LAIOn. Comme je l'ai déjà mentionné, il s'agit uniquement des liens et non des originaux. Le photographe a demandé à LAION la suppression de son contenu des données d'entraînement. Je n'ai pas encore compris ce que cela impliquait exactement. Peut-être s'agit-il du fait que les informations tirées de ses photos soient supprimées du cerveau électronique.

Voici la base de données d'images LAION sous forme de schéma et avec les informations originales (extrait):

L'image de gauche en bas provient de https://www.outdoorphotographer.com/images/gallery/full/131/417131.jpg (image et domaine indisponibles depuis le 30.07.2023). L'image de droite en bas a été générée à partir de celle-ci et est neuve. (l'image a été traduite automatiquement).

La question est maintenant de savoir si LAION doit effacer les connaissances issues d'images courtes stockées et analysées ou non. LAION répond "non" et a envoyé au photographe, en réponse à sa demande d'effacement, une facture d'avocat avec une demande de dommages-intérêts d'environ 850 euros.

Droit à l'information et à la protection des données personnelles

Les données personnelles sont protégées par le RGPD. Les applications de l'intelligence artificielle nécessitent toujours une traitement automatisé. Il s'ensuit que celles-ci sont toujours soumises au RGPD, lorsqu'il y a des données personnelles dans le jeu.

Les informations personnelles ne sont pas seulement des textes, mais aussi des images. Je pense que les informations publiques n'ont qu'un faible ou aucun droit à la vie privée. Les déclarations fausses générées par une intelligence artificielle n'ont d'abord rien à voir avec le droit à la vie privée. L'autorisation de l'auteur est quelque chose d'autre que le droit à la vie privée.

Ainsi je considère la protection des données comme un problème secondaire lorsqu'il s'agit d'applications de l'intelligence artificielle. Il a ici une très bonne justification et il ne prévient pas, mais protège. Je le vois plutôt différemment dans le droit d'auteur ou dans le droit des marques.

Autres dispositions juridiques

Le droit d'usage des marques protège explicitement (§ 3 MarkeG) et implicitement les marques protégées (§ 4 n° 2 MarqueG et j.).

Il existe également des marques de mots et d'images, des odeurs, des sons et des formes, et probablement quelques autres encore.

Les brevets, les modèles de mise en forme et quelques conceptions sont également protégés. Même une forme de bouteille peut être protégée.

Le Loi sur les données n'est encore qu'un projet de la Commission. Il oblige les grandes entreprises à fournir leurs données si quelqu'un en fait la demande. Cela sonne étrange et l'est aussi.

Il existe également un projet de règlement relatif à une ordonnance sur l'intelligence artificielle. Il est question de savoir si il faudrait inverser la charge de la preuve, lorsque quelqu'un utilise un travail généré par intelligence artificielle. A-t-on produit légalement ce travail ? Pour le prouver, on devrait par exemple sauvegarder l'état du système d'intelligence artificielle lorsqu'il a produit une œuvre, afin de pouvoir prouver plus tard que cette œuvre a été produite de manière légale. Cela empêcherait la production d'œuvres et ne permettrait pas leur utilisation.

La réglementation protège les grandes entreprises qui peuvent se permettre de s'offrir des avocats et du personnel pour des procédures complexes. Les petites entreprises sont ainsi étouffées.

Mieux que la régulation, que je considère comme impossible dans les faits, je trouve la dissuasion et la sanction. Deux mots qui sont inconnus des autorités de protection des données comme celles de Hesse (et certains tribunaux d'ailleurs) . Où se garagent moins de voitures mal ? Là où même sur les trottoirs, se garer coûte 800 euros (mais on ne reçoit jamais un ticket) ou là où cinq personnes sur dix sont notées pour avoir garé mal ?

Recommandations

Utilisez des systèmes de IA locaux. Le monde peut être si simple. Plus de problèmes avec Google et Microsoft. Qu'est-ce que c'était encore le Privacy Shield ? Est-il toujours en vigueur ? Non, il n'y a plus. Les États-Unis sont sortis.

Ne confondez pas les ChatBots avec des rechercheurs. Cependant, grâce à une recherche sémantique, sans ChatGPT, chaque document ou image peut être trouvé mieux que jamais auparavant. Sans OpenAI ou Microsoft.

Vérifiez les données d'exercice: seules les données personnelles ou sélectionnées sont à l'abri des problèmes juridiques. Difficile, car l'intelligence artificielle repose sur de grandes quantités de données. Heureusement, il existe des solutions. Il est préférable d'utiliser (d'habitude) uniquement les données accessibles au public, si ce n'est pas possible avec ses propres données.

Données de l'utilisateur ne devrait pas être stockées sans motif. Elles pourraient contenir des données personnelles. Le motif devrait, si il est enregistré, être très soigneusement sélectionné et justifié. D'ailleurs, c'est pourquoi ChatGPT a été interdit brièvement en Italie.

Les dépenses que génère une intelligence artificielle varient selon la forme qu'elle prend. Les sorties de texte ne sont pas des travaux scientifiques. Voir le cas du juriste new-yorkais qui s'est fait décerner 12 jugements par ChatGPT, qui n'existait jamais. Bête, si on présente ensuite ces résultats en justice et qu'on prétende que c'est la vérité.

J'ai prononcé ce discours lors d'un congrès sur la protection des données à la Deutsche Flugsicherung en fin mai 2023.

Quel avenir pour la surveillance aérienne ? L'image a été générée par une intelligence artificielle sur mon ordinateur sans connexion internet.
About the author on dr-dsgvo.de
My name is Klaus Meffert. I have a doctorate in computer science and have been working professionally and practically with information technology for over 30 years. I also work as an expert in IT & data protection. I achieve my results by looking at technology and law. This seems absolutely essential to me when it comes to digital data protection. My company, IT Logic GmbH, also offers consulting and development of optimized and secure AI solutions.

Intelligence artificielle: Œuvres d'auteurs et leur protection