Une aide pour les entreprises et les administrations afin d'évaluer et de planifier des projets de IA de manière plus efficace. Dans plusieurs séminaires sur l'IA, certaines questions posées par les intéressés à l'IA se sont révélées particulièrement pertinentes. Dans cet article, on mentionne les questions pratiques et on y répond de manière pragmatique.
Introduction
Qui veut résoudre un problème avec l'intelligence artificielle ne sait souvent pas si c'est possible ou à quel coût il s'agit. La collection pratique suivante de réponses aux questions sur les solutions d'intelligence artificielle montre ce qui est possible.
Les questions proviennent notamment d'un webinaire récemment tenu, mais aussi d'autres contacts avec des clients et des prospects. Les réponses sont basées sur les expériences de projets dans lesquels les souhaits des clients ont été mis en œuvre.
Beaucoup d'applications dans les entreprises peuvent être résolues de manière excellente et économique avec leur propre intelligence artificielle.
Les projets comportaient tous une part pertinente de programmation AI. Ont été utilisés des modèles Open-Source AI et occasionnellement des interfaces avec ChatGPT, Claude 3, Command R+ ou d'autres modèles commerciaux de langage.
Les réponses aux questions mentionnées devraient donner une orientation pour mieux reconnaître, évaluer, planifier et mener à bien des projets de IA.
Questions pratiques sur l'intelligence artificielle et réponses
En caractères gras, on mentionne chaque question. En dessous, suit comme texte ordinaire la réponse.
Quel cas d'application est particulièrement bien adapté pour l'introduction à l'intelligence artificielle ?
En raison des résultats très bons et des faibles besoins en matériels, les cas d'application suivants sont particulièrement adaptés pour entrer dans les solutions de l'intelligence artificielle – sans avoir besoin de utiliser ChatGPT !
- Recherche de connaissances: Chercher des documents ou des tickets propres dans le système de tickets.
- Fonction de recherche Site Web: Fonction de recherche intelligente pour les textes et les PDF sur son propre site web.
- Gestion des réclamations: Sur la base de cas antérieurs, donner une recommandation au salarié sur la manière dont il convient de traiter actuellement une réclamation.
- Régulation des dommages: Analog au gestion des réclamations.
- Recherche Internet intelligente: Résultats de recherche obtenus (via interface/API) et sifting intelligemment. Les résultats non pertinents sont ainsi filtrés parmi 1000 résultats.
- Système de réponse aux questions fréquentes: La condition est que soit des paires question-réponse, soit des documents contenant des réponses (les questions auxquelles les documents répondent peuvent être synthétiquement générées).
- Classification de documents, de textes, d'en-têtes, d'images, de signaux: affecter chaque document à une des catégories définies. Apprentissage automatique du bon classement. Haute probabilité de réussite.
Ces applications peuvent s'exécuter sur le matériel propre à votre entreprise ou organisation sans qu'il soit nécessaire d'envoyer des données à des tiers.
Quels cas d'application conviennent encore pour une solution avec l'intelligence artificielle ?
Sont notamment à nommer:
- Chatbot / Assistant de connaissances: Conversation avec mémoire, réponse en propres mots, utilisation également des connaissances d'internet pour la recherche de réponse …
- Génération de texte: Création d'écrits créatifs de haute qualité, comme pour les articles de blog ; Résumé du contenu des documents
- Reconnaissance d'objets: Reconnaître les classes d'objets (Personne, Maison, …) sur des images et dans des vidéos, reconnaissance intelligente de mouvement.
- Génération d'image: Générer des images en fonction de la description, générer des images similaires à l'image d'entrée. La vérification automatique du droit d'auteur est possible.
- Traduction de langue et texte: Transcription, lecture à voix haute, traduction d'une langue dans l'une des 100 autres langues.
Le coût pour cela est souvent faible. Seules les exigences en matériels sont plus élevées que celles des cas d'utilisation mentionnés dans le paragraphe précédent.
Qu'est-ce que l'intelligence artificielle hors ligne ?
L'IA hors ligne est une intelligence artificielle optimisée qui peut fonctionner sans connexion Internet, mais peut communiquer avec le monde extérieur si nécessaire.
Avantages:
- Contrôle complet des données
- Des résultats souvent meilleurs que ceux de ChatGPT, Gemini et les autres
- Souvent moins cher
Plus d'informations sur l'intelligence artificielle hors ligne
Quelles ressources temporelles sont réalisables pour un projet de IA ?
Pour un prototype et une étude de faisabilité, l'investissement est souvent très faible. Lorsque il s'agit du traitement de vos données, celles-ci (comme toujours) doivent être saisies. C'est là une tâche conventionnelle.
Le temps travaille pour vous: Lancer votre projet de IA, puis vous pouvez être sûr que le progrès technique dans le domaine de l'IA vous favorisera en quelques mois.
Comment facilement peut-on échanger un modèle de langage d'intelligence artificielle avec un autre ?
En résumé: cela est généralement très facile à faire. De nombreux modèles de langues suivent la même architecture. Ils peuvent être remplacés par des changements dans moins de lignes de code. Des modèles de langues nouveaux et meilleurs peuvent donc être utilisés comme Drop-In Replacement , pour utiliser un terme technique.
Quels sont les coûts de licence pour les programmes d'intelligence artificielle et les modèles de langage d'intelligence artificielle ?
Le marché open-source offre dans le domaine de l'intelligence artificielle une qualité et une actualité extrêmement élevées, qui ne peuvent pas être comparées à celles d'aucun autre marché open-source.
Cela concerne également les cadres de l'intelligence artificielle ainsi que les modèles de langage IA (et d'autres modèles IA).
Les coûts de la licence sont donc, pour le dire court, zéro.
Et quand l'API de ChatGPT ou équivalent est utilisée, des coûts s'accumulent en fonction de l'intensité d'utilisation.
Peut-on faire fonctionner une intelligence artificielle sur son propre matériel informatique ?
Oui. Un exemple plastique en pratique: Ce texte a été écrit sur un ordinateur portable sur lequel des modèles de langage d'intelligence artificielle avec 30 milliards de paramètres (modèles 30B) fonctionnent. Ce qui est possible sur un ordinateur portable fonctionne encore mieux sur un serveur d'intelligence artificielle.
Au Serveur AI: soit louer (d'un fournisseur allemand ou européen) soit acheter. Les principales dépenses lors de l'achat proviennent des coûts de la carte graphique(s).
Pour de nombreux cas d'utilisation, comme la recherche de connaissances ou la génération de recommandations pour les signalements de dommages ou les plaintes des clients, il suffit en effet d'une Matériel minimal.
Quel est l'investissement en soins pour une application d'intelligence artificielle ?
Le coût de la prise en charge est plutôt faible par rapport à d'autres systèmes informatiques, souvent même nul. Lorsqu'il existe des documents de connaissance nouveaux, ils peuvent être lus et traités automatiquement. Le coût se crée naturellement lorsque de nouvelles connaissances sont rassemblées pour améliorer la qualité du système ou y ajouter de nouvelles connaissances. Sans ajout de nouvelles connaissances, le coût est plutôt nul.
Peut-on ajouter de nouvelles connaissances à une application d'intelligence artificielle après sa mise en service ?
Oui, c'est possible de plusieurs manières.
La méthode la plus simple consiste à sélectionner de nouvelles connaissances qui correspondent à une question d'utilisateur, pour les présenter au modèle linguistique afin de faciliter sa réponse.
L'entraînement plus durable du modèle de langage avec les nouvelles connaissances est plus efficace. Le modèle de langage est ainsi mis à jour.
Des exemples sont nécessaires pour l'entraînement de l'intelligence artificielle.
Peut-on créer des données d'entraînement si il y a trop peu d'exemples ?
Oui, c'est possible. Pour cela, des exemples artificiels sont créés. On appelle cela des ensembles de données synthétiques. Pour la création d'ensembles de données synthétiques, un modèle linguistique est utilisé. Pour les données publiques, on peut utiliser un service cloud comme ChatGPT, Command R+ etc., si vous le trouvez bien. Il vaut souvent mieux d'utiliser un modèle linguistique local, car c'est possible sans frais supplémentaires. Ce modèle local peut également être entraîné pour générer des données de formation synthétiques particulièrement bien.
Un autre avantage des modèles locaux est la possibilité de les charger en permanence (24/7) pour générer des données synthétiques. Ce qui coûterait quelques dizaines de milliers d'euros par mois avec ChatGPT, peut être fait par un modèle AI local au prix fixe. Les coûts fixes sont constitués des coûts de fonctionnement de votre matériel informatique. Lorsque vous louez du matériel, ces coûts s'élèvent à quelques centaines d'euros par mois. Achetez un système ou en avez-vous un, il n'y a que les coûts d'électricité pour l'exploiter.
On voit déjà que des avantages stratégiques importants et des possibilités en découlent, si l'on se donne un peu plus de peine que les autres, qui par facilité utilisent la prétendue meilleure solution «ChatGPT».
Quelle est la fiabilité des réponses d'un modèle de langage / chatbot / système AI ?
C'est comme pour les hommes: personne ne le sait, à moins qu'il n'ait déjà connu la réponse avant.
Concrètement: les modèles de langage fournissent souvent des réponses correctes en mode classique, mais pas souvent suffisamment pour parler de fiabilité. Même ChatGPT échoue à répondre à des questions plus spécifiques qui ne tournent pas autour de la hauteur de la tour Eiffel.
La recherche de connaissance dans des documents a même une grande fiabilité.
La fiabilité des chatbots peut être considérablement améliorée grâce à des techniques intelligentes d'extension, au coût très faible.
Il n'y a pas de repas gratuit. Il faut se donner un peu de peine pour obtenir une grande fiabilité. L'effort pour la peine est souvent modeste et est économiquement réalisable.
Comment peut-on empêcher que des données aient accès à ChatGPT ou d'autres fournisseurs de IA ?
Il est impossible d'empêcher le flux de données vers OpenAI ou Microsoft que si vous n'utilisez pas ChatGPT.
Utilisez ChatGPT, il est impossible d'empêcher la fuite de données. Les paramètres de protection des données sont souvent à l'avantage du client (Opt-Out au lieu d'Opt-in). La fuite de vos données ne peut être empêchée que juridiquement, donc théoriquement.
Quels problèmes de protection des données peuvent surgir lors de l'utilisation d'une application comme HeyGen ?
HeyGen est ici seulement un placeholder pour de nombreuses applications d'intelligence artificielle de ce type, avec lesquelles des contenus synthétiques peuvent être générés.
HeyGen est un outil en ligne permettant de créer un vidéo. Là, on clone sa propre voix, on la met sur un autre visage et on synchronise les lèvres avec elle. Une saisie de texte est donnée comme langue dans la voix clonée.
Si votre employé de marketing propose lui-même HeyGen et se laisse volontairement cloner sa propre voix, il n'a peut-être pas le droit à la rétractation car il n'avait pas donné son consentement à l'origine qu'il puisse rétracter. Sinon, on doit noter que pour utiliser une voix humaine, il faudrait peut-être obtenir le consentement du propriétaire de la voix.
Est-ce que ChatGPT est le meilleur modèle de langage ?
Il est probablement plus que ça. ChatGPT fournit des résultats incroyables, mais il n'a pas été spécialement formé pour la langue allemande. De plus, c'est "vieux", il repose sur une architecture qui doit désormais être considérée comme obsolète. Seule la quantité énorme de données et la taille (nombre de neurones artificiels et de connexions) assurent une performance concurrentielle.
Les coûts de ChatGPT sont non concurrentiels car ils sont parfois plus que le double de ceux des modèles de langage similaires proposés par d'autres fournisseurs. Mistral, en France, propose un modèle très bon, ainsi que Cohere aux États-Unis. Les fournisseurs hors d'Europe conviennent mieux à des applications dans lesquelles il ne s'agit pas de données critiques et où il n'y a pas lieu de craindre une fuite d'informations.
Les modèles open-source sont désormais si excellents qu'ils sont concurrentiels. Ils se débrouillent de mieux en mieux et peuvent même être exploités par soi-même.
Quels sont les points à prendre en compte lors de l'utilisation d'un répondeur automatique basé sur l'intelligence artificielle ?
Il s'agit ici d'une (annonce) statique créée avec une application de IA.
La voix synthétique ne devrait pas ressembler trop à celle d'une personne réelle (avec une voix reconnaissable). Pour la synthèse de la voix, le matériau d'origine doit être juridiquement sans risque en termes d'œuvre.
Aucune chose importante n'est à prendre en compte, notamment les données personnelles ne sont pas traitées par l'intelligence artificielle ici.
Quelles connaissances devrait avoir un programmeur de IA ?
Une connaissance technique approfondie et une expérience de programmation sont très utiles. Quiconque n'a jamais travaillé plus en profondeur dans la programmation de l'intelligence artificielle ne devrait pas commencer à construire un système d'intelligence artificielle à partir de zéro.
L'intelligence artificielle est un sujet très complexe avec de nombreuses développements rapides. En particulier, il convient d'avoir des connaissances en Python et Linux/Ubuntu (etc.). Si les principes techniques de l'intelligence artificielle sont connus, cela ne fait pas de mal. Une connaissance en programmation d'interface est également utile. Que le programmeur soit celui qui installe pour la première fois le système et l'installe depuis le début, c'est une autre question. Il est souvent sensé que quelqu'un d'autre le fasse.
Quant à la AI, il est de courte vue d'avantage si le partenaire technique (souvent le programmeur/développeur) suit et connaît les développements rapides du marché de la technologie AI.
Peut-on utiliser l'intelligence artificielle pour d'autres tâches que la traitement de texte ?
Oui. On parle ici de modalités. Les modalités sont des types de données, donc texte, image, vidéo, audio, valeurs de capteurs de température, données d'analyse web etc.
Il existe de nombreuses modalités qui disposent de modèles d'intelligence artificielle, et notamment open-source, donc librement disponibles. Par exemple, on peut extraire la langue à partir de vidéos ou de podcasts et la convertir en texte. Cela se fait avec ses propres systèmes d'IA sur base open-source mieux que par exemple avec Microsoft Teams ! Laisser de côté pour l'instant le thème du contrôle des données.
Quel ordinateur recommanderiez-vous comme poste de travail pour une intelligence artificielle ?
Il s'agit de savoir si vous voulez programmer ou simplement travailler avec l'intelligence artificielle en tant qu'utilisateur.
Pour la programmation, je recommande un système Ubuntu. Il est également possible d'utiliser Windows avec WSL, ce qui convient bien pour une bonne introduction, mais pas pour les professionnels.
En tant qu'utilisateur, vous pouvez prendre un PC (ou un ordinateur portable) de votre choix qui comporte soit une carte graphique capable d'intelligence artificielle avec autant de VRAM que possible (Nvidia) ou un processeur d'intelligence artificielle d'Apple (par exemple le M3). Toute autre chose est presque indifférente. Il faudrait encore une disque dur d'au moins 1 To, idéalement avec la technologie SSD rapide. Un RAM de 32 Go.
Remarques de conclusion
Il y a probablement encore beaucoup d'autres questions à poser. N'hésitez pas à les poser. Vous obtiendrez volontiers une réponse.
Même si vous avez besoin d'une première évaluation de la faisabilité ou des coûts pour votre projet, nous serons heureux de vous donner un retour réaliste.
Messages clés
L'intelligence artificielle peut être facilement mise en œuvre pour résoudre de nombreux problèmes d'entreprise de manière efficace et économique.
L'intelligence artificielle hors ligne permet d'utiliser des applications intelligentes sur vos propres ordinateurs sans envoyer vos données à des tiers.
Il est possible d'utiliser l'intelligence artificielle sur son propre matériel informatique, ce qui peut être plus économique que d'utiliser des API externes.
Bien que ChatGPT soit performant, il existe de meilleures alternatives et il est important de se méfier de la fiabilité des réponses des modèles de langage.
Il existe de nombreuses options pour utiliser l'intelligence artificielle, allant des modèles open source aux fournisseurs commerciaux. Le choix dépend de vos besoins spécifiques, comme la confidentialité des données et le budget.
Pour travailler avec l'intelligence artificielle, choisissez un système Ubuntu si vous programmez, ou un PC avec une bonne carte graphique ou un processeur Apple M3 si vous êtes un utilisateur.



My name is Klaus Meffert. I have a doctorate in computer science and have been working professionally and practically with information technology for over 30 years. I also work as an expert in IT & data protection. I achieve my results by looking at technology and law. This seems absolutely essential to me when it comes to digital data protection. My company, IT Logic GmbH, also offers consulting and development of optimized and secure AI solutions.
