Ce showcase de l'intelligence artificielle montre que avec des modèles d'IA open-source, on peut obtenir des résultats incroyables et rapides avec un minimum d'efforts sur un ordinateur portable abordable. Une image vaut mieux qu'un millier de mots. C'est pourquoi le premier showcase de l'intelligence artificielle concerne la génération d'image.
Introduction
La série de démonstrations d'intelligence artificielle commence ici dans le blog Dr. RGPD avec la génération d'images. Cela devrait montrer:
- Résultats très bons en temps de calcul le plus court possible sur son propre matériel informatique
- Temps de programmation très court, grâce à des frameworks open-source extrêmement bons
- Mon propre ordinateur portable et non un PC de bureau, un serveur ou même un modèle commercial d'intelligence artificielle
- Contrôle des données complet (tout fonctionne également sans connexion à Internet)
- Utilisation de modèles d'intelligence artificielle open-source (ici: génération d'images, bientôt dans le showcase: applications texte, audio, etc.)
Générer une image plus grande et de qualité supérieure en 1,4 seconde sur un ordinateur portable.
La programmation pour cela a duré 5 minutes.
Pourquoi un ordinateur portable ? Ce qui fonctionne très bien sur un ordinateur portable fonctionne encore mieux sur un serveur (notamment, la calcul est alors encore plus rapide).
Oubliez vos préjugés contre Open-Source, qui pourraient être justifiés en dehors du domaine de l'intelligence artificielle. En ce qui concerne l'intelligence artificielle, il n'y a pas de meilleur marché que le Open-Source. Les outils disponibles à tous sont extrêmement puissants et dépassent tout ce qui existait jusqu'à présent.
Le Showroom
Pour un prompt (entrée de texte), des images doivent être générées. Beaucoup connaissent cela depuis DALL-E, Midjourney ou encore Stable Diffusion en général.
Le générateur d'image est programmé de 0 à 100. Il tourne sur un ordinateur portable proprement dit, acheté fin 2023. Système d'exploitation du portable: Ubuntu (rien que cela, pas Microsoft, Apple, Google ou Meta). Ubuntu est un système d'exploitation populaire basé sur Linux. Les coûts de licence sont rapidement mentionnés: zéro.
L'application fonctionne parfaitement sans connexion Internet, après avoir terminé tous les téléchargements nécessaires à la mise en place de l'application. Évidemment, aucun service d'OpenAI, Microsoft, Google etc. n'est utilisé. Tout se passe localement.
Objectif de ce showcase
Il faut montrer que la génération d'images est possible en qualité élevée avec une grande vitesse sur son propre matériel et sans utiliser de services tiers du tout.
Il faudra également montrer que la programmation en quelques minutes est possible. Les projets de logiciels de ce type prenaient des mois, voire étaient impossibles à réaliser. Je parle d'après l'expérience des 30 dernières années.
Le showcase devrait en outre montrer que des matériel sous la catégorie «qui peut se le permettre ?» peuvent produire des résultats à Vitesse de la lumière.
Optimisation complète incluant la vérification des droits d'auteur pour les images générées. Contrôle complet des données Indépendance totale.
Certains caractéristiques de la solution présentée.
Pour cet article, une petite démo a été programmée. Elle génère 20 images et mesure le temps de création des images. Comme prompt, on a utilisé "Albert Einstein" plus l'un des quatre styles aléatoires (aucun style, style noir et blanc, etc.) qui ont été fixés à l'avance. D'autres prompts ont également été testés.
Temps passé pour la démo
Le temps passé pour cela a été plus court que le temps nécessaire à l'écriture de cet article ici. Oui, ce texte a été écrit manuellement. Dans un futur AI-Showcase, il est montré qu'une application pour la mise en forme du texte peut être programmée et exécutée sur des matériel propre en quelques minutes. Honteux pour Microsoft, Google et Co., qui ne recevront plus de données.
Le temps d'investissement détaillé:
- Télécharger le modèle de AI open-source: quelques minutes
- Démo d'application de programmation: 5 minutes
C'est tout. Il convient de noter que un modèle de IA comme celui-ci contient plusieurs gigaoctets de données. Lors de l’achat d’un matériel, il est donc recommandé d’acheter des disques durs volumineux. Ces disques durs ne coûtent pas cher. Un téraoctet équivaut à 1024 gigaoctets. Le portable en question a une disque dur de 1,5 téraoctet. C'est suffisamment grand pour pouvoir expérimenter pendant quelques temps sans avoir à supprimer les modèles d'IA inutiles.
Résultats
L'application de démonstration programmée en toute hâte a généré 20 images en moins de 29 secondes au total. Et ceci sur un ordinateur portable. Sur un PC de bureau qualitativement comparable, cela aurait été deux fois plus rapide.
Pour chaque image, il a donc fallu environ 1,45 seconde de temps.
Chaque image a une résolution de 1024 × 1024 pixels. Même les non-graphistes savent que cela est au-dessus de "petit".
Voici les résultats en vue d'écran:

Un de ces images en détail:

Les images sont pour la plupart utilisables. Quelques-unes ont des erreurs mineures, comme une lunette interrompue. Cela pourrait être corrigé, mais cela n'a pas été fait pour la démo.
La démo utilise en outre seulement la moitié de la qualité possible pour la génération. La qualité est également responsable de la composition des images. Une meilleure qualité augmenterait légèrement le temps de calcul par image, mais réduirait aussi le problème du brillant mentionné ci-dessus.
Une qualité de génération encore plus élevée et des résolutions d'image encore plus élevées sont programmées tout aussi rapidement. La vitesse de génération par image augmente alors à environ 7 à 10 secondes (sur mon ordinateur portable, en fonction de la résolution de l'image).
AI for your company
- Powerful and optimizable
- Full data control
- Fast proof of concept
- Inexpensive
Je réalise moi-même des hauteurs d'image très élevées par le biais de l'escalade. L'escalade signifie augmenter la résolution. Cela se produit également avec un modèle AI qui, bien sûr, fonctionne à nouveau sur mon ordinateur portable AI. Avec l'escalade, une résolution peut être quadruplée ou même octroyée, et c'est mieux que ce que tout programme d'édition d'image de classe mondiale peut faire de manière traditionnelle.
Avantages
Les avantages en quelques mots:
- Flexibilité totale
- Optimisation maximale
- Actif propre plutôt que l'exploitation d'un autre
- Contrôle complet des données
- Fonctionnement 24h/24 et 7j/7 = mêmes coûts
- L'avantage de profiter toujours des dernières technologies
Si on poursuit cette idée, on se retrouve avec la question de l' droit d'auteur lors de la génération d'image. Cette dernière peut être évitée grâce au AI-Showcase. Chaque image générée peut être automatiquement vérifiée pour des problèmes de droits d'auteur. De même, les images générées peuvent être automatiquement optimisées en contraste ou en netteté. Une fois la pipeline mise en place, elle peut être automatisée à l'infini et combinée avec d'autres pipelines AI personnalisés.
Les améliorations mentionnées précédemment ne sont pas possibles lors de l'utilisation de services commerciaux. Et si elles le sont, par la suite, alors cela signifie que les connaissances nécessaires pour une solution propre existent déjà. Pourquoi donc ne pas utiliser des solutions propres d'emblée, qui ne peuvent être volées à personne ?
Conclusion
Résultats qui étaient inimaginables il y a six mois sont maintenant faciles à obtenir.
Entreprises qui veulent être indépendantes de tiers reçoivent des solutions stratégiques gratuites pour cela.
Personne ne doit plus recourir à Midjourney ou DALL-E. Alors que les utilisateurs privés profitent des offres gratuites ou abordables qui «ne coûtent» que de données, ce chemin n'est souvent pas pertinent pour les entreprises. Soit en raison de problèmes juridiques, soit en raison du coût, soit en raison d'une mauvaise optimisation ou d'un manque de flexibilité. Et sans parler de la dépendance qui grandit de plus en plus.
Chaque semaine, de nouveaux approches open-source dans le domaine de l'intelligence artificielle sont proposées, qui sont meilleures que tout ce qui a existé jusqu'à présent.
Observations personnelles des derniers 9 mois.
Les prochaines démonstrations de l'intelligence artificielle montreront que les jours de Google ou Microsoft/OpenAI sont bientôt comptés. La gamme de leurs produits peut être remplacée en grande partie par des applications d'IA qui fonctionnent sur leur propre matériel informatique.
Cela est illustré par l'Open-Source LLM nommé Llama 3, publié le 18 avril 2024. Le modèle fonctionne sur mon ordinateur AI. Il maîtrise par exemple le raisonnement logique aussi bien que cela permet d'exécuter des applications d'entreprise performantes qui étaient encore inimaginables il ne faut pas longtemps.
Messages clés
Avec des outils d'intelligence artificielle open source, il est possible de créer des images de haute qualité très rapidement sur un ordinateur portable ordinaire.
Une nouvelle IA peut générer des images de haute qualité à une vitesse incroyablement rapide, même sur un ordinateur portable.
L'intelligence artificielle open source permet aux entreprises de réaliser des tâches complexes et performantes sans dépendre de services commerciaux coûteux et limitants.




My name is Klaus Meffert. I have a doctorate in computer science and have been working professionally and practically with information technology for over 30 years. I also work as an expert in IT & data protection. I achieve my results by looking at technology and law. This seems absolutely essential to me when it comes to digital data protection. My company, IT Logic GmbH, also offers consulting and development of optimized and secure AI solutions.
