Combien de temps a duré la programmation d'une application de démonstration pour un générateur d'images IA ?

La programmation de l'application de démonstration n'a nécessité que 5 minutes. Ce court laps de temps montre à quel point il est facile de mettre en place une génération d'images basée sur l'IA localement.

Combien d'images ont été générées dans l'application de démonstration d'IA ?

L'application de démonstration a généré 20 images simultanément. Cette génération rapide d'images démontre l'efficacité de la solution open source.

Quelle résolution avaient les images générées par l'IA ?

Les images générées avaient une résolution de 1024 x 1024 pixels. Cette résolution est suffisamment de qualité et permet de nombreuses applications des images générées.

Pourquoi l'utilisation d'un modèle d'IA open source est-elle attrayante pour la génération d'images ?

Les modèles d'IA open source offrent aux entreprises flexibilité, efficacité des coûts et sécurité des données par rapport aux services cloud. Ils permettent une solution indépendante, non dépendante des tiers.

Quels avantages offre la vérification automatique des images générées par l'IA ?

Le contrôle automatique des droits d'auteur réduit les risques juridiques et permet une utilisation sûre des images générées. Il s'agit d'une fonction essentielle qui manque souvent aux services commerciaux de génération d'images.

Comment l'utilisation d'un modèle d'IA open source se distingue-t-elle de l'utilisation de services tels que Midjourney ou DALL-E ?

Les modèles open source offrent la possibilité d'exécuter l'application d'IA directement sur du matériel dédié, ce qui se traduit par un plus grand contrôle, une plus grande flexibilité et des coûts potentiellement inférieurs. Cela contraste avec les services cloud, qui créent souvent une dépendance envers des fournisseurs externes.

AI-Showcase: Générer des images - Très rapidement sur un ordinateur portable

Ce showcase de l'intelligence artificielle montre que avec des modèles d'IA open-source, on peut obtenir des résultats incroyables et rapides avec un minimum d'efforts sur un ordinateur portable abordable. Une image vaut mieux qu'un millier de mots. C'est pourquoi le premier showcase de l'intelligence artificielle concerne la génération d'image.

Introduction

La série de démonstrations d'intelligence artificielle commence ici dans le blog Dr. RGPD avec la génération d'images. Cela devrait montrer:

Résultats très bons en temps de calcul le plus court possible sur son propre matériel informatique
Temps de programmation très court, grâce à des frameworks open-source extrêmement bons
Mon propre ordinateur portable et non un PC de bureau, un serveur ou même un modèle commercial d'intelligence artificielle
Contrôle des données complet (tout fonctionne également sans connexion à Internet)
Utilisation de modèles d'intelligence artificielle open-source (ici: génération d'images, bientôt dans le showcase: applications texte, audio, etc.)

Générer une image plus grande et de qualité supérieure en 1,4 seconde sur un ordinateur portable.
La programmation pour cela a duré 5 minutes.

Pourquoi un ordinateur portable ? Ce qui fonctionne très bien sur un ordinateur portable fonctionne encore mieux sur un serveur (notamment, la calcul est alors encore plus rapide).

Oubliez vos préjugés contre Open-Source, qui pourraient être justifiés en dehors du domaine de l'intelligence artificielle. En ce qui concerne l'intelligence artificielle, il n'y a pas de meilleur marché que le Open-Source. Les outils disponibles à tous sont extrêmement puissants et dépassent tout ce qui existait jusqu'à présent.

Le Showroom

Pour un prompt (entrée de texte), des images doivent être générées. Beaucoup connaissent cela depuis DALL-E, Midjourney ou encore Stable Diffusion en général.

Le générateur d'image est programmé de 0 à 100. Il tourne sur un ordinateur portable proprement dit, acheté fin 2023. Système d'exploitation du portable: Ubuntu (rien que cela, pas Microsoft, Apple, Google ou Meta). Ubuntu est un système d'exploitation populaire basé sur Linux. Les coûts de licence sont rapidement mentionnés: zéro.

L'application fonctionne parfaitement sans connexion Internet, après avoir terminé tous les téléchargements nécessaires à la mise en place de l'application. Évidemment, aucun service d'OpenAI, Microsoft, Google etc. n'est utilisé. Tout se passe localement.

Objectif de ce showcase

Il faut montrer que la génération d'images est possible en qualité élevée avec une grande vitesse sur son propre matériel et sans utiliser de services tiers du tout.

Il faudra également montrer que la programmation en quelques minutes est possible. Les projets de logiciels de ce type prenaient des mois, voire étaient impossibles à réaliser. Je parle d'après l'expérience des 30 dernières années.

Le showcase devrait en outre montrer que des matériel sous la catégorie «qui peut se le permettre ?» peuvent produire des résultats à Vitesse de la lumière.

Optimisation complète incluant la vérification des droits d'auteur pour les images générées. Contrôle complet des données Indépendance totale.
Certains caractéristiques de la solution présentée.

Pour cet article, une petite démo a été programmée. Elle génère 20 images et mesure le temps de création des images. Comme prompt, on a utilisé "Albert Einstein" plus l'un des quatre styles aléatoires (aucun style, style noir et blanc, etc.) qui ont été fixés à l'avance. D'autres prompts ont également été testés.

Temps passé pour la démo

Le temps passé pour cela a été plus court que le temps nécessaire à l'écriture de cet article ici. Oui, ce texte a été écrit manuellement. Dans un futur AI-Showcase, il est montré qu'une application pour la mise en forme du texte peut être programmée et exécutée sur des matériel propre en quelques minutes. Honteux pour Microsoft, Google et Co., qui ne recevront plus de données.

Le temps d'investissement détaillé:

Télécharger le modèle de AI open-source: quelques minutes
Démo d'application de programmation: 5 minutes

C'est tout. Il convient de noter que un modèle de IA comme celui-ci contient plusieurs gigaoctets de données. Lors de l’achat d’un matériel, il est donc recommandé d’acheter des disques durs volumineux. Ces disques durs ne coûtent pas cher. Un téraoctet équivaut à 1024 gigaoctets. Le portable en question a une disque dur de 1,5 téraoctet. C'est suffisamment grand pour pouvoir expérimenter pendant quelques temps sans avoir à supprimer les modèles d'IA inutiles.

Résultats

L'application de démonstration programmée en toute hâte a généré 20 images en moins de 29 secondes au total. Et ceci sur un ordinateur portable. Sur un PC de bureau qualitativement comparable, cela aurait été deux fois plus rapide.

Pour chaque image, il a donc fallu environ 1,45 seconde de temps.

Chaque image a une résolution de 1024 × 1024 pixels. Même les non-graphistes savent que cela est au-dessus de "petit".

Voici les résultats en vue d'écran:

Screenshot der Kachelansicht der 20 KI-generierten Bilder, wie sie ein Bildanzeigeprogramm darstellt.

Un de ces images en détail:

Auf das Bild klicken für Ansicht in Originalgröße.

Les images sont pour la plupart utilisables. Quelques-unes ont des erreurs mineures, comme une lunette interrompue. Cela pourrait être corrigé, mais cela n'a pas été fait pour la démo.

La démo utilise en outre seulement la moitié de la qualité possible pour la génération. La qualité est également responsable de la composition des images. Une meilleure qualité augmenterait légèrement le temps de calcul par image, mais réduirait aussi le problème du brillant mentionné ci-dessus.

Une qualité de génération encore plus élevée et des résolutions d'image encore plus élevées sont programmées tout aussi rapidement. La vitesse de génération par image augmente alors à environ 7 à 10 secondes (sur mon ordinateur portable, en fonction de la résolution de l'image).

AI for your company

Your AI can do more than ChatGPT.

Benefits:

Powerful and optimizable
Full data control
Fast proof of concept
Inexpensive

Free initial consultation: Mail to ai@dr-dsgvo.de

Je réalise moi-même des hauteurs d'image très élevées par le biais de l'escalade. L'escalade signifie augmenter la résolution. Cela se produit également avec un modèle AI qui, bien sûr, fonctionne à nouveau sur mon ordinateur portable AI. Avec l'escalade, une résolution peut être quadruplée ou même octroyée, et c'est mieux que ce que tout programme d'édition d'image de classe mondiale peut faire de manière traditionnelle.

Avantages

Les avantages en quelques mots:

Flexibilité totale
Optimisation maximale
Actif propre plutôt que l'exploitation d'un autre
Contrôle complet des données
Fonctionnement 24h/24 et 7j/7 = mêmes coûts
L'avantage de profiter toujours des dernières technologies

Si on poursuit cette idée, on se retrouve avec la question de l' droit d'auteur lors de la génération d'image. Cette dernière peut être évitée grâce au AI-Showcase. Chaque image générée peut être automatiquement vérifiée pour des problèmes de droits d'auteur. De même, les images générées peuvent être automatiquement optimisées en contraste ou en netteté. Une fois la pipeline mise en place, elle peut être automatisée à l'infini et combinée avec d'autres pipelines AI personnalisés.

Les améliorations mentionnées précédemment ne sont pas possibles lors de l'utilisation de services commerciaux. Et si elles le sont, par la suite, alors cela signifie que les connaissances nécessaires pour une solution propre existent déjà. Pourquoi donc ne pas utiliser des solutions propres d'emblée, qui ne peuvent être volées à personne ?

Conclusion

Résultats qui étaient inimaginables il y a six mois sont maintenant faciles à obtenir.

Entreprises qui veulent être indépendantes de tiers reçoivent des solutions stratégiques gratuites pour cela.

Personne ne doit plus recourir à Midjourney ou DALL-E. Alors que les utilisateurs privés profitent des offres gratuites ou abordables qui «ne coûtent» que de données, ce chemin n'est souvent pas pertinent pour les entreprises. Soit en raison de problèmes juridiques, soit en raison du coût, soit en raison d'une mauvaise optimisation ou d'un manque de flexibilité. Et sans parler de la dépendance qui grandit de plus en plus.

Chaque semaine, de nouveaux approches open-source dans le domaine de l'intelligence artificielle sont proposées, qui sont meilleures que tout ce qui a existé jusqu'à présent.
Observations personnelles des derniers 9 mois.

Les prochaines démonstrations de l'intelligence artificielle montreront que les jours de Google ou Microsoft/OpenAI sont bientôt comptés. La gamme de leurs produits peut être remplacée en grande partie par des applications d'IA qui fonctionnent sur leur propre matériel informatique.

Cela est illustré par l'Open-Source LLM nommé Llama 3, publié le 18 avril 2024. Le modèle fonctionne sur mon ordinateur AI. Il maîtrise par exemple le raisonnement logique aussi bien que cela permet d'exécuter des applications d'entreprise performantes qui étaient encore inimaginables il ne faut pas longtemps.

Messages clés

Avec des outils d'intelligence artificielle open source, il est possible de créer des images de haute qualité très rapidement sur un ordinateur portable ordinaire.

Une nouvelle IA peut générer des images de haute qualité à une vitesse incroyablement rapide, même sur un ordinateur portable.

L'intelligence artificielle open source permet aux entreprises de réaliser des tâches complexes et performantes sans dépendre de services commerciaux coûteux et limitants.

A propos de ces messages clés

Alle Bilder in diesem Beitrag wurden von einem Computer-Programm erzeugt. Verwendet wurde das selbst entwickelte KI-System von Dr. DSGVO, ähnlich zu Midjourney. Die Bilder dürfen auf Webseiten frei verwendet werden, mit der Bitte, eine Verlinkung auf diesen Blog zu setzen.