Vous pouvez désormais générer des images à l'aide du modèle d'IA Imagen 3 de Google
Jeudi, Google a dévoilé son modèle d'intelligence artificielle (IA) pour la génération d'images, Imagen 3. Le géant de la technologie n'a fait aucune annonce concernant cette sortie, et a plutôt dévoilé le modèle discrètement aux utilisateurs. En outre, un article de recherche détaillant le fonctionnement du modèle de génération d'images a également été publié dans une revue en ligne. Actuellement, le modèle de génération de texte en image n'est disponible que pour les utilisateurs aux États-Unis, et on ne sait pas quand il pourrait être déployé pour les utilisateurs d'autres régions.
Modèle d'IA Imagen 3 publié par Google
La plateforme AI Test Kitchen du géant de la technologie permet désormais aux utilisateurs de s'inscrire sur la plateforme et d'utiliser le modèle d'IA pour générer des images. La troisième génération de son modèle Imagen devrait bénéficier de capacités améliorées de génération de textures et de reconnaissance de mots, ainsi que d'une adhésion plus stricte aux invites.
Étant donné que le modèle d'IA n'est disponible qu'aux États-Unis, Gadgets 360 n'a pas pu tester la plateforme. Cependant, un utilisateur de Reddit a affirmé qu'il était capable de générer des images dans différents styles tels que la qualité d'un reflex numérique Nikon, le style GoPro, un objectif grand angle, etc. Cependant, le modèle aurait du mal à générer des images en gros plan avec plusieurs personnes et des images sous-éclairées, ce qui était possible avec son prédécesseur.
Un autre domaine dans lequel Imagen 3 rencontre des difficultés est celui des membres. L’utilisateur a affirmé que le modèle produisait des résultats erronés lors de l’utilisation d’invites telles que « un homme tenant une tasse de café ». L’IA finissait par générer des membres supplémentaires, en créant un membre aléatoire tenant l’objet ou en fusionnant l’objet et le membre. Le modèle de génération d’images aurait également une censure très stricte dans les invites.
Google a également publié un article de recherche dans la revue en ligne arXiv. L'entreprise y souligne qu'elle a utilisé un modèle de diffusion latente, qui est une variante du modèle de diffusion popularisé par Stable Diffusion. L'entreprise a également ajouté que de nouvelles méthodes ont été utilisées pour minimiser les dommages potentiels en utilisant le modèle Imagen 3.
Il convient de noter que la version gratuite du chatbot Gemini peut également générer des images, mais elle utilise pour cela les capacités de Gemini. Imagen 3 est construit sur une architecture différente et comme son ensemble de données contient en grande partie des images, il est mieux formé pour générer des images IA.
Pour les dernières nouvelles et critiques technologiques, suivez Gadgets 360 sur XFacebook, WhatsApp, Threads et Google News. Pour les dernières vidéos sur les gadgets et la technologie, abonnez-vous à notre chaîne YouTube. Si vous voulez tout savoir sur les meilleurs influenceurs, suivez notre Who'sThat360 interne sur Instagram et YouTube.
Le smartphone pliable en trois parties de Huawei aurait été repéré à nouveau, mettant en valeur son design unique
Le FMI estime que l'empreinte carbone de l'industrie des crypto-monnaies est en hausse ; les responsables envisagent une augmentation des taxes pour réduire les émissions
Post Comment