OpenAI a présenté un nouveau générateur de photos DALL-E 3
DALL-E 3 offrirait une plus grande protection aux artistes et designers qui affirment que ces générateurs d’images IA (intelligence artificielle) utilisent des œuvres tierces pour entraîner l’algorithme et créer à leur tour des photos et des images.
Le développeur OpenAI a mis au centre les nouvelles capacités d'IA du générateur d'images, qui devraient être capables de prendre en compte et de créer beaucoup plus de détails et de concepts complexes par rapport à son prédécesseur (DALL-E 2).
"Les systèmes modernes de conversion texte-image ignorent souvent les mots ou les descriptions, obligeant les utilisateurs à apprendre l'ingénierie rapide", explique OpenAI. "Le DALL-E 3 représente un énorme pas en avant dans notre capacité à créer des images qui correspondent précisément au texte que vous tapez."
Cela inclut la création de rendus des moindres détails d'une invite de texte et l'organisation des éléments de la scène en conséquence, comme la lune au-dessus de la rue dans l'image ci-dessous.
DALL-E 3 promet de restituer les mains humaines avec plus de précision, une tâche trop difficile pour de nombreux générateurs d'images. Son rival le plus proche, Midjourney, a annoncé une mise à jour similaire le mois dernier, avec une nouvelle fonctionnalité qui permet aux utilisateurs de demander la modification d'une partie seulement d'une image (par exemple "supprimer un doigt").
OpenAI a également annoncé son intention d'intégrer DALL-E 3 à ChatGPT Plus dans les semaines à venir. En combinant les capacités linguistiques du chater avec un générateur d'images, il vise à créer des images encore plus précises avec des options de personnalisation.
"Lorsqu'on vous demande une idée, ChatGPT générera automatiquement des invites personnalisées et détaillées pour DALL-E 3 qui transformeront votre idée en quelque chose de tangible", explique OpenAI. "Si vous aimez une image particulière mais qu'elle ne vous convient pas, vous pouvez demander à ChatGPT de procéder à des ajustements en quelques mots."
DALL-E 2 n’est actuellement pas gratuit. OpenAI exige une somme modique pour les « crédits » d’image. ChatGPT Plus coûte actuellement 20 euros par mois. Le seul moteur de chat IA majeur qui propose actuellement la génération d'images gratuitement est Bing Chat AI de Microsoft.
Bing Chat fonctionne également sur le modèle de langage OpenAI GPT-4. Dans l’annonce du DALL-E 3, OpenAI reconnaît les inquiétudes croissantes concernant la paternité des photos générées par l’IA. "Nous étudions également les meilleurs moyens d'aider les gens à reconnaître lorsqu'une image a été créée par l'intelligence artificielle", explique OpenAI.
L’entreprise travaille sur un outil interne permettant de distinguer l’art généré par l’IA de celui créé par l’homme. Mais nous attendons toujours qu'OpenAI ressuscite son outil de reconnaissance de texte basé sur l'IA, qu'il a désactivé en juillet en raison de mauvaises performances.
Ils ont également évoqué un certain nombre de poursuites intentées par des artistes qui prétendent que les générateurs d’images IA sont formés sur leurs œuvres. À cette fin, OpenAI a introduit un nouvel outil qui permet aux artistes de choisir d'exclure leurs œuvres de la base de données.
OpenAI indique également que le DALL-E 3 peut rejeter les invites de commande qui nécessiteront que l'image soit rendue dans le style d'un artiste en direct. Le nouveau générateur d’images IA amélioré jette les bases pour que les images générées par l’IA deviennent monnaie courante à l’avenir. Comme ils ne sont pas protégés par le droit d'auteur selon une récente décision de justice, ils peuvent être créés, publiés et vendus sans restriction. "Vous n'avez pas besoin de notre autorisation pour réimprimer, vendre ou commercialiser", déclare OpenAI.