La capacité des outils d’Intelligence Artificielle à manipuler les images continue de croître, il ne se passe pas une semaine, que dis-je, pas une journée sans qu’une nouveauté face son apparition. Mais si la génération d’image est déjà « magique » en soi, la manipulation des images reste complexe . DragGan apporte une réponse à cette problématique.
DragGAN, est une nouvelle technologie d’intelligence artificielle actuellement en phase de recherche (sortie prévue en juin) qui permet de manipuler les images de manière impressionnante. Au travers d’une interface simple, DragGan permet aux utilisateurs de simplement cliquer et faire glisser les éléments d’une image pour en modifier l’apparence, l’orientation ou même la physionomie.
Sommaire
ToggleDragGan offre la possibilité de modifier une image, la position d’un objet, l’attitude d’une personne ou d’un animal par un simple glissé !
La vidéo parle d’elle-même. Avec DragGan, vous pouvez changer les dimensions d’une voiture ou transformer un sourire en une grimace avec un simple clic et un glissement. Vous pouvez même faire pivoter le sujet d’une image comme s’il s’agissait d’un modèle 3D, changeant par exemple la direction dans laquelle une personne est tournée. Une démonstration a même montré un utilisateur ajustant les reflets sur un lac et la hauteur d’une chaîne de montagnes avec quelques clics.
Ce qui est vraiment intéressant dans ce travail n’est pas nécessairement la manipulation d’image en soi, mais l’interface utilisateur. Bien que nous ayons pu utiliser des outils d’IA pour générer des images réalistes depuis un certain temps, la plupart des méthodes manquent de flexibilité et de précision. DragGAN offre une solution claire à ce problème.
Son interface est exactement la même que celle de la déformation traditionnelle d’images, mais plutôt que de simplement brouiller et écraser les pixels existants, le modèle génère le sujet à nouveau. Par exemple, il peut « imaginer » du contenu occulté, comme les dents à l’intérieur de la bouche d’un lion, et peut se déformer en suivant la rigidité de l’objet, comme la flexion d’une patte de cheval.
Cependant, il est important de noter que ceci n’est qu’une démonstration pour l’instant, et il est impossible d’évaluer complètement la technologie. Par exemple, il est difficile de dire à quel point les images finales sont réalistes sur la base des vidéos à faible résolution disponibles. Mais c’est un autre exemple qui rend la manipulation d’image plus accessible.
Les exemples d’images manipulées par DragGan
Ces vidéos proviennent de la page d’accueil de l’équipe de recherche, bien que celle-ci ait été mise hors service en raison du nombre de visites envoyées par Twitter (principalement par l’utilisateur @_akhaliq, qui fait un excellent travail de mise en évidence des articles intéressants sur l’IA et qui mérite d’être suivi si cela vous intéresse). En attendant, aux vues des erreurs 500 suite à la surcharge de leur serveur, j’ai rapatrié les vidéos localement.
Quelles utilisations pour DragGan ?
La première utilisation, évidente, de DragGan, pour un photographe, qui n’a pas réussi à saisir l’expression souhaitée. Il deviendra alors très facile de faire sourire ou d’effacer un sourire du visage d’une personne. Un shooting avec une pose qui ne convient pas. Pas besoin de refaire le shooting ! Un vêtement non adapté, hop ! On l’allonge, on le raccourcit, etc.
Il n’y a pas vraiment de limite à son utilisation.
Mais comme toujours, la manipulation des images fausse la réalité, ce qui n’est pas sans danger !
Il va falloir être de plus en plus prudent dans la prise en compte de l’information. Si avant une image apportait un élément de preuve à un texte, ce n’est déjà plus le cas aujourd’hui et demain les images pourront nous faire croire à une tout autre réalité.
La page du projet : https://vcai.mpi-inf.mpg.de/projects/DragGAN/
Et toi que penses-tu de ce type d’outil ?
Formateur et Consultant en stratégie Web.
Vous souhaitez développer une stratégie de communication ? Obtenir plus de résultats avec votre site Internet ou comprendre les mécanismes des réseaux sociaux ?
DeepDive vous formera dans ces domaines grâce aux expériences acquises et notre veille permanente sur le sujet, que vous soyez une TPE, PME ou une collectivité.
Grâce à l’Agence de communication Clic-en-berry depuis 2011, nous vous aidons à réaliser des projets Web efficaces et pérennes.
J’interviens aussi sur les risques liés aux usages des réseaux sociaux en complément de formation pour adultes en reconversion ou pour les étudiants arrivant sur le marché du travail.
Intervenant dans des écoles de communication, des gestion et pour le CNAM, je peux répondre à vos demandes sur tous les sujets liés au Web en général.