Tencent, le géant technologique chinois, vient de présenter son dernier modèle d’intelligence artificielle, HunyuanWorld-Voyager. Ce modèle promet de bousculer les normes en matière de création de mondes virtuels en générant des univers 3D à partir d’une simple image. Une avancée qui pourrait bien ouvrir de nouvelles perspectives pour les développeurs et créateurs de contenus numériques.
L’info résumée en 3 points
HunyuanWorld-Voyager, de Tencent, est un modèle d’intelligence artificielle qui permet de convertir des images fixes en environnements virtuels tridimensionnels. Contrairement aux techniques traditionnelles, Voyager n’a pas besoin des processus de reconstruction 3D habituels. En effet, il utilise une méthode innovante pour générer simultanément des images RVB et de profondeur, ce qui simplifie grandement la création de contenus numériques immersifs.
Le modèle a été entraîné à partir d’une vaste base de données, incluant plus de 100 000 extraits vidéo. Cela lui permet de produire des vidéos courtes qui, une fois assemblées, donnent l’illusion d’un monde 3D dynamique et en mouvement. Cette avancée technologique offre aux développeurs la possibilité d’intégrer directement ces environnements dans des applications variées.
Les capacités de Voyager ouvrent la voie à de nombreuses applications allant du transfert de style 3D à l’estimation de la profondeur vidéo. Les développeurs peuvent ainsi créer des simulations, des environnements virtuels immersifs ou encore des présentations de produits numériques sans passer par des étapes de reconstruction complexes.
Cette technologie présente également un intérêt majeur pour la formation et la simulation. En effet, la possibilité de générer des mondes virtuels interactifs à partir de simples images offre des opportunités inédites dans ces domaines.
Tencent a choisi de rendre le code de Voyager accessible via GitHub et Hugging Face. Cependant, la société impose certaines restrictions concernant l’utilisation de son modèle. Les licences excluent l’Union européenne, le Royaume-Uni et la Corée du Sud. De plus, pour toute application commerciale dépassant les 100 millions d’utilisateurs, Tencent exige des conditions de licence spécifiques.
Le modèle de Tencent a été comparé à Google Genie 3, récemment dévoilé par Google. Ce dernier permet également de créer des mondes virtuels en temps réel tout en mémorisant les déplacements précédents de l’utilisateur. Bien que similaires dans leur approche, chaque modèle présente des caractéristiques distinctes qui pourraient influencer leur adoption par les développeurs du monde entier.
Tencent, fondée en 1998, est l’une des plus grandes entreprises technologiques en Chine, connue pour ses innovations dans les domaines des réseaux sociaux, des jeux en ligne et de l’intelligence artificielle. Avec HunyuanWorld-Voyager, l’entreprise continue de repousser les limites de la technologie numérique, ouvrant de nouvelles voies dans la création de contenus 3D. En concurrence directe avec d’autres géants technologiques tels que Google, Tencent s’affirme comme un acteur majeur sur la scène internationale de l’intelligence artificielle.