Les Chinois jouent un rôle de plus en plus important sur le marché des solutions d’IA. Un exemple est Tencent (entreprise chinoise spécialisée dans la conception de jeux vidéo et propriétaire de la célèbre application de chat WeChat). Il a poussé cette semaine une nouvelle version de son modèle d’IA générative utilisé pour créer des vidéos sur son référentiel GitHub.

Il s’agit d’un logiciel open source appelé DynamiCrafter. Comme d’autres outils génératifs de ce type actuellement disponibles sur le marché, DynamiCrafter utilise la méthode de diffusion pour transformer du texte et des images en courtes vidéos. Le phénomène de diffusion, connu en physique, a été utilisé en l’occurrence par des logiciels d’apprentissage automatique pour transformer des données simples en messages plus complexes et réalistes, en l’occurrence des vidéos. La deuxième génération de DynamiCrafter vous permet de créer des vidéos avec une résolution de 640 × 1024 pixels (la version précédente prenait en charge une résolution de 320 × 512).

Les créateurs de l’outil informent que la technologie qu’ils utilisent diffère des technologies utilisées par les concurrents dans la mesure où elle étend l’utilisation des techniques d’animation d’images à des contenus visuels plus généraux. Les Chinois ont réalisé de grandes avancées dans ce domaine : outre Tencent, des sociétés telles que ByteDance, Baidu et Alibaba ont également développé leurs propres modèles d’IA pour transformer des messages texte ou des images en vidéos. Nous parlons d’outils comme MagicVideo (un produit ByteDance), UniVG (un produit Baidu) et VGen (un produit Alibaba) qui sont déjà apparus sur GitHub. Cependant, ce sont toutes des versions de démonstration et aucune d’entre elles n’est encore disponible publiquement.

A lire également