Il y a quelques jours, OpenAI a présenté son prochain modèle GenAI, qui transforme le texte en vidéo. La solution s’appelle Sora et est capable de générer un flux vidéo avec une résolution de 1080p, composé d’un arrière-plan et d’une douzaine de personnages ou d’objets animés.

L’outil peut également, comme le dit OpenAI, « étendre » les clips existants avec de nouveaux objets, ainsi que combler les détails manquants. Il peut également restituer des jeux vidéo. Sora semble assez bien interpréter le texte et crée des personnages parfois très intéressants et vivants. Fait intéressant, le modèle comprend non seulement ce que l’utilisateur demande dans la description, mais ajoute également au message des caractères existant dans le monde physique.

La page de démonstration publiée par OpenAI contient de nombreux exemples du fonctionnement de l’outil. Sora peut générer des vidéos avec différents styles. Il peut s’agir d’un film très réaliste, d’animation, en noir et blanc ou en couleur. Les films semblent réalistes et Sora ne génère pas de messages étranges et surréalistes, comme c’est souvent le cas avec d’autres outils de ce type.

OpenAI affirme travailler avec des experts pour examiner le modèle à la recherche d’exploits et créer des outils permettant de détecter si la vidéo a été générée par Sora. Il indique également que s’il décide d’intégrer le modèle dans un produit accessible au public, il veillera à ce que les métadonnées de provenance soient incluses dans les résultats générés.

A lire également