Logo AI fusionne avec le logo de ChatGPT

Sora est le générateur de vidéos élaboré par la société OpenAI. Ce nouvel outil d’IA crée des clips vidéo réalistes à partir de texte et produit même des scènes complexes. 

Sora : des vidéos de qualité en une minute avec du texte 

Au sein des avancées révolutionnaires des programmes DALL-E et GPT, une nouvelle plateforme prometteuse, baptisée Sora, est actuellement soumise à des essais, selon la start-up californienne collaborant avec Microsoft. Bien que toujours en phase de test, la société a dévoilé quelques vidéos intrigantes et leur processus de création. OpenAI, l’instigateur de cette initiative, affirme que ce logiciel de montage vidéo automatisé est capable de produire des clips d’une durée maximale d’une minute, tout en préservant une qualité visuelle optimale et en respectant les exigences spécifiques de l’utilisateur. Cette avancée suscite l’enthousiasme quant aux futures possibilités d’exploration créative dans le domaine de l’intelligence artificielle. 

Un générateur de vidéos capables de créer des scènes complexes  

Le nouveau générateur de vidéos, Sora, se distingue par sa capacité à « produire des scènes complexes avec plusieurs personnages, des types de mouvements spécifiques et des détails précis », comme le souligne OpenAI sur son site. En plus de cette fonctionnalité, la plateforme permet de créer des vidéos à partir d’images fixes, affirme le géant de l’intelligence artificielle. De manière impressionnante, il permet également d’étendre la durée des clips existants. Sam Altman a récemment annoncé sur le réseau social X que la société prévoit de mettre à disposition de manière expérimentale l’accès à cet outil révolutionnaire à un nombre restreint de créateurs. 

OpenAI a dévoilé les meilleures créations des utilisateurs 

Sam Altman, le PDG d’OpenAI, a incité les utilisateurs de Sora à soumettre des propositions pour la génération de vidéos, diffusant peu après les plus pertinentes sur la plateforme. Parmi ces créations captivantes, on découvre deux chiens enjoués s’ébattant dans la neige en montagne. Une autre vidéo met en scène l’envol d’une créature hybride, mi-canard mi-dragon, surplombant un magnifique coucher de soleil, avec à son dos un hamster arborant une tenue sportive. Cette démarche participative offre un aperçu de la polyvalence et de la créativité de Sora, soulignant le potentiel novateur que cette technologie pourrait apporter à l’univers de la création visuelle. 

Une avancée vers l’IA générale malgré des défauts 

Sora se positionne en tant que fondation pour « des programmes d’IA capables de comprendre et de simuler le monde réel », selon les explications de l’entreprise. Ambitionnant de marquer une avancée significative vers l’Intelligence Artificielle Générale (IAG), dépassant l’humain dans de nombreuses tâches économiquement lucratives, OpenAI place de grands espoirs dans cette nouvelle plateforme. Cependant, la société a averti que le « modèle actuel » présente des « défauts », notant des lacunes telles que la confusion entre la gauche et la droite ou une discontinuité visuelle pouvant survenir au cours d’une vidéo. Un exemple concret cité par l’éditeur souligne la complexité actuelle, illustrée par une personne mordant un biscuit, mais la vidéo ne reflétant pas cette action. 

Avec ce nouvel outil, la firme se compare aux géants du text-to-video 

Avec le dévoilement de son nouvel outil, la firme de Sam Altman a souligné l’importance de la sécurité. Elle prévoit d’organiser des simulations engageantes, invitant les utilisateurs à relever le défi de générer des dysfonctionnements ou de créer des contenus inappropriés. Cette approche vise à mieux définir les limites de la plateforme et à anticiper les potentiels risques. La société fondatrice de Sora s’engage également à impliquer des décideurs politiques, des éducateurs, et des artistes du monde entier afin de comprendre leurs préoccupations et d’identifier des cas positifs d’utilisation de cette nouvelle technologie. Il est à noter que d’autres géants technologiques tels que Meta, Google, et Runway AI, travaillant sur des applications similaires « text-to-video », ont également présenté des échantillons de leurs avancées dans ce domaine. 

Avec ETX / DailyUp 

Article similaire