IA Vidéo

Sora révolutionne le monde de la vidéo

OpenAI a secoué le monde de l'intelligence artificielle en dévoilant Sora, un outil de génération de vidéo instantanée.

En février 2024, OpenAI a secoué le monde de l'intelligence artificielle en dévoilant Sora, un outil de génération de vidéo instantanée. La promesse : transformer tout un chacun en réalisateur en permettant la création de vidéos réalistes d'une minute à partir de simples prompts.

OpenAI, pionnier dans le domaine de l'intelligence artificielle, continue de repousser les limites de l'innovation avec sa dernière création : Sora. Suivant les traces de startups comme Runway et de géants de la technologie tels que Google et Meta, le modèle d'IA générative conçu par le créateur de ChatGPT pourrait révolutionner la génération vidéo.

Les capacités étonnantes de Sora

La qualité des vidéos produites par Sora dépasse de loin les générations précédentes d'intelligences artificielles. Des exemples partagés par OpenAI et les premiers testeurs démontrent la diversité des possibilités offertes par cet outil. Ajustements de style (photoréaliste, animé ou noir et blanc), changements de plans et même la modification d'éléments au sein d'une vidéo sont à la portée de Sora, repoussant les limites de la créativité vidéo. Contrairement à de nombreux modèles de conversion texte-vidéo, Sora peut produire des vidéos d'une durée maximale d'une minute, démontrant ainsi sa capacité à raconter une histoire “étendue”. De plus, les résultats de Sora évitent généralement les pièges courants du contenu généré par l'IA, tels que les objets se déplaçant de manière physiquement impossible. Selon OpenAI, le modèle Sora pourrait même « étendre » les clips vidéo existants en remplissant les détails manquants, démontrant ainsi son adaptabilité et sa polyvalence.

Comment fonctionne Sora ?

Sora s'appuie sur une version évoluée du modèle de diffusion de DALL-E 3 combiné au puissant moteur de GPT-4. Selon Tim Brooks, l'un des chercheurs du projet, “Sora apprend la cohérence et la géométrie 3D en assimilant d'énormes volumes de données, démontrant ainsi une compréhension avancée de la grammaire cinématographique.”

Au cœur des capacités de Sora : sa compréhension approfondie du langage, lui permettant d'interpréter avec précision les prompts et de leur donner vie de manière visuellement convaincante. OpenAI souligne que Sora comprend non seulement les demandes de l'utilisateur, mais comprend également “comment ces éléments se manifestent dans le monde physique”. Une maîtrise linguistique qui permet à Sora de générer des personnages qui expriment des émotions vibrantes et des scènes qui maintiennent cohérence et réalisme. Résultat : des personnages qui non seulement bougent naturellement, mais qui présentent également un spectre d'émotions, conférant une couche de profondeur et de réalisme inédite dans le contenu généré par l'IA. Un niveau de détail dans la représentation des personnages qui ouvre de nouvelles possibilités en matière de narration et d'art numérique. "Nous apprenons à l'IA à comprendre et à simuler le monde physique en mouvement, dans le but de former des modèles qui aident les gens à résoudre des problèmes nécessitant une interaction dans le monde réel", peut-on lire sur le blog d’Open AI.

Les limites de Sora

Si la qualité d'image de Sora et sa simplicité sont bluffantes, certaines vidéos présentent toutefois ce que OpenAI a décrit comme « l’étrangeté de l’IA », comme des sujets humanoïdes ressemblant à ceux d’un jeu vidéo ou des cas de confusion spatiale et d’inexactitudes dans les relations de cause à effet. OpenAI reconnaît ces limites, notant que l’outil peut avoir du mal à simuler avec précision des scènes complexes et à comprendre des descriptions précises d'événements au fil du temps.

Les applications de Sora

Les utilisations potentielles de Sora sont vastes. Des environnements 3D aux clips musicaux générés automatiquement, en passant par la création de jeux vidéo, Sora offre un large éventail de possibilités créatives. Cependant, ces avancées ne sont pas sans susciter des interrogations sur l'avenir des métiers liés à la vidéo et de certaines industries culturelles.

L'IA pour libérer la créativité

En effet, à chaque innovation, la question des risques engendrés par ces outils d’intelligence artificielle se pose. Ce nouvel outil destiné à la vidéo d'OpenAI n'y échappe pas, soulèvant de nombreuses questions, à la fois sur l'impact pour les professionnels du secteur, mais aussi sur les risques liés à la désinformation. Dans Les Échos, Marie-Anne Ferry-Fall, directrice générale de l’ADAGP (Société des auteurs dans les arts graphiques et plastiques), alerte : "Entre mi 2022 et mi 2023, il y a eu plus d’images créées par des intelligences artificielles qu’en 150 ans de photographie !

Alors faut-il vraiment s’inquiéter ? Les IA vont-elles remplacer les humains ? Selon Florian Douetteau, fondateur de Dataiku (entreprise spécialisée dans la donnée) : « L’IA est à l’intelligence humaine ce que la fast food est à la gastronomie ». Comprenez : il y a de la place pour tout le monde. Une vision partagée par Yann le Cun, directeur du laboratoire d'intelligence artificielle de Meta. Celui qui s’est vu décerner en 2019 le prix Turing, se veut optimiste. Selon lui, l’humain n’a pas vocation à être remplacé par les IA mais augmenté : “ L'intelligence artificielle est un moyen d'amplifier l'intelligence humaine, de même que les machines sont un moyen d'amplifier la force physique, et qu’il ne faut pas avoir peur de l'intelligence artificielle.” Enfin, selon Aurélie Jean, scientifique numéricienne et entrepreneuse française spécialisée dans les algorithmes et la modélisation numérique, “l'intelligence artificielle pourrait même libérer la créativité”. Dans une chronique sur Radio France le 07 novembre 2023, elle explique : “L'intelligence artificielle peut assister les créatifs, mais elle ne peut pas remplacer la créativité humaine, car celle-ci implique des composantes émotionnelles et pratiques que les algorithmes ne peuvent pas maîtriser. “ Se basant sur une étude d’Adobe (2016) qui révélait que “près de 40 % des tâches des créatifs ne serviraient pas à leur créativité”, la chercheuse envisage alors l’IA comme un "outil libérateur au service de la créativité". Ainsi, débarrassés des tâches sans valeur ajoutée qui seront confiées aux IA, ils auront davantage de temps à consacrer à leurs talents créatifs.

L'intelligence artificielle est dans toutes les conversations. tydeo en fait un enjeu au cœur de sa stratégie pour le futur.

On en parle dans API News (actualité des entreprises et des acteurs économiques en Bretagne et en Pays de la Loire). " Avec l’IA, le marché de la vidéo connaît déjà certaines mutations. On veut réellement prendre ce virage et intégrer l’IA dans notre plateforme et nos offres pour révolutionner la manière de produire de la vidéo ".

Lire la suite sur le site API

Les articles récents

Blog
L'avenir de la communication vidéo se dessine ici.

Inscrivez-vous à notre newsletter pour obtenir les meilleures pratiques en matière de vidéo.

Vous pouvez vous désinscrire à tout moment.
Thank you! Your submission has been received!
Oops! Something went wrong while submitting the form.
Community Image tydeo - video