Les jumeaux numériques fonctionnels et l'avenir du divertissement vidéo

La vitesse à laquelle l’IA semble progresser est incroyable. Avant la fin de l’année dernière, la plupart d’entre nous pensaient que l’IA ne serait pas encore utile individuellement avant quelques années. Puis ChatGPT a frappé, soutenu par la technologie GPT-3, suivi rapidement par GPT-4, et tout à coup, nous sommes entourés d’intelligence artificielle qui peut améliorer notre productivité.

L’un des plus intéressants est le modèle d’IA de synthèse vidéo de DeepBrain AI, qui peut créer un jumeau numérique fonctionnel d’un humain qui peut de plus en plus assumer des tâches que l’humain qu’il reflète devrait généralement faire.

Parlons cette semaine de l’émergence du jumeau numérique humain utile. Nous terminerons avec mon produit de la semaine, le Motorola ThinkPhone de Lenovo, un smartphone qui corrige l’une des plus grosses erreurs de l’industrie informatique dans sa réponse à l’iPhone d’Apple.

Modèles d’IA de synthèse vidéo

Initialement axé sur les talents de présentateur de nouvelles, DeepBrain AI est le premier jumeau numérique humain que j’ai examiné qui peut effectuer des tâches de manière indiscernable de la façon dont l’humain les aurait faites.

Le jumeau numérique est créé en lui permettant d’apprendre à partir d’une multitude de vidéos d’actualités pour créer une base de données de connaissances sur le comportement, les caprices, la parole et les mouvements du présentateur humain.

Le jumeau numérique résultant peut être alimenté par un script, et à partir de ce script, il fonctionnera comme le présentateur de nouvelles l’aurait fait. Le jumeau numérique ne remplace pas le talent humain, et généralement, le talent est rémunéré chaque fois que le service d’actualités utilise cet avatar, principalement pour les dernières nouvelles ou des teasers en format court pour la programmation en direct à venir.

Parfois, les services d’information notent que le public regarde un avatar généré par l’IA. Là où cette technologie est déjà utilisée, elle a été acceptée par les téléspectateurs et les talents.

La raison pour laquelle le talent des nouvelles est d’accord avec cela est qu’il est rémunéré lorsque l’avatar est utilisé, et l’utilisation de l’avatar signifie que le talent n’a pas à se rendre dans un studio pour enregistrer ou enregistrer en direct de courts segments, des mises à jour ou des annonces qui habituellement exiger qu’ils retournent dans un studio.

Ainsi, l’avatar ne nuit pas à leurs revenus et complète le travail des humains en réduisant leur charge et l’aggravation qui y est associée, ce qui devrait améliorer la satisfaction au travail.

Cas d’utilisation d’avatars

Alors que la plupart des cas d’utilisation initiaux de cette technologie concernent des programmes d’information vidéo où l’avatar et le journaliste sont indiscernables (exemple en Asie), d’autres utilisations incluent :

Kiosques virtuels dans les banques où il semble que vous parliez à un humain mais que vous discutez plutôt avec une IA
Vidéos de formation à sens unique fonctionnant à partir d’un script écrit
Un concierge virtuel dans un hôtel qui peut vous aider avec des choses comme les réservations de restaurant ou les billets de spectacle
Des vidéos interactives où, encore une fois, on a l’impression de parler à une personne en direct

Certains de ces avatars n’ont jamais été de vraies personnes ; il s’agissait d’images très réalistes générées par ordinateur.

Les avantages en termes de coûts sont importants, car il en coûte généralement environ 4 000 dollars pour créer une partie de ce contenu abrégé avec une personne en direct, mais cela ne coûte qu’environ 100 dollars pour faire la même chose avec un avatar généré par ordinateur.

L’avatar ne nécessite pas de répétition et fonctionnera à partir du script écrit sans distractions comme la maladie ou l’un des conflits ou problèmes de comportement généralement associés aux talents en direct.

Étant donné que l’avatar fonctionne à partir de texte, il peut être contrôlé par d’autres IA comme ChatGPT ou Watson d’IBM, qui ont créé un niveau de contenu interactif de type humain qui pourrait tromper de nombreuses personnes en leur faisant croire qu’elles parlent à une personne vivante.

Une autre utilisation qui a été explorée est la défense des célébrités :

Les célébrités n’évoluent pas bien parce que si vous les utilisez comme défenseurs, la possibilité pour les individus de discuter avec eux est presque inexistante. Cependant, un avatar d’une célébrité pourrait interagir avec des fans à grande échelle, en plus des clients actuels ou futurs du client.

Comme indiqué, cette technologie peut scanner de vraies personnes et des personnages créés de manière artistique, ce qui pourrait résoudre certains des problèmes que des entreprises comme McDonald’s (Ronald McDonald), Kentucky Fried Chicken et Jack in the Box avaient avec l’utilisation de personnes vivantes, où tous échangeaient régulièrement acteurs pour que l’acteur ne soit pas si étroitement lié au personnage qu’ils ne puissent pas être remplacés.

Avec un avatar créé numériquement, l’entreprise possède l’acteur virtuel et les problèmes d’origine humaine s’évaporent une fois que vous avez retiré les humains du mélange.

Jumeaux numériques humains et virtuels – ce qui nous attend

L’objectif actuel de DeepBrain est d’améliorer, et non de remplacer, les gens pour la plupart. Cependant, leur utilisation d’avatars entièrement synthétisés qui n’ont aucun lien avec un humain est plus un remplacement qu’un modèle d’amélioration. Bien qu’ils se concentrent initialement sur du contenu court, rien n’empêche la technologie de passer éventuellement à des productions longues comme des émissions de télévision et des films.

La nature hyper-réaliste des avatars s’améliorera avec une formation supplémentaire et à mesure que la technologie progressera, même sous forme longue. Les acteurs virtuels deviendront indiscernables des personnes réelles même s’ils sont des amalgames de ces personnes, tout comme des produits tels que Dalle-E construisent de l’art à partir d’amalgames d’images.

Compte tenu des énormes avantages en termes de coût de l’utilisation de contenu créé virtuellement par rapport à l’action en direct, le potentiel d’une technologie comme celle-ci pour perturber l’industrie des médias est important. Pour l’avenir, ce n’est pas seulement le coût du talent qui est évité. Le coût total du studio où le talent se produirait autrement pourrait également être éliminé.

Forrester nomme NICE leader du CCaaS

Étant donné que GPT-4 fait déjà un travail intéressant avec des scripts et des histoires, vous pouvez mettre cela sur la feuille de route pour avoir des films et des émissions de télévision photoréalistes complets créés entièrement par des IA en fonction des préférences de l’utilisateur.

En fin de compte, plutôt que de regarder la même émission de télévision et le même film que tout le monde, cette technologie, combinée à l’IA générative, pourrait créer des vidéos personnalisées à grande échelle et potentiellement vous mettre, vous et votre famille, en tant qu’acteurs principaux (avec votre permission, bien sûr ).

Certes, vous pouvez ensuite partager ces vidéos sur les réseaux sociaux avec ceux qui souhaitent voir ce que les autres créent, créant potentiellement des quantités massives de contenu unique que les services auraient besoin d’analyser et de présenter à un monde de clients potentiels.

Emballer

Pouvoir créer votre jumeau pour faire une partie de votre travail, sur lequel DeepBrain AI se concentre actuellement, change la donne. Mais lorsque nous pourrons prendre des images de synthèse et faire la même chose, en particulier pour les contenus de longue durée, cela perturbera massivement toutes les formes de divertissement. L’industrie de la pornographie, par exemple, est déjà omniprésente. Le contenu de Reddit le fait depuis un certain temps et la plupart des utilisateurs ne semblent pas s’en soucier.

Tout, des personnages non-joueurs (PNJ) dans le jeu qui se présentent comme de vraies personnes, à la possibilité de créer des équipes sportives virtuelles entières avec des représentations précises de joueurs réels, imaginaires ou même morts sont tous potentiellement sur la table, tous de ce qui suggère un niveau de perturbation que nous commençons seulement à voir.

Bref, il est déjà difficile de dire ce qui est réel et ce qui ne l’est pas, et cette difficulté ne fera que croître. En matière de divertissement, cela peut s’avérer être une bonne chose, mais en ce qui concerne notre capacité à voir la vérité, cela peut avoir un impact beaucoup plus problématique. Nous ne sommes pas du tout prêts pour cela.

Produit technologique de la semaine

Lenovo ThinkPhone de Motorola

L’une des plus grandes erreurs commises par l’industrie informatique a été de se tourner entièrement vers l’iPhone. L’ironie était qu’au départ, l’industrie ne croyait pas en un smartphone axé sur le consommateur. Ensuite, plutôt que de lutter contre cette tendance sur ses mérites, il a tenté de pivoter sur l’iPhone pour transformer Apple d’un adepte tardif en un leader du marché apparemment du jour au lendemain.

Ce n’était pas la première fois que cela arrivait. Quelques décennies plus tôt, IBM a tenté de basculer vers l’informatique client/serveur et a presque abandonné le mainframe, le faisant passer du leader incontesté du marché à la quasi-disparition des affaires en quelques années.

Aujourd’hui, il existe un marché mal desservi en ce qui concerne les smartphones destinés aux entreprises. Une fois, j’ai parlé au PDG de Bank of America, qui ne voulait pas que ses employés utilisent des téléphones grand public. Il voulait quelque chose de sécurisé et axé sur les affaires comme le BlackBerry l’était autrefois, mais il était frustré que personne n’ait construit un tel appareil.

Eh bien, Lenovo vient de résoudre ce problème avec son emblématique ThinkPhone.

Lenovo ThinkPhone de Motorola

Le Lenovo ThinkPhone de Motorola (Crédit image : Lenovo)

S’appuyant sur la marque fortement axée sur les affaires du ThinkPad qui a vu le jour avec IBM, le ThinkPhone a des dimensions similaires à celles d’un iPhone, mais est doté de plusieurs fonctionnalités uniques axées sur les affaires.

Ces fonctionnalités incluent :

Connexion instantanée : Le téléphone et le PC détectent en toute transparence lorsqu’ils sont à proximité et se connectent via Wi-Fi.
Presse-papiers unifié : Transférez en toute transparence du texte copié ou des photos récentes, des documents numérisés et des vidéos entre appareils en les collant dans n’importe quelle application sur l’appareil de destination.
Notifications unifiées : Les notifications téléphoniques apparaissent instantanément sur le Centre d’action Windows. Cliquer sur une notification lance automatiquement l’application téléphonique correspondante sur l’écran du PC.
Dépôt de fichier : Glissez et déposez facilement des fichiers entre ThinkPhone et PC.
Diffusion d’applications : Ouvrez n’importe quelle application Android directement sur un PC.
Webcam avancée : Tirez parti des puissantes caméras et des capacités de l’IA du ThinkPhone, en l’utilisant de manière transparente comme webcam pour tous vos appels vidéo. Pourquoi acheter une webcam séparée alors que vous avez déjà un meilleur appareil photo sur votre smartphone ?
Point d’accès instantané : Connectez-vous à Internet en un clic directement depuis le PC pour tirer parti de la connectivité 5G du ThinkPhone. C’est énorme et atténue potentiellement le besoin et le coût de la capacité WAN de votre PC.

Comme le ThinkPad, le ThinkPhone est enveloppé de sécurité et testé selon la norme militaire 810H (MIL-STD-810H) en raison de son utilisation de fibre d’aramide (utilisée dans les gilets pare-balles), d’aluminium de qualité aéronautique et de Victus – la solution la plus robuste par Gorilla Glass.

Le ThinkPhone est étanche jusqu’à une profondeur de 1,5 mètre pendant 30 minutes maximum. Il a même un bouton rouge pour lancer une application critique. Je choisis généralement l’appareil photo car c’est ce à quoi j’ai le plus souvent besoin d’accéder rapidement. D’autres pourraient l’utiliser pour réimplémenter le push-to-talk pour la police, la sécurité et d’autres utilisations où la communication instantanée est essentielle (ceci est pris en charge dans l’application Microsoft Teams Walkie Talkie).

Forrester nomme NICE leader du CCaaS

Conçu pour embrasser la gestion à distance, ThinkPhone peut être configuré et géré de manière centralisée pour garantir la sécurité de l’appareil et qu’il n’est pas utilisé de manière inappropriée, une exigence typique pour un appareil informatique orienté entreprise. ThinkPhone dispose d’un processeur unique appelé Moto Secure qui isole les codes PIN, les mots de passe et les clés cryptographiques, les gardant dans un environnement inviolable afin que les mauvais acteurs ne puissent pas y accéder.

ThinkPhone est livré avec un chargeur universel unique et très petit de 68 W qui rechargera le téléphone en quelques minutes et est également suffisamment puissant pour alimenter la plupart des ordinateurs portables professionnels ou d’autres périphériques USB-C, mais pas des machines de jeu ou des postes de travail.

Enfin, le téléphone est équipé d’un appareil photo 50 MP de haute qualité qui devrait couvrir la plupart des besoins en matière de photo, que ce soit pour capturer un événement personnel ou pour un enquêteur d’assurance ou quelqu’un d’autre qui a besoin de créer un enregistrement de haute qualité.

Le ThinkPhone comble le vide dans les téléphones professionnels qui existait depuis que BlackBerry et Palm ont quitté le marché, et c’est mon produit de la semaine.