Ce site a rapporté le 16 novembre que Microsoft avait lancé un outil d'IA appelé « Avatar Azure AI Speech text to Speech (TTS) » pour Azure AI Speech lors de la conférence Ignite, qui prétend être capable de générer des avatars humains réalistes (avatars numériques). personnes), cet outil est actuellement ouvert au public pour un aperçu et un essai.
Microsoft a déclaré que les utilisateurs peuvent utiliser l'avatar de synthèse vocale (TTS) Azure AI Speech pour créer des avatars virtuels basés sur "la saisie de texte pour prononcer du contenu", et le combiner avec une formation photo en personne réelle pour créer un avatar virtuel basé sur sur de vraies personnes. Le « chatbot interactif » peut être utilisé dans des scénarios de marketing d'entreprise, d'affaires ou de service client.
Il est rapporté que cet avatar de synthèse vocale (TTS) Azure AI Speech comprend principalement trois modules, à savoir l'analyseur de texte, le synthétiseur vocal TTS et le synthétiseur d'avatar virtuel TTS :Tout d'abord, l'analyseur de texte sera utilisé par les utilisateurs Le contenu du texte saisi est analysé et une séquence de phonèmes est générée. Ensuite, le modèle vocal TTS dans le synthétiseur vocal TTS prédit les caractéristiques acoustiques du texte saisi par l'utilisateur et synthétise le son. Enfin, le modèle de synthèse sonore du réseau neuronal Avatar prédira l'image de la forme des lèvres du personnage en fonction des caractéristiques acoustiques ci-dessus, et formera enfin une image d'avatar virtuelMicrosoft explique que la production traditionnelle de personnages virtuels prend du temps et est laborieuse, nécessitant la construction d'un environnement de tournage dédié et de post-montage. Le processus nécessite également des coûts considérables. Utilisant désormais le dernier service de rôle de synthèse vocale (TTS) Azure AI Speech de Microsoft, une fois le modèle établi, les utilisateurs n'ont plus qu'à saisir du texte pour créer diverses introductions de produits et vidéos interactives. La combinaison du service Microsoft Azure OpenAI et de la fonction TTS de réseau neuronal peut également présenter une expérience interactive plus naturelle Ce site a constaté que Microsoft affirmait par exemple que les utilisateurs pouvaient utiliser l'avatar Azure AI Speech TTS pour produire par lots divers contenus vidéo. Par exemple, des vidéos sur la culture d'entreprise, des présentations de produits ou l'avatar numérique du PDG lors de conférences. Vous pouvez également créer des humains numériques de diffusion virtuelle en direct, des robots de discussion, des robots d'entreprise ou des professeurs d'IA pour l'enseignement en ligne, etc. Microsoft a déclaré que les avatars de synthèse vocale (TTS) Azure AI ont été déployés auprès des abonnés Azure et prennent en charge plusieurs langues. Les utilisateurs peuvent sélectionner le personnage souhaité parmi les options d'avatar prédéfinies ou personnaliser l'avatar Si l'utilisateur souhaite personnaliser l'avatar, il doit télécharger une série de clips vidéo de personnages. La plateforme Azure traitera ces vidéos en ligne et générera des avatars virtuels. Le personnage lui-même est séparé de la source sonore. Les utilisateurs peuvent choisir la source sonore officielle par défaut ou télécharger leur propre source sonore d'entraînement
.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!