千家信息网

微软公布 Text To Speech Avatar AI 工具:可制作虚拟 3D 数字人、基于 Azure 平台

发表于:2024-09-21 作者:千家信息网编辑
千家信息网最后更新 2024年09月21日,CTOnews.com 11 月 16 日消息,微软在 Ignite 大会中,为 Azure AI Speech 推出了一项名为"Azure AI Speech text to speech (TTS
千家信息网最后更新 2024年09月21日微软公布 Text To Speech Avatar AI 工具:可制作虚拟 3D 数字人、基于 Azure 平台

CTOnews.com 11 月 16 日消息,微软在 Ignite 大会中,为 Azure AI Speech 推出了一项名为"Azure AI Speech text to speech (TTS) avatar"的 AI 工具,号称可以生成人类逼真虚拟化身(数字人),目前这款工具已经开放给大众预览试用。

微软表示,用户使用 Azure AI Speech text to speech (TTS) avatar,可以建立基于"输入文字说出内容"的虚拟化身,并结合现实人物照片训练,建立以真实人物为基础的"互动式聊天机器人",可用于企业的营销、业务或客户服务等场景。

据悉,这项 Azure AI Speech text to speech (TTS) avatar 主要包含三个模块,分别是文字分析器、TTS 声音合成器及 TTS 虚拟化身合成器:

文字分析器会先分析用户输入的文字内容,产生音素序列(phoneme sequence)。接着 TTS 声音合成器中的 TTS 语音模型会预测用户输入文字的声学特征,再合成声音。最后,由神经网络声音合成模型 Avatar,根据上述声学特征预测人物的唇形影像,最终形成虚拟化身影像。

微软解释,传统虚拟化身制作费时耗工,需要建立专用拍摄环境、而拍摄剪辑后期过程也相当花成本。而当下运用微软最新的 Azure AI Speech text to speech (TTS) avatar 服务,在初次建立模型后,用户只要输入文字就可以制作各种产品介绍、互动视频等。配合微软 Azure OpenAI Service 及神经网络 TTS 功能,还能呈现更自然的互动体验。

CTOnews.com发现,微软举例声称,用户可利用 Azure AI Speech TTS avatar 批量制作各种视频内容,例如企业文化影片、产品介绍或 CEO 在大会上的数字分身。也可以制作虚拟直播数字人、聊天机器人、业务机器人、或线上教学的 AI 老师等。

微软表示,Azure AI Speech text to speech (TTS) avatar 目前已经向 Azure 订阅用户推出,支持各种语言,用户可以从预设的虚拟化身选项中挑选想要的角色,也可以自行定制虚拟化身。

如果用户想要自行定制虚拟化身,则需要上传一批人物视频片段,Azure 平台就会在线上处理这些视频,从而生成虚拟化身。角色本身与音源分开,用户可以选择官方提供的默认音源,也可以自行上传训练音源。

相关阅读:

《12 月上线,微软发布 Personal Voice:最短 60 秒实现用户自建 AI 音频》

用户 微软 文字 制作 人物 声音 视频 输入 数字 内容 合成器 机器 机器人 模型 音源 分析 工具 业务 产品 企业 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 数字媒体技术网络安全 列举四种软件开发模型有哪些 linux获取服务器sn号 2020互联网科技战疫论坛 网络安全技术人才需求分析 内蒙古运营软件开发资格 嵌入式软件开发需要学qt么 机器学习框架下数据库学习 水利网络安全管理办法(试行 与许可证服务器的连接丢失 怎么实现saas软件开发 比亚迪西安软件开发岗怎么样 群晖服务器怎么升级 网络技术基础名词解释电路交换 x86服务器包括什么 网络安全竞赛培训视频 网络安全再提升 家用电脑和网站服务器有什么区别 dz论坛优化数据库 白云区新一代网络技术开发工艺 预防网络安全征文 适合英语专业的外文数据库 明日之后的游戏服务器怎么找 4G和5G网络技术性能 台州市网络安全宣传周 人社局网络安全责任追究制度 数据库使用时间 北京亿维视讯网络技术 梁平县网络技术培训 河北网络技术服务采购
0