微软发布 AI 声音生成工具 VALL-E,只需 3 秒音频即可模仿人说话
发表于:2025-02-16 作者:千家信息网编辑
千家信息网最后更新 2025年02月16日,感谢CTOnews.com网友 OC_Formula 的线索投递!CTOnews.com 1 月 10 日消息,微软最近发布了一款名为 VALL-E 的人工智能工具,只需 3 秒音频即可模仿人说话。该
千家信息网最后更新 2025年02月16日微软发布 AI 声音生成工具 VALL-E,只需 3 秒音频即可模仿人说话
感谢CTOnews.com网友 OC_Formula 的线索投递!
CTOnews.com 1 月 10 日消息,微软最近发布了一款名为 VALL-E 的人工智能工具,只需 3 秒音频即可模仿人说话。
该工具经过 60000 小时英语语音数据的训练,并使用特定语音的 3 秒剪辑来生成内容。与目前的许多人工智能工具不同,VALL-E 可以复制说话者的情绪和语气,即使说话者本人从未说过的单词也可以模仿。
CTOnews.com了解到,康奈尔大学的一篇论文使用 VALL-E 合成了几种声音,大家可以在 GitHub 上聆听这些 AI 合成的音频。
研究人员指出,在许多情况下,Vall-E 的性能优于当前的文本到语音转换模型。然而,该研究还写道,人工智能模型目前存在几个问题。例如,文本提示中的某些单词可能会发音不清晰、完全遗漏或在输出中出现两次。此外,该模型目前难以模仿某些声音,尤其是带有口音的声音。
像其他 AI 新技术一样,VALL-E 在安全、伦理等方面也引发了担忧。微软发布了关于使用 VALL-E 的道德声明,但未来的使用用途方面没有明确说明。
目前,微软 Vall-E 尚未开源。微软已经在 GitHub 上创建了一个 Vall-E 存储库,但目前只包含一个描述文件。
微软
声音
工具
人工
人工智能
智能
模型
语音
音频
单词
文本
方面
研究
只需
生成
不同
安全
人员
从未
伦理
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
类似于cgss的数据库
网络安全事件的影响
山东金前程网络技术
江苏办公系统软件开发大概多少钱
网络安全开设的大学排名
澄久网络技术有限公司
党委的网络安全责任
战地5各个服务器
常见网络安全市场报价
千锋教育网络安全视频网盘
广东正规软件开发推荐货源
轻化工大学计算机网络技术
电脑出现服务器远程调用
优惠券软件开发多少钱
西安易龙软件开发
网络安全流量是什么意思
bim企业数据库建设
安卓软件开发常用单词
软件开发的原则和方法
河源通信软件开发价钱
互联网科技国家政策
蚂蚁数据库什么意思
互联网科技对现在的有利影响
服务器代理ip国外
win7服务器配置管理
鞍山吕优网络技术有限公司
湖北信息软件开发
网络服务器主要功能
德阳网络技术联系方式
互联网科技名词含义是什么
相关文章
- 25 周年纪念作,情怀拉满但诚意欠缺:《勇者斗恶龙 怪物仙境 3》
- 联想拯救者 Y700 2023 平板推送 ZUI 15.0.723 系统灰度测试:新增“USB 网络共享”,优化底部小白条
- Streacom 推出 SG10 高端被动散热机箱:可解热 600W,1300 美元
- 3D 角色扮演策略游戏《少女前线 2:追放》公测开启,安卓、iOS、PC 多端互通
- 新能源车市:价格战开局,价值战结束
- 雪天这样拍,照片更为味道
- Cybertruck:未来物种重新定义汽车
- 2022 年我国未成年网民规模突破 1.93 亿,普及率达 97.2%
- 上映 7 天,《名侦探柯南:黑铁的鱼影》内地票房破亿、豆瓣 6.6 分
- 小岛工作室推出《死亡搁浅》联名手机手柄,预计明年发售