微软携手 Project Gutenberg,利用 AI 语音技术制作 5000 本免费有声书
CTOnews.com 9 月 12 日消息,微软近日与"免费数字图书馆计划"Project Gutenberg 合作,利用 AI 为电子书库制作了超过 5000 本免费有声书。
据悉,在这一项目中,研究人员结合了机器学习、自动文本选择和自然语音合成等多项 AI 技术,实现了电子书自动转化为语音的全流程。
CTOnews.com经过查询得知,项目团队首先开发出一种算法,可以自动分析电子书的结构,区分正文和非关键部分的页码、表格等,然后使用 WaveNet、Tacotron 和 FastSpeech 等文本转语音技术,生成类似真人的自然朗读语音。此外,该团队还使系统能够辨别书中叙述者、对话和不同角色,并相应调整语音,实现故事情节的语音表达。
微软表示,此次计划已收集整理了超过 35000 小时的有声书语音数据,涵盖了各类经典文学、戏剧、传记等作品,这些语音数据都将以开源方式免费提供。用户也可以用自己录制的少量语音,生成"用自己的声音朗读整本书"的效果,这一项目相对丰富了网站有声书的内容,同时也为视障人士提供了便利。
参考
Thousands of free and open audiobooks powered by Microsoft AI
Project Gutenberg 官网
论文 Large Scale Intelligent Microservices
- 上一篇
酷比魔方 iWork GT 12 平板今晚开卖:搭载 R5 7520U 处理器,3299 元
CTOnews.com 9 月 12 日消息,酷比魔方 iWork GT 12 平板今晚 8 点开卖,搭载 R5 7520U 处理器,16G + 512G 首发 3299 元。IT 之家整理酷比魔方
- 下一篇
始终唯一!连续 7 年入选 Gartner SFA 全球魔力象限,销售易引领中国 CRM
近日,全球权威研究机构 Gartner 正式公布 2023 年销售自动化 (Sales Force Automation, 缩写为 SFA, 为 CRM 核心模块) 魔力象限报告,销售易 (Neocr
相关文章
- 25 周年纪念作,情怀拉满但诚意欠缺:《勇者斗恶龙 怪物仙境 3》
- 联想拯救者 Y700 2023 平板推送 ZUI 15.0.723 系统灰度测试:新增“USB 网络共享”,优化底部小白条
- Streacom 推出 SG10 高端被动散热机箱:可解热 600W,1300 美元
- 3D 角色扮演策略游戏《少女前线 2:追放》公测开启,安卓、iOS、PC 多端互通
- 新能源车市:价格战开局,价值战结束
- 雪天这样拍,照片更为味道
- Cybertruck:未来物种重新定义汽车
- 2022 年我国未成年网民规模突破 1.93 亿,普及率达 97.2%
- 上映 7 天,《名侦探柯南:黑铁的鱼影》内地票房破亿、豆瓣 6.6 分
- 小岛工作室推出《死亡搁浅》联名手机手柄,预计明年发售