Meta 推出 Seamless Communication AI 翻译套件:支持近百种语言输入、同声延迟仅 2 秒
CTOnews.com 12 月 4 日消息,Meta 日前公布了 AI 翻译套件 Seamless Communication,该套件由 4 款 AI 模型组成,Meta 声称,该 AI 套件能够"精准再现说话者情绪",可实现延迟仅 2 秒的同声传译能力、并支持近百种语言输入。
据悉,Seamless Communication 是 Meta 庆祝自家 AI 研究机构"Fundamental AI Research"成立 10 周年所发表的研究成果。
Meta 介绍称,该套件包含用于加速翻译的"第二代 SeamlessM4T 模型"、口译模型"Seamless Expressive"、 同声翻译模型"Seamless Streaming",与综合模型"Seamless",CTOnews.com整理相关信息如下:
SeamlessM4T 模型号称能在翻译时基于用户说话内容,自动联想可能的后文,以加速翻译。
Seamless Expressive 是一种口译模型,号称可以解决"传统 AI 翻译无法抓住用户语调、停顿、读词重轻度的问题",能够在维持翻译品质的基础上,保存用户情绪、风格、说话速度、停顿和节奏,从而为翻译内容带来更多"情感信息"。
Seamless Streaming 是同声翻译模型,主打 2 秒延迟的语音和文字翻译,支持口译(speech-to-speech translation)、听写翻译(speech-to-text translation,S2TT)及自动语音识别功能(Automatic speech recognition ,ASR)。
而综合模型 Seamless,则是整合了上述三种语言模型,便于通用场景。
目前 Meta 已经将示例视频发布在 GitHub 以及 HuggingFace 网站上,感兴趣的小伙伴们可以点此进行查看。
相关文章
- 25 周年纪念作,情怀拉满但诚意欠缺:《勇者斗恶龙 怪物仙境 3》
- 联想拯救者 Y700 2023 平板推送 ZUI 15.0.723 系统灰度测试:新增“USB 网络共享”,优化底部小白条
- Streacom 推出 SG10 高端被动散热机箱:可解热 600W,1300 美元
- 3D 角色扮演策略游戏《少女前线 2:追放》公测开启,安卓、iOS、PC 多端互通
- 新能源车市:价格战开局,价值战结束
- 雪天这样拍,照片更为味道
- Cybertruck:未来物种重新定义汽车
- 2022 年我国未成年网民规模突破 1.93 亿,普及率达 97.2%
- 上映 7 天,《名侦探柯南:黑铁的鱼影》内地票房破亿、豆瓣 6.6 分
- 小岛工作室推出《死亡搁浅》联名手机手柄,预计明年发售