科学家开发 DIRFA:输入图片和音频,可生成说话视频
发表于:2025-02-06 作者:千家信息网编辑
千家信息网最后更新 2025年02月06日,CTOnews.com 11 月 17 日消息,来自新加坡南洋理工大学(NTU Singapore)的科研团队近日开发出了 DIRFA 工具,用户给一张图片以及音频内容,可以自动生成 3D 视频,并实
千家信息网最后更新 2025年02月06日科学家开发 DIRFA:输入图片和音频,可生成说话视频
CTOnews.com 11 月 17 日消息,来自新加坡南洋理工大学(NTU Singapore)的科研团队近日开发出了 DIRFA 工具,用户给一张图片以及音频内容,可以自动生成 3D 视频,并实现口型和声音的同步协调。
DIRFA 的全称为 DIverse yet Realistic Facial Animations,训练了超过 6000 多人的 100 万个视频片段,音频片段来自一个名为 VoxCeleb2 数据集的开源数据库,并关联面部表情和头部运动。
研究人员表示,DIRFA 可能会在包括医疗保健在内的各个行业和领域带来新的应用,因为它可以实现更复杂和逼真的虚拟助手和聊天机器人,从而改善用户体验。
DIRFA 还可以作为言语或面部残疾人士的强大工具,帮助他们通过富有表现力的头像或数字表示来传达他们的想法和情感,从而增强他们的沟通能力。
CTOnews.com附上论文参考地址:Rongliang Wu, Yingchen Yu, Fangneng Zhan, Jiahui Zhang, Xiaoqin Zhang, Shijian Lu. Audio-driven talking face generation with diverse yet realistic facial animations. Pattern Recognition, 2023; 144: 109865 DOI: 10.1016/j.patcog.2023.109865
视频
音频
工具
数据
片段
用户
面部
复杂
强大
逼真
人员
人士
保健
全称
助手
医疗
医疗保健
口型
团队
图片以及
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
软件开发应届生笔试题答案
游戏服务器安全判断
jbpm4.4数据库
监管码服务器能不能安装360
国内时间服务器
网络安全黑板报简笔画素材
如何测试服务器硬盘IO
监控pc端软件开发
js登录mysql数据库
vb 从数据库取数据类型
厦门惟客网络技术
维护网络安全的口号
会有互联网科技游戏
光传输网络技术发展
王者荣耀虚拟机服务器
网络安全伊胜伟
曙光服务器开机进入安全模式
广达服务器风扇设置
山西省网络安全宣传动画视频
服务器在国外的直播网安全吗
精灵宝可梦电脑服务器
租用韩国服务器光算云可以不
重大网络安全处置工作
本地服务器云化
昌平区智能网络技术价格行情
网络安全监管的目的
益阳学数据库软件应用能力哪里好
vb连接本机数据库吗
im聊天记录储存数据库
合川网络安全宣传
相关文章
- 25 周年纪念作,情怀拉满但诚意欠缺:《勇者斗恶龙 怪物仙境 3》
- 联想拯救者 Y700 2023 平板推送 ZUI 15.0.723 系统灰度测试:新增“USB 网络共享”,优化底部小白条
- Streacom 推出 SG10 高端被动散热机箱:可解热 600W,1300 美元
- 3D 角色扮演策略游戏《少女前线 2:追放》公测开启,安卓、iOS、PC 多端互通
- 新能源车市:价格战开局,价值战结束
- 雪天这样拍,照片更为味道
- Cybertruck:未来物种重新定义汽车
- 2022 年我国未成年网民规模突破 1.93 亿,普及率达 97.2%
- 上映 7 天,《名侦探柯南:黑铁的鱼影》内地票房破亿、豆瓣 6.6 分
- 小岛工作室推出《死亡搁浅》联名手机手柄,预计明年发售