科学家开发 DIRFA:输入图片和音频,可生成说话视频
发表于:2024-11-23 作者:千家信息网编辑
千家信息网最后更新 2024年11月23日,CTOnews.com 11 月 17 日消息,来自新加坡南洋理工大学(NTU Singapore)的科研团队近日开发出了 DIRFA 工具,用户给一张图片以及音频内容,可以自动生成 3D 视频,并实
千家信息网最后更新 2024年11月23日科学家开发 DIRFA:输入图片和音频,可生成说话视频
CTOnews.com 11 月 17 日消息,来自新加坡南洋理工大学(NTU Singapore)的科研团队近日开发出了 DIRFA 工具,用户给一张图片以及音频内容,可以自动生成 3D 视频,并实现口型和声音的同步协调。
DIRFA 的全称为 DIverse yet Realistic Facial Animations,训练了超过 6000 多人的 100 万个视频片段,音频片段来自一个名为 VoxCeleb2 数据集的开源数据库,并关联面部表情和头部运动。
研究人员表示,DIRFA 可能会在包括医疗保健在内的各个行业和领域带来新的应用,因为它可以实现更复杂和逼真的虚拟助手和聊天机器人,从而改善用户体验。
DIRFA 还可以作为言语或面部残疾人士的强大工具,帮助他们通过富有表现力的头像或数字表示来传达他们的想法和情感,从而增强他们的沟通能力。
CTOnews.com附上论文参考地址:Rongliang Wu, Yingchen Yu, Fangneng Zhan, Jiahui Zhang, Xiaoqin Zhang, Shijian Lu. Audio-driven talking face generation with diverse yet realistic facial animations. Pattern Recognition, 2023; 144: 109865 DOI: 10.1016/j.patcog.2023.109865
视频
音频
工具
数据
片段
用户
面部
复杂
强大
逼真
人员
人士
保健
全称
助手
医疗
医疗保健
口型
团队
图片以及
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
组态软件开发板和运行版
宁夏gps时钟同步数显钟服务器
软件开发工程师笔试真题
多个数据库数据一致性
服务器配置时间不对
网络安全并购事件
软件开发是否应该抹杀个人创造性
信息论与编码和网络安全的关系
防伊对相亲软件开发
小程序软件开发价格表
网络安全服务有访问控制技术
茂名市卫健局网络安全等级保护
云浮定制软件开发
什么叫网络安全系统
服务器级别电脑
德普软件开发公司
绩效系统软件开发
成都2019网络安全
衡水有软件开发
中医辅助软件开发研究员
服务器刷题
国家积极展开什么网络技术研发
数据库保存不了中文乱码
数据库切换硬模式
虹口区市场软件开发市场价格
网络技术带动无人驾驶
软件开发课程免费学习网站
海量数据库的四大技术是
科技it互联网
新乡佳信网络技术有限公司
相关文章
- 25 周年纪念作,情怀拉满但诚意欠缺:《勇者斗恶龙 怪物仙境 3》
- 联想拯救者 Y700 2023 平板推送 ZUI 15.0.723 系统灰度测试:新增“USB 网络共享”,优化底部小白条
- Streacom 推出 SG10 高端被动散热机箱:可解热 600W,1300 美元
- 3D 角色扮演策略游戏《少女前线 2:追放》公测开启,安卓、iOS、PC 多端互通
- 新能源车市:价格战开局,价值战结束
- 雪天这样拍,照片更为味道
- Cybertruck:未来物种重新定义汽车
- 2022 年我国未成年网民规模突破 1.93 亿,普及率达 97.2%
- 上映 7 天,《名侦探柯南:黑铁的鱼影》内地票房破亿、豆瓣 6.6 分
- 小岛工作室推出《死亡搁浅》联名手机手柄,预计明年发售