腾讯 AI 实验室在姿势引导人物图像合成方面取得新突破
发表于:2025-02-12 作者:千家信息网编辑
千家信息网最后更新 2025年02月12日,CTOnews.com 11 月 4 日消息,腾讯 AI 实验室近日推出了渐进式条件扩散模型(PCDMs),在姿态引导人物图像合成方面取得重大突破。PCDMs 由先验条件扩散模型、修复条件扩散模型和完
千家信息网最后更新 2025年02月12日腾讯 AI 实验室在姿势引导人物图像合成方面取得新突破
CTOnews.com 11 月 4 日消息,腾讯 AI 实验室近日推出了渐进式条件扩散模型(PCDMs),在姿态引导人物图像合成方面取得重大突破。
PCDMs 由先验条件扩散模型、修复条件扩散模型和完善条件扩散模型三个关键阶段组成,解决了应对源图像与目标图像的姿态不一致问题,以及在生成高质量、逼真图像方面的挑战。
PCDMs 在 DeepFashion 和 Market1501 数据集上的各项指标,明显优于其他 SOTA 方法,且在小尺度数据集 Market1501(128*64)上的 SSIM 指标得到最高的 0.3169,比第二名 PIDM 高出 3.8%。
在先验条件扩散模型第一阶段,在给定源图像和姿势坐标作为条件的情况下,先验条件扩散模型采用一个变换网络来预测目标姿势下的全局特征。
在修复条件扩散模型第二阶段,进一步完善第一阶段的全局特征,建立源图像和目标图像之间密集对应关系,该阶段可确保跨多个维度(包括图像、姿势和特征)进行对齐,对于实现逼真的结果至关重要。
在完善条件扩散模型第三阶段:在前一阶段生成初始粗粒度目标图像后,细化条件扩散模型介入以提高图像质量和纹理细节。
此阶段利用先前生成的粗粒度图像作为条件,进一步提高图像保真度并确保纹理一致性,涉及修改第一个卷积层,并使用图像编码器从源图像中提取特征。采用交叉注意力机制将纹理特征注入网络,便于纹理修复和细节增强。
CTOnews.com在此附上论文地址:https://arxiv.org/pdf/2310.06313.pdf
GitHub 地址:https://github.com/muzishen/PCDMs
条件
图像
模型
阶段
特征
目标
纹理
源图
姿势
先验
生成
方面
逼真
一致
全局
地址
姿态
指标
数据
粒度
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
失落的方舟欧洲选哪个服务器
方舟假服务器
手机怎么突然连接不上服务器
28岁转行网络安全
武汉晨萱网络安全服务有限公司
软件开发专业优势
本地文件发布服务器
服务器正常启动电脑不运行
lync服务器地址
java如何删除数据库驱动
网络安全法44
H1网络安全
网络技术有限公司宗旨
学习软件开发基础
服务器指示灯有什么意思
软件开发人员考核评价表
c服务器端开发高并发
做软件开发课程的公司
浪潮财务软件开发
石家庄软件开发公司有几家
数据库hang
软件开发人员的绩效
源代码数据库文件名称
软件开发岗位指标
数据库的数据包含什么
网络安全是基建不可或缺的力量
软件开发项目开工申请
连云港oa系统软件开发
厦门信息学校计算机网络技术
计算机网络安全基础内容
相关文章
- 25 周年纪念作,情怀拉满但诚意欠缺:《勇者斗恶龙 怪物仙境 3》
- 联想拯救者 Y700 2023 平板推送 ZUI 15.0.723 系统灰度测试:新增“USB 网络共享”,优化底部小白条
- Streacom 推出 SG10 高端被动散热机箱:可解热 600W,1300 美元
- 3D 角色扮演策略游戏《少女前线 2:追放》公测开启,安卓、iOS、PC 多端互通
- 新能源车市:价格战开局,价值战结束
- 雪天这样拍,照片更为味道
- Cybertruck:未来物种重新定义汽车
- 2022 年我国未成年网民规模突破 1.93 亿,普及率达 97.2%
- 上映 7 天,《名侦探柯南:黑铁的鱼影》内地票房破亿、豆瓣 6.6 分
- 小岛工作室推出《死亡搁浅》联名手机手柄,预计明年发售