千家信息网

Meta 介绍 AI 图像编辑工具 Emu Edit / Video:使用 1000 万个数据集训练,号称远超竞品

发表于:2025-02-05 作者:千家信息网编辑
千家信息网最后更新 2025年02月05日,CTOnews.com 11 月 20 日消息,Meta 昨日宣布为 Facebook 和 Instagram 推出两款基于 AI 的图像编辑工具,分别是"Emu Edit"和"Emu Video",
千家信息网最后更新 2025年02月05日Meta 介绍 AI 图像编辑工具 Emu Edit / Video:使用 1000 万个数据集训练,号称远超竞品

CTOnews.com 11 月 20 日消息,Meta 昨日宣布为 Facebook 和 Instagram 推出两款基于 AI 的图像编辑工具,分别是"Emu Edit"和"Emu Video",适用领域包括照片和视频,目前 Meta 公布了这两项 AI 工具的更多信息,CTOnews.com整理如下。

官方介绍称,Emu Edit 模型仅用文字指令就可以准确编辑图像,而通过分解文字转视频(Text-to-Video,T2V)的生成过程,开发团队公布了一种名为 Emu Video 的方法,可以改善最终生成视频的品质和多样性。

据悉,Emu Edit 号称是一种创新的影像编辑方法,目的是要简化各种影音操作任务,为视频编辑提供更多功能与更高的精确度。

Emu Edit 可以接受用户指令,进行各种形式的编辑,包括区域和全局编辑、移除和添加背景,也能够调整颜色并进行矢量图转换,或进行图像构成元素的检测和分割。

Meta 表示,Emu Edit 把视觉任务作为指令,纳入到所生成模型中,进而在视频生成和编辑中,提供更好的控制能力。研究人员指出,当前的图像编辑模型,通常会过度修改图像,或是修改不足,而 Emu Edit 的优势在于能够准确按照指令进行编辑。

Meta 使用了 1000 万个合成数据集训练 Emu Edit,号称是目前同类中规模最大的数据集,从而带来了更好的图像编辑能力,其中每个样本都包含图像输入、任务描述,以及目标输出图像。可使模型忠实地执行指令,产生"比当前所有竞品都要好的结果"。

而 Emu Video 是一种简单且高效的文字转视频生成方法,该方法运用扩散模型,并以 Emu Edit 为基础。开发团队解释,这种通过生成视频的架构能够应对外界各种输入方式,包括文字、图像、图文组合等,此外 Emu Video 也能接受文字类提示词,将用户提供的图像"动画化",从而提供了"超越过去模型的能力"。

Emu Video 将影片生成过程拆分为两个步骤,首先是根据文字提示生成图像,然后基于文字和生成图像产生视频。这种拆分步骤的影片生成方法,让研究人员可以有效地训练生成模型。

研究人员进一步解释,Emu Video 与过去 Make-A-Video 等需要一系列深度生成模型的研究不同,Emu Video 更简单,仅使用 2 个扩散模型,就能生成 512x512 分辨率、每秒 16FPS、长 4 秒钟的视频

CTOnews.com发现,Meta 援引评估数据,证明 Emu Video 生成的视频品质以及"遵循提示词的忠实程度"相对业内竞品更好。

在品质方面,有 96%受访者偏好 Emu Video 而非此前的 Make-A-Video 方案,而对于"提示词的忠实度"方面,Emu Video 获得了 85%受访者的青睐。

相关阅读:

《Meta 展示全新 AI 图像编辑工具:文本指令"指哪打哪",主体背景都能换》

生成 图像 视频 模型 指令 文字 方法 图像编辑 提示 研究 工具 数据 人员 任务 品质 研究人员 能力 训练 受访者 团队 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 网络安全横向边界 网络安全免费课件 i3四核八线程服务器 数据库下一年度的函数 数据库服务器只提供访问功能 什么是软件开发平台 奉贤区一站式软件开发推荐咨询 长葛市天气预报软件开发 国内哪些网站可以找网络技术人才 业务软件开发很没意思 常见数据库都有哪些类型 对网络安全事件进行调查和 用电脑做个ktv服务器可以吗 服务器内存64够了没 阿里云轻量服务器开安全组 用友网络算网络安全股么 合肥斑马智行网络技术有限公司 怎么调节服务器风扇转速 tomcat数据库连接未释放 网络游戏软件开发是什么 服务器 无线网络 使用网络技术学习美术的利弊 软件开发app哪家值得信赖 中华人民共各国网络安全 对网络技术基础的理解 计算机网络技术的仿真软件 舟山什么是软件开发设计 易保网络技术 上市 网络安全的日常维护 网络安全的手抄报字少画多
0