北京智源推出通用视觉 AI 模型 SegGPT:可自动追踪并分割影音中的物体
发表于:2025-02-22 作者:千家信息网编辑
千家信息网最后更新 2025年02月22日,感谢CTOnews.com网友 肖战割割 的线索投递!CTOnews.com 5 月 31 日消息,在 2023 年中关村论坛人工智能大模型发展论坛中,北京智源人工智能研究院推出了旗下通用分割模型 S
千家信息网最后更新 2025年02月22日北京智源推出通用视觉 AI 模型 SegGPT:可自动追踪并分割影音中的物体▲ 图源 Arxiv ▲ 图源 Arxiv
感谢CTOnews.com网友 肖战割割 的线索投递!
CTOnews.com 5 月 31 日消息,在 2023 年中关村论坛人工智能大模型发展论坛中,北京智源人工智能研究院推出了旗下通用分割模型 SegGPT(Segment Everything In Contex)。
据称,SegGPT 模型是智源通用视觉模型 Painter 的衍生模型,具备上下文推理能力,在训练完成后只需要提供示例即可推理并完成对应分割任务,包括图像和视频中的实例、类别、零部件、轮廓、文本、人脸、医学图像等,都可以利用视觉提示词(Prompt)完成分割任务。
SegGPT 也拥有支持任意数量视觉提示的推理能力。能够以第一帧图像和对应的物体掩码作为上下文示例进行自动视频分割,并且可以用掩码的颜色作为物体的 ID,进行自动追踪。
CTOnews.com经过查询知悉,此前 Meta 也发布了其基于 AI 的 Segment Anything Model (SAM)模型 ,具有识别和分离图像和视频中特定对象的能力。而威斯康辛麦迪逊、微软、港科大等机构的研究人员也推出 SEEM 模型,通过不同的视觉提示和语言提示,一键分割图像、视频。CTOnews.com的小伙伴们可以从这里访问模型的论文链接。
模型
图像
视觉
视频
提示
能力
推理
物体
上下
上下文
人工
人工智能
任务
智能
示例
论坛
研究
北京
不同
人员
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
网络安全三大协议
网络技术和会计哪个好学
制作web网页数据库
lol服务器有问题导致挂机
需要多长时间部署云服务器
濮阳有jav开发软件开发
易推广网络技术
java多线程对数据库读
网络安全人才选拔培养
船舶网络安全事例
2012服务器怎么打开屏幕键盘
软件开发密集开发周期
西安app软件开发制作
上海市内软件开发公司
软件实施为什么要求数据库
数据库技术(mysql)
大话西游2春绿江南服务器联赛队
苏州服务器没热水
物流 平台 软件开发
常规软件开发诚信服务
计算机网络技术相关毕业论文
餐厅点餐系统数据库总结致谢
浙江京通通达网络技术有限公司
jsp里数据库选择语句
云南品质软件开发咨询报价
数据库管理员的任务
天地图一键制图功能数据库
网络安全的危害性的作文开头
自学软件开发贴吧
数据库怎样制作报表
相关文章
- 25 周年纪念作,情怀拉满但诚意欠缺:《勇者斗恶龙 怪物仙境 3》
- 联想拯救者 Y700 2023 平板推送 ZUI 15.0.723 系统灰度测试:新增“USB 网络共享”,优化底部小白条
- Streacom 推出 SG10 高端被动散热机箱:可解热 600W,1300 美元
- 3D 角色扮演策略游戏《少女前线 2:追放》公测开启,安卓、iOS、PC 多端互通
- 新能源车市:价格战开局,价值战结束
- 雪天这样拍,照片更为味道
- Cybertruck:未来物种重新定义汽车
- 2022 年我国未成年网民规模突破 1.93 亿,普及率达 97.2%
- 上映 7 天,《名侦探柯南:黑铁的鱼影》内地票房破亿、豆瓣 6.6 分
- 小岛工作室推出《死亡搁浅》联名手机手柄,预计明年发售