表情最逼真机器人靠 AIGC 再进化,接入 Stable Diffusion 学会用笔画画
把 Stable Diffusion 接入机器人会怎样?
告诉它你想让它画什么,然后一笔一笔画出来。
只见它一边与旁边的人类工程师谈笑风生,一边熟练地用马克笔在白板上画出一只简笔的猫。
最后还不忘签下自己的名字"Ameca",然后抬起执笔的手,用眼神继续审视着刚刚完成的作品。
当 Ameca 询问人类对它的作品是否满意的时候,工程师老哥耿直地回答"这画的有点简略了"。
然后高能来了。
Ameca 生气地呛了回去:
如果你不喜欢我的画,你可能只是不懂艺术。
机器人 Ameca,来自英国公司 Engineered Arts,之前就以表情逼真到吓人出名过一次。
现在它 get 到用笔画画的新能力,又惊艳了一众网友。
每一笔画完后轻轻举起笔,就像一个真正的素描艺术家一样,这个小细节太酷了。
机器人怎么用笔画画的?
Ameca 具体是怎么学会画画的,它自己就能解释明白:
我使用开源的 Stable Diffusion,对生成的图像做骨架化和向量化,然后再把转化出的轨迹转换成动作并执行。
就这样,Ameca 的身体动作和面部表情由 Engineered Arts 自研技术驱动,语言能力来自 GPT-3(没错,不是 3.5),再加上 Stable Diffusion,组成了一位机器人画家。
有网友表示,这样的能力在教育中很有用,对于学生来说,用机器人比盯着电脑屏幕看有意思多了。
Engineered Arts 自研技术包括机器人操作系统 Tritium 和机器人生产平台 Mesmer。
首先用 36 台摄像机无死角捕捉海量真人面部数据,包括骨骼结构,皮肤纹理和表情等。
对这些数据做 3D 建模,并 3D 打印出机器人的硅胶皮肤。
Tritium 操作系统连接了硬件、软件和云端,可以驱动机器人的每一个组件,除了面部,还会牵动头颈、肢体的不同"肌肉"。
最终实现更逼真的表情。
再加上语言模型 GPT-3 和语音技术,Ameca 已经初步具备了与人类互动的能力。
这次除了画画以外,Engineered Arts 还公布了另一条人类与 Ameca 讨论音乐的视频,或许暗示这是下一个挑战方向。
Ameca 说自己喜欢爵士古典和电子乐,人类给他出的难题"如果要把这三种风格融合在一起写一首歌,第一句歌词是什么。"
Ameca 略加思索就给出了回答。
另外 Ameca 还在搞一场与网友互动的活动。
如果你有什么问题想问它,可以去原视频评论区留言,下一条视频可能就是 Ameca 回答你的问题了。
参考链接:
[1]https://www.youtube.com/watch?v=_1OA_9_wW70
[2]https://www.youtube.com/watch?v=L32BRcvnWRU
[3]https://www.engineeredarts.co.uk/mesmer-creation/
本文来自微信公众号:量子位 (ID:QbitAI),作者:梦晨
相关文章
- 25 周年纪念作,情怀拉满但诚意欠缺:《勇者斗恶龙 怪物仙境 3》
- 联想拯救者 Y700 2023 平板推送 ZUI 15.0.723 系统灰度测试:新增“USB 网络共享”,优化底部小白条
- Streacom 推出 SG10 高端被动散热机箱:可解热 600W,1300 美元
- 3D 角色扮演策略游戏《少女前线 2:追放》公测开启,安卓、iOS、PC 多端互通
- 新能源车市:价格战开局,价值战结束
- 雪天这样拍,照片更为味道
- Cybertruck:未来物种重新定义汽车
- 2022 年我国未成年网民规模突破 1.93 亿,普及率达 97.2%
- 上映 7 天,《名侦探柯南:黑铁的鱼影》内地票房破亿、豆瓣 6.6 分
- 小岛工作室推出《死亡搁浅》联名手机手柄,预计明年发售