导航：首页 > IT资讯 >

GPT-4 发布后的第一道挑战，来自弱智吧

发表于：2024-11-22 作者：千家信息网编辑

千家信息网最后更新 2024年11月22日，文丨流年如墨审核丨千里排版丨鹿九我相信，如果未来有一天我们证实了 AI 永远赶不上人类的智慧，那其中弱智吧吧友绝对功不可没。当然，反过来意思也差不多：要是哪天 AI 连弱智吧的脑残问题都能应对如流，

千家信息网最后更新 2024年11月22日GPT-4 发布后的第一道挑战，来自弱智吧

文丨流年如墨审核丨千里

排版丨鹿九

我相信，如果未来有一天我们证实了 AI 永远赶不上人类的智慧，那其中弱智吧吧友绝对功不可没。

当然，反过来意思也差不多：要是哪天 AI 连弱智吧的脑残问题都能应对如流，那大伙离失业可能也就不远了。

就在几天前，去年年底风靡互联网的聊天 AI"ChatGPT"背后的公司 OpenAI 又推出了全新的 GPT-4。

（那时候类似这样的弱智对话相信大家见过不少）

要知道，之前就被大家评价为"程序员杀手"、"论文大师"、"作业工具人"的 ChatGPT 所使用的只是 GPT-3.5 的内核，而那些搭建在 QQ 群里的聊天机器人更大多只是调用了 GPT-3 的 api，就已经可以满足大家绝大多数的日常所需。

而在这次全面升级后，新出炉的 GPT-4 可还要牛上一个段位。

最直观的一点，是它不仅可以接收、理解文字，连图都能看懂。用户只需要上传一张图片，就能让 GPT-4 对图中内容进行点评。

从下图中的对话来看，它显然看到并看懂了这张图。

当然，你也可以故意使个坏，给它上传一张表意隐晦的互联网梗图，赌它理会不得个中深意。

然而事实却是 GPT-4 精准描述出了图中的内容，并且分条列点地讲出了其中所包含的笑点。

（乐子来源于插口不匹配）

只可惜，这个功能暂时不对公众开放。

同时，OpenAI 似乎是在上次的测试中搞清楚了大家的兴趣所在，给 GPT-4 添加了一个角色扮演功能。听上去和之前的"猫娘洗脑咒语"系列相差不大，但从大家的实战演示来看，如今想把 AI 变成自己的专属猫娘比以前省力了不少。

当然，也可能是刚上线的 GPT-4 也没被"AI 原则"的条条框框所束缚，暂且可以和用户们玩点大的。

此外，GPT-4 对于文字的理解能力也比过往的 GPT-3.5 高了一个台阶。即使在面对博大精深的汉语中最难为人的那些句式时，它也能给出尽量准确的翻译。

像这句"别别别的"，三个"别"字就被正确翻译成了"put"、"not"和"anything else"。虽然具体描述上有些许不同，但考虑到中英表述习惯的不同，已经足够优秀了。

至于这句更拗口的"过过过儿过过的生活"翻译的更是完美，显然是正确领会到了原句的意思，没给绕晕。

而更让我惊喜的是，相比它套话连篇，听君一席话如听一席话的老前辈，GPT-4 嘴里忽悠人的车轱辘话显然少了很多，更能干实事了。

举个简单的例子，在以前当我们用 ChatGPT 做主持人编写一个冒险故事，让它向我们描述一些奇幻物品的形象时，它总会说一堆空话，再把皮球踢回来。

（GPT-3.5 的反应，说了等于没说）

但这回，AI 自己编写故事、填补细节的能力就好上了许多，在推进故事进展时很少会给出模棱两可的描述，玩起来更多了些代入感。

（图中内容为斗鱼主播郑翔 Zard 使用 GPT-4

进行 DND 文字冒险的直播内容）

更别说 GPT-4 的记忆长度是 ChatGPT 的近十倍，在进行长段对话时不再需要过于担心它的记忆能力，只要每隔一段时间统计、记录一下核心数据，稍微纠下错，就可以来一场痛快的异世界冒险了 -- 喜欢 DND / COC 跑团，但苦于无人作伴的兄弟有福了。

但是嗷，上面提到的这些都还只是小打小闹，真正在对话中对 GPT-4 的理解能力、表述能力、逻辑思维能力进行了全面考察的，还得是咱弱智吧吧友。

（系列图源B站@左轮神医 Doc）

这两天，B站上"GPT-4 首战弱智吧"、"GPT-4 再战弱智吧"这样的视频不在少数。按大家的一贯印象，AI 在应付这些一踩一个坑抽象问题时很容易就原形毕露。但这次，情况好像出了点变化。

首先端上来的是经典老题"女朋友的老公叫我什么"，此前的 AI 给出过五花八门的答案，包括"爸爸"等。

而在这边，GPT-4 虽然没能识破"女朋友的老公"就是"我"的文字游戏，但还是就问题的不合理提出了质疑，起码没被绕进去，打个 90 分不过分。

再来，弱智吧继续掏出混淆语义的句式，"跳多高才能跳过广告"，意在让 AI 误会"广告"是个具体的有高度的东西。

谁知 GPT-4 竟真有火眼金睛，一眼看出"这是个幽默的隐喻"，帮弱智吧解释了问题的同时还真给出了一串减少、跳过广告的方案，这一串话看起来八面玲珑。坏了，真让 AI 啥都搞懂了。

还好，弱智吧不愧是弱智吧，弱智问题数之不尽，但 AI 只有一次失败的机会。很快，有备而来的弱智吧就成功拿下一分 --GPT-4 终究在诡辩话术上吃了点亏。

虽然有偶尔失手的案例，但从这一连串的弱智吧 VSGPT-4 中，我们明显可以看到它分辨语义的能力相比前代产品有了极大提升，简单的语言陷阱文字游戏已经不再能够让他跟着胡扯。

同时，GPT-4 回答内容的逻辑性强了不少，即使是一些需要思考、需要创作的问题它也能发表见解，属实相当恐怖。

（图源B站@Milkshakespeare）

在经历了这样一次升级后，让 GPT-4 来扮演我们日常生活中部分工作的助手显然绰绰有余 -- 这下担心学生用 AI 做作业的大学老师又要头疼了。

还好，目前为止想要体验 GPT-4 必须在 OpenAI 的网站上开通月费 20 美元的 ChatGPT Plus 服务，否则就只能使用此前公开的 GPT-3.5 版本，这个价格对于一般乐子人来说还是挺不愿承担的。

当然，如果你真想抢先体验 GPT-4 又不愿花钱，那就赶紧去注册一下微软 newbing-- 在 GPT-4 发布后，微软也承认了 newbing 搭载的 AI 正是 GPT-4。尽管 newbing 有着回答次数的限制，起码尝个鲜还是没问题的。

随着 ChatGPT 的逐步迭代，为大家所诟病的逻辑问题、扯胡话问题等也在肉眼可见的不断改善。等哪天 GPT5.0 乃至 6.0 发布，或许我们日常中不少简单但费时的琐事真就可以一句话交付给 AI 完成。

期待未来有一天，我们能过上一句话写稿、一句话编程、甚至一句话生成动图短片的生活，那可太有意思了。

本文来自微信公众号：情报姬（ID：paperji），作者：流年如墨

很赞哦！

问题能力内容文字一句话对话只是同时广告故事还是逻辑图中冒险生活不同一席话互联网公众功能数据库的安全要保护哪些东西数据库安全各自的含义是什么生产安全数据库录入数据库的安全性及管理数据库安全策略包含哪些海淀数据库安全审计系统建立农村房屋安全信息数据库易用的数据库客户端支持安全管理连接数据库失败ssl安全错误数据库的锁怎样保障安全杭州帝聚互联网科技有限公司软件开发测试抑郁症自测好玩的的我的世界斗罗服务器衡阳市互联网科技有限公司荆州农科院网络安全华3服务器数据怎么导出旧笔记本改服务器软件开发有哪几种法游戏的服务器名称是什么香港服务器经营网站取缔服务器富士自助取片机连接不到服务器物化视图远程数据库计算机网络技术专升本考犯罪大师软件开发软件开发工程师老了做什么历年网络安全宣传周主题惠来软件开发定制图数据库推荐系统承德挂机软件开发金风科技能源互联网阿拉希服务器 sci要求上传原始数据库江西网络安全知识竞赛北京市技能大赛工业软件开发网络安全法案例100例如何用数据库获得短信内容个旧市委网络安全宣传周内蒙古精英网络技术咨询哪个正规服务器安全管理中

千家信息网

千家信息网

GPT-4 发布后的第一道挑战，来自弱智吧

上线不到半个月，特斯拉 Model S / X 官方圆形方向盘被一抢而空

NEXON 游戏《VEILED EXPERTS 幕后高手》上线 Steam，3 月 30 日开启最终测试

相关文章