ChatGPT 真实参数只有 200 亿,首次被微软曝光!网友:难怪 OpenAI 对开源很紧张
突然间,整个大模型圈都在谈论同一件事。微软论文里一张「乍一看不足为奇」的统计图,泄露了"天机"。引领全球风暴的 ChatGPT,背后大模型参数竟只有 200 亿???
论文一经发布,就吸引了国内外众多关注。
不少网友还不相信:确定不是拼写错了?
有网友表示:难怪 OpenAI 对开源这么紧张。又或者,这也许是为 OpenAI 开源做准备。
无独有偶,就在前几天有网友在 GitHub Copilot 的 API 中发现了疑似 GPT-4 新型号:copilot-gpt-4-2,所拥有的知识更新到了 2023 年 3 月。
这篇论文说了啥?
除了泄露机密,这篇论文本身也值得一看:业内首个用扩散模型做代码生成。
研究团队设想了这样一个场景:
如果开发人员只能修改最后一行代码,那么需要多少次从头开始编写一个函数才能完成呢?
用自然语言生成代码的自回归模型也有类似的局限性:不太容易重新考虑之前生成的 tokens。
微软研究员提出了采用编码-解码架构的 CODEFUSION,主要包括编码器、解码器、去噪器以及 Classification Head,将自然语言输入编码为连续表示,然后将其附加条件输入 Diffusion 模型中用高斯噪声进行迭代去噪。
为了生成语法正确的代码,去噪后输入解码器中获得代码 tokens,通过针对代码的连续段落去噪 (CPD) 任务预训练 CODEFUSION。
在 Python、Bash 和 Excel 条件格式化(CF)规则三个语言任务上评估了 CODEFUSION。
结果显示其 7500 万参数规模 CODEFUSION 性能,同 200 亿参数的 GPT-3.5-turbo 接近,而且还生成更加多样化的代码。
与纯文本生成的 diffusion 模型相比,CODEFUSION 生成更多语法正确的代码;与自动回归模型相比,生成更加多样化的候选代码。
与最先进的自回归系统(350M-175B 参数)相比,在前 1 名的准确率方面表现相当,而在前 3 名和前 5 名的准确率方面,由于其在多样性与质量之间取得了更好的平衡,其表现优于自回归系统。
结果这原本只是一次再正常不过的性能比较,没想到引起轩然大波。
也有人开始了阴谋论,或许这是 OpenAI 开源的"前菜",故意而为之 --
因为不少大模型已经追赶上来了,而且早在今年 5 月,路透社就曾爆料 OpenAI 准备开源新大语言模型。
One More Thing
值得一提的是,早在今年 2 月份福布斯一则新闻报道里,就曾透露过 ChatGPT 只有 200 亿参数。
当时标题是「越大越好吗?为什么 ChatGPT VS GPT-3 VS GPT-4 的 "战斗 "只是一次家庭聊天?」
只是当时没有太多人在意。
参考链接:
[1]https://twitter.com/felix_red_panda/status/1718916631512949248
[2]https://x.com/teortaxesTex/status/1718972447024623898?s=20
[3]https://www.reddit.com/r/singularity/comments/17jrepb/microsoft_paper_claims_chatgpt_35_has_20_billion/
[4]https://www.zhihu.com/question/628395521
[5]https://www.reddit.com/r/ChatGPT/comments/17ht56t/new_leaks_about_upcoming_developments_with_openai/?share_id=txV27HR0zw0TjV8dLXf4l
[6]https://www.forbes.com/sites/forbestechcouncil/2023/02/17/is-bigger-better-why-the-chatgpt-vs-gpt-3-vs-gpt-4-battle-is-just-a-family-chat/amp/
- 上一篇
11.11 巅峰秒杀 28 小时:1.1 元无门槛红包人人有份,小米 Redmi K60 16G 版手机 1879 元破冰新低
全网 11.11 开门红狂促仅限 10 月 31 日 20:00 ~11 月 1 日共 28 小时,全年好价尽在此刻,有需求的小伙伴速速下手哦。无门槛红包 即抽即用京东今日可抽三次红包:点此抽日常 /
- 下一篇
红魔氘锋 150W 全能充 GaN 开卖:1A / 2C / 1DC 接口,999 元
CTOnews.com 10 月 31 日消息,红魔氘锋 150W 全能充 GaN 今日开卖,1A / 2C / 1DC 接口设计,售价 999 元。CTOnews.com整理红魔氘锋 150W 全能
相关文章
- 25 周年纪念作,情怀拉满但诚意欠缺:《勇者斗恶龙 怪物仙境 3》
- 联想拯救者 Y700 2023 平板推送 ZUI 15.0.723 系统灰度测试:新增“USB 网络共享”,优化底部小白条
- Streacom 推出 SG10 高端被动散热机箱:可解热 600W,1300 美元
- 3D 角色扮演策略游戏《少女前线 2:追放》公测开启,安卓、iOS、PC 多端互通
- 新能源车市:价格战开局,价值战结束
- 雪天这样拍,照片更为味道
- Cybertruck:未来物种重新定义汽车
- 2022 年我国未成年网民规模突破 1.93 亿,普及率达 97.2%
- 上映 7 天,《名侦探柯南:黑铁的鱼影》内地票房破亿、豆瓣 6.6 分
- 小岛工作室推出《死亡搁浅》联名手机手柄,预计明年发售