AI 大模型的语言不平等:英语最便宜,其它语言要贵得多
发表于:2024-11-23 作者:千家信息网编辑
千家信息网最后更新 2024年11月23日,CTOnews.com 7 月 31 日消息,用户所使用的语言对于大型语言模型(LLM)的费用有很大的影响,可能造成英语使用者和其它语言使用者之间的人工智能鸿沟。最近的一项研究显示,由于 OpenAI
千家信息网最后更新 2024年11月23日AI 大模型的语言不平等:英语最便宜,其它语言要贵得多
CTOnews.com 7 月 31 日消息,用户所使用的语言对于大型语言模型(LLM)的费用有很大的影响,可能造成英语使用者和其它语言使用者之间的人工智能鸿沟。最近的一项研究显示,由于 OpenAI 等服务所采用的服务器成本衡量和计费的方式,英语输入和输出的费用要比其他语言低得多,其中简体中文的费用大约是英语的两倍,西班牙语是英语的 1.5 倍,而缅甸的掸语则是英语的 15 倍。
CTOnews.com注意到,推特用户 Dylan Patel(@dlan522p)分享了一张照片,展示了牛津大学进行的一项研究,该研究发现,让一个 LLM 处理一句缅甸语句子需要 198 个词元(tokens),而同样的句子用英语写只需要 17 个词元。词元代表了通过 API(如 OpenAI 的 ChatGPT 或 Anthropic 的 Claude 2)访问 LLM 所需的计算力成本,这意味着缅甸语句子使用这种服务的成本比英语句子高出 11 倍。
词元化模型(即人工智能公司将用户输入转换为计算成本的方式)意味着,除了英语之外的其他语言使用和训练模型要贵得多。这是因为像中文这样的语言有着不同、更复杂的结构(无论是从语法还是字符数量上),导致它们需要更高的词元化率。例如,根据 OpenAI 的 GPT3 分词器 ,"你的爱意(your affection)"的词元,在英语中只需要两个词元,但在简体中文中需要八个词元。尽管简体中文文本只有 4 个字符(你的爱意),而英文有 14 个字符。
英语
语言
句子
成本
中文
模型
字符
用户
费用
缅甸
服务
研究
人工
人工智能
使用者
意味
方式
智能
爱意
元化
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
湛江 网络安全和信息化
数据库技术与应用 教案
网络技术研究所招聘
软件开发的常见问题
福建商业软件开发定制价格
企业服务器管理公司
无源光网络技术优缺点
云数据库 单机基础版
软件角度数据库系统的核心
网络安全评语大全
网络安全模式恢复系统更新
黑窗口连接数据库一行命令
xp开机后显示数据库
功能软件开发程序
索引或数据库名称
北京东微分布式服务器
php抢票软件开发原理
软件开发利润有多少
开源的游戏服务器框架
2020护苗网络安全观后感
科技互联网现状
天水煜智网络技术有限公司舆论
定制软件开发图片大全
代理服务器设置与网络管理员
数据库导出服务器有日志吗
定制软件开发平台
估算软件开发成本技术
网络安全领域问题整改方案
手机登录端游我的世界服务器
为啥暖服务器
相关文章
- 25 周年纪念作,情怀拉满但诚意欠缺:《勇者斗恶龙 怪物仙境 3》
- 联想拯救者 Y700 2023 平板推送 ZUI 15.0.723 系统灰度测试:新增“USB 网络共享”,优化底部小白条
- Streacom 推出 SG10 高端被动散热机箱:可解热 600W,1300 美元
- 3D 角色扮演策略游戏《少女前线 2:追放》公测开启,安卓、iOS、PC 多端互通
- 新能源车市:价格战开局,价值战结束
- 雪天这样拍,照片更为味道
- Cybertruck:未来物种重新定义汽车
- 2022 年我国未成年网民规模突破 1.93 亿,普及率达 97.2%
- 上映 7 天,《名侦探柯南:黑铁的鱼影》内地票房破亿、豆瓣 6.6 分
- 小岛工作室推出《死亡搁浅》联名手机手柄,预计明年发售