时尚

AI大模子的语言不同过错等:英语最重价,此外语言要贵良多

字号+ 作者:魔都漾漾网 来源:时尚 2024-11-01 17:34:26 我要评论(0)

原问题:AI大模子的语言不同过错等:英语最重价,此外语言要贵良多7 月 31 日新闻,用户所运用的语言对于大型语言模子LLM)的用度有很大的影响,可能组成英语运用者以及此外语言运用者之间的家养智能边界

原问题 :AI大模子的大模的语语言不同过错等:英语最重价 ,此外语言要贵良多

7 月 31 日新闻 ,言不英语言贵用户所运用的同过语言对于大型语言模子(LLM)的用度有很大的影响,可能组成英语运用者以及此外语言运用者之间的最重家养智能边界。最近的外语一项钻研展现,由于 OpenAI 等效率所接管的良多的效率器老本掂量以及计费的方式 ,英语输入以及输入的大模的语用度要比其余语言低良多  ,其中简体中文的言不英语言贵用度约莫是英语的两倍 ,西班牙语是同过英语的 1.5 倍,而缅甸的最重掸语则是英语的 15 倍。

IT之家留意到,外语推特用户 Dylan Patel(@dlan522p)分享了一张照片,良多揭示了牛津大学妨碍的大模的语一项钻研 ,该钻研发现 ,言不英语言贵让一个 LLM 处置一句缅甸语句子需要 198 个词元(tokens) ,同过而同样的句子用英语写惟独要 17 个词元 。词元代表了经由 API(如 OpenAI 的 ChatGPT 或者 Anthropic 的 Claude 2)碰头 LLM 所需的合计力老本,这象征着缅甸语句子运用这种效率的老本比英语句子逾越 11 倍。

词元化模子(即家养智能公司将用户输入转换为合计老本的方式)象征着,除了英语之外的其余语言运用以及磨炼模子要贵良多 。这是由于像中文这样的语言有着差距、更重大的妄想(不论是从语法仍是字符数目上),导致它们需要更高的词元化率。好比 ,凭证 OpenAI 的 GPT3 分词器 ,“你的爱意(your affection)”的词元,在英语中惟独要两个词元,但在简体中文中需要八个词元。尽管简体中文文本惟独 4 个字符(你的爱意) ,而英文有 14 个字符。

【源头:IT之家】返回搜狐,魔难更多

责任编纂 :

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

相关文章
  • 论哈弗猛龙的用车感受及油耗两座侵华日军跪像不翼而飞,监控拍下男人,身上细节让人背后一凉

    论哈弗猛龙的用车感受及油耗两座侵华日军跪像不翼而飞,监控拍下男人,身上细节让人背后一凉

    2024-11-01 17:04

  • 曼联侵蚀谁之过?格雷泽要挨骂滕哈格非良人 想药到病除了难

    曼联侵蚀谁之过?格雷泽要挨骂滕哈格非良人 想药到病除了难

    2024-11-01 16:25

  • 【观察】本赛季德甲各队,两极分化现象严重4900万欧先生遭曼城瓜帅无视 却成转会市场香饽饽 引3大豪门疯抢

    【观察】本赛季德甲各队,两极分化现象严重4900万欧先生遭曼城瓜帅无视 却成转会市场香饽饽 引3大豪门疯抢

    2024-11-01 15:49

  • 公牛排插她是中国体坛的大叛徒,出国比赛趁机加入外籍,如今高调回国捞金

    公牛排插她是中国体坛的大叛徒,出国比赛趁机加入外籍,如今高调回国捞金

    2024-11-01 14:55

网友点评