月之暗面回应9.11和9.9比较错误_原创_科技频道首页_财经网 - CAIJING.COM.CN

首页

搜索

月之暗面回应9.11和9.9比较错误

来源：财经网　作者：易婷　　　 2024-07-17 16:52

9.11和9.9哪个更大？近日不少媒体就此问题，测试了多个大模型，但是多家大模型如字节豆包、GPT4o、月之暗面Kimi、阶跃星辰跃问、百川智能百小应等，都回答错误。

除此之外，之前有用户向大模型提问草莓（strawberry）这个单词有几个r时，多家也出现错误说是两个。

针对这些问题的出现，月之暗面回应称：其实我们人类对大模型的能力探索——无论是大模型能做到什么，还是大模型做不到什么——都还处于非常早期的阶段。

“我们非常期待用户在使用中能够发现和报告更多的边界案例（Corner Case），不管是最近的“9.9和9.11哪个大、13.8和13.11哪个大”，还是之前的’strawberry‘有几个’r‘，这些边界案例的发现，有助于我们增加对大模型能力边界的了解。但要彻底解决问题，又不能仅仅依赖于逐一修复每个案例，原因在于这些情况就像自动驾驶会遇到的场景一样是很难穷尽的，我们更加要做的是不断增强底层基础模型的智能水平，让大模型变得更加强大和全面，能够在各种复杂和极端情况下依然表现出色。”

编辑：刘昕茹

今日推荐

铁路开通WiFi“钱景”不明

热门排行
大家喜欢

1.中国电信再下调国际漫游流量资费

从今日起，中国电信将再次大幅下调国际及港澳台地区漫游流量资费，同时开通覆盖绝大部分出访量的106个国家和地区的4G漫游服务。
2.奇虎360状告搜狗不正当竞争日前已被海淀法院受理

奇虎360认为用户在搜狗搜索中输入“360省电王”时，下载链接指向搜狗手机助手。
3.高通与OPPO签订3G/4G中国专利许可协议

7月31日，Qualcomm Incorporated(NASDAQ: QCOM)与广东欧珀移动通信有限公司(OPPO)宣布达成了新的3G和4G中国专利许可协议。按照协议条款，Qualcomm授予OPPO开发、制造和销售3G(WCDMA及CDMA2000)和4G LTE(包括 “三模” GSM、TD-SCDMA和LTE-TDD)终端的付费专利许可。OPPO应支付的专利费用与Qualcomm向中华人民共和国国家发展和改革委员会所提交的整改措施条款相一致。
4.今日头条宣布战略投资图片库东方IC 或为控股级投资

今日头条今日宣布战略投资国内知名图片库东方IC，投资案完成后，东方IC仍将继续保持独立运作。今日头条方面并未对外公布具体交易细节，不过有消息称该投资为控股级投资。
5.山东42岁失独母亲再生男婴家人喜

面临不确定性，我们还可以做些什么呢？

关于财经网|关于我们|联系我们|广告合作|财经奖学金|财经招聘|环境公益中心|网站地图|About caijing.com.cn

有意与本刊合作者，有关合作事宜请与财经网联系。未经财经网书面授权，请勿转载或建立镜像，否则即为侵权。
[京ICP证150772号] 增值电信业务经营许可证[京B2-20220663] 广告经营许可证[京海工商广字第0407号] 京公网安备11010502053733 京ICP备2021039469号-2
违法和不良信息举报电话（涉网络暴力有害信息举报、未成年人举报）：010-85651074 举报邮箱：jubao@caijing.com.cn
Copyright 财经网 All Rights Reserved 版权所有复制必究