字节、阿里降价，百度、腾讯免费，李开复称ofo式价格战是“双输”_原创_科技频道首页_财经网

腾讯终究还是“按捺”不住了。

5月22日傍晚，腾讯云宣布主力模型之一混元-lite模型价格从0.008元/千tokens调整为全面免费，混元-standard API、混元-standard-256k的输入输出价格均有不同幅度的下降。

实际上，近期大模型的“价格战”正打得火热，腾讯是“BAT”里最晚“参战”的。5月初智谱AI调整旗下入门级大模型GLM-3-Turbo（上下文长度128k）的价格，从0.005元 / 千tokens降低到0.001元 / 千tokens。

5月15日，字节跳动宣布豆包通用模型Pro 128k版模型推理输入价格为0.005元/千Tokens，豆包通用模型Pro 32k版模型推理输入价格为0.0008元/tokens。

5月21日早上，阿里云宣布旗下9款通义商业化及开源系列模型大幅降价。其中，通义千问GPT-4级主力模型Qwen-Long，API输入价格从0.02元/千tokens降至0.0005元/千tokens，直降97%。

不到半天时间，百度紧跟宣布文心大模型的两款ENIRE Speed、ENIRE Lite免费使用，并即刻生效。5月22日早上，科大讯飞宣布，讯飞星火API能力正式免费开放。其中，讯飞星火Lite API永久免费开放，讯飞星火顶配版（Spark3.5 Max）API价格低至0.21元/万tokens。

大模型率先过“618”

所谓token，是大模型中可以理解和生成的最小意义的单位，它可以对应一个词、一个数字或一个标点符号等。

下调tokens价格的，字节虽不是第一个，但在业内字节的降价，被称为“打响大模型市场价格战第一枪”，主要原因为其是第一家打折力度最大的，将大模型价格从“以分计价”带到“以厘计价”阶段。

对此，火山引擎总裁谭待在接受财经网科技等媒体采访时表示，低价的原因主要是两点，“一是我们能做到，二是我们需要这样做。”

对于能做到，谭待阐释道，因为他们在技术上有非常多优化的手段，能把成本做低，同时把效果做好。而对于需要做，他表示今年很明显是大模型能力的提升，应用是非常重要的环节，一定要生态繁荣。

众所周知，进入2024年来，各类AI应用层出不穷，但是现象级的产品并不多。入局大模型行业的企业也只增不减，正如谭待所言，很多客户都想去做大模型尝试，但创新的事情风险很高，特别是AI风险可能是非常高的，从而要面临非常多不确定性，“我们必须把试错成本降得非常低，才能让大家（企业、个人开发者）广泛用起来。所以，当下最迫切的就是降低成本。”

降价的同时，业内的讨论离不开两点：性能和是否亏钱。性能的问题，谭待称降价的主力模型就是豆包APP背后的模型，平台月度活跃用户达到2600万，用的人越多调用量越大，模型自然会好。“没有披露测试结果，是因为大家都可以自己测就好了，网上也可以看到很多第三方报告。”

会不会亏欠，谭待直言他们是To B的业务，要看长期的，所以用亏损换收入是不可持续的，“我们从来不走这条路，降价是源于技术信心，未来我们还有很多手段持续降低成本。”

不到一周时间，5月21日的上午，阿里云宣布大模型大降价的消息，共覆盖9款商业化及开源系列模型，涵盖Qwen-Long、Qwen-Max、Qwen1.5-72B等。

其中，Qwen-Long是通义千问的长文本增强版模型，性能对标GPT-4，API输入价格从0.02元/千tokens降至0.0005元/千tokens，降幅达到97%，Qwen-Long输出价格也直降90%至0.002元/千tokens。

至于Qwen-Long的输入价格比输出降幅更大的原因，阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示，是因为用户在提问时经常结合长文本，导致模型的输入调用频率通常高于输出调用频率。

对于降价的目的，刘伟光表示：“作为中国第一大云计算公司，阿里云这次大幅降低大模型推理价格，就是希望加速AI应用的爆发。我们预计未来大模型API的调用量会有成千上万倍的增长。”

字节和阿里云大降价后，百度采取了更为激进的策略，宣布文心大模型两个主力模型（ERNIE Speed和ERNIE Lite）将全面免费。5月22日，科大讯飞也宣布讯飞星火Lite API永久免费开放，同日下午腾讯也宣布免费的免费、降价的降价。

部分创业公司暂不考虑降价

“我们也在花很大精力希望能够把它（价格）再降下来。”零一万物董事长兼CEO李开复在接受财经网科技等媒体采访时称，一定程度整个行业每年降低10倍推理成本是可以期待的，而且必然也应该发生的。

在他看来，降价对行业来说是好消息，但是ofo式的疯狂降价是“双输”打法。“我觉得大模型公司不会这么不理智，因为技术还是最重要的，如果是技术不行，就纯粹靠贴钱赔钱去做生意，我们绝对不会跟这样的一个定价来做对标。”不过，李开复也直言，“如果以后中国大模型市场就是这么卷，大家宁可赔光，通输也不让你赢，那我们就走外国市场”。

据了解，零一万物最新发布的Yi-Large模型的定价是20元100万tokens、yi-large-turbo是12元100万tokens、yi-large-rag是25元100万tokens……对于零一万物会不会降价，李开复回复到现在还没有调整价格的打算，并表示Yi-Large上线后的反馈是非常正面的。

据了解，在LMSYS盲测竞技场最新排名中，零一万物的最新千亿参数模型 Yi-Large 总榜排名世界第七，中国大模型中第一，已经超过 Llama-3-70B、Claude 3 Sonnet，中文榜更是与 GPT4o 并列第一。

5月22日，百川智能发布Baichuan 4及首款AI智能助手“百小应”。据智能涌现报道，百川智能CEO王小川也回应了当下大模型价格战，其表示百川并不会“掺和”到价格战中，原因在于，当前To B并不是百川的主要商业模式，价格战对其影响有限，百川更多的精力，还是会放在超级应用当中。

在价格战打得激烈的同时，猎豹移动CEO傅盛也在朋友圈发表了自己的看法，他认为短期来看，大模型的性能遇到了瓶颈，谁也甩不开谁，谁也拿不出杀手锏，降低推理成本，降低售价成了现在每一家的高优先级任务。

在他看来，降价的目标不是为了用户更多地直接使用，是为了吸引开发者，且认为降价对企业用户影响有限。

Lepton AI创始人、阿里巴巴原副总裁贾扬清同样在朋友圈发表了自己的看法，他表示站在整个AI业界的角度，降价是个拍脑袋就可以做的简单策略，但是真正的To B商业成功更难。

综合自大模型企业、21世纪经济报道、北京日报等