字节、阿里降价,百度、腾讯免费,李开复称ofo式价格战是“双输”

来源:财经网  作者:易婷    2024-05-24 11:14

腾讯终究还是“按捺”不住了。

5月22日傍晚,腾讯云宣布主力模型之一混元-lite模型价格从0.008元/千tokens调整为全面免费,混元-standard API、混元-standard-256k的输入输出价格均有不同幅度的下降。

实际上,近期大模型的“价格战”正打得火热,腾讯是“BAT”里最晚“参战”的。5月初智谱AI调整旗下入门级大模型GLM-3-Turbo(上下文长度128k)的价格,从0.005元 / 千tokens降低到0.001元 / 千tokens。

5月15日,字节跳动宣布豆包通用模型Pro 128k版模型推理输入价格为0.005元/千Tokens,豆包通用模型Pro 32k版模型推理输入价格为0.0008元/tokens。

5月21日早上,阿里云宣布旗下9款通义商业化及开源系列模型大幅降价。其中,通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%。

不到半天时间,百度紧跟宣布文心大模型的两款ENIRE Speed、ENIRE Lite免费使用,并即刻生效。5月22日早上,科大讯飞宣布,讯飞星火API能力正式免费开放。其中,讯飞星火Lite API永久免费开放,讯飞星火顶配版(Spark3.5 Max)API价格低至0.21元/万tokens。

大模型率先过“618”

所谓token,是大模型中可以理解和生成的最小意义的单位,它可以对应一个词、一个数字或一个标点符号等。

下调tokens价格的,字节虽不是第一个,但在业内字节的降价,被称为“打响大模型市场价格战第一枪”,主要原因为其是第一家打折力度最大的,将大模型价格从“以分计价”带到“以厘计价”阶段。

对此,火山引擎总裁谭待在接受财经网科技等媒体采访时表示,低价的原因主要是两点,“一是我们能做到,二是我们需要这样做。”

对于能做到,谭待阐释道,因为他们在技术上有非常多优化的手段,能把成本做低,同时把效果做好。而对于需要做,他表示今年很明显是大模型能力的提升,应用是非常重要的环节,一定要生态繁荣。

众所周知,进入2024年来,各类AI应用层出不穷,但是现象级的产品并不多。入局大模型行业的企业也只增不减,正如谭待所言,很多客户都想去做大模型尝试,但创新的事情风险很高,特别是AI风险可能是非常高的,从而要面临非常多不确定性,“我们必须把试错成本降得非常低,才能让大家(企业、个人开发者)广泛用起来。所以,当下最迫切的就是降低成本。”

降价的同时,业内的讨论离不开两点:性能和是否亏钱。性能的问题,谭待称降价的主力模型就是豆包APP背后的模型,平台月度活跃用户达到2600万,用的人越多调用量越大,模型自然会好。“没有披露测试结果,是因为大家都可以自己测就好了,网上也可以看到很多第三方报告。”

会不会亏欠,谭待直言他们是To B的业务,要看长期的,所以用亏损换收入是不可持续的,“我们从来不走这条路,降价是源于技术信心,未来我们还有很多手段持续降低成本。”

不到一周时间,5月21日的上午,阿里云宣布大模型大降价的消息,共覆盖9款商业化及开源系列模型,涵盖Qwen-Long、Qwen-Max、Qwen1.5-72B等。

其中,Qwen-Long是通义千问的长文本增强版模型,性能对标GPT-4,API输入价格从0.02元/千tokens降至0.0005元/千tokens,降幅达到97%,Qwen-Long输出价格也直降90%至0.002元/千tokens。

至于Qwen-Long的输入价格比输出降幅更大的原因,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示,是因为用户在提问时经常结合长文本,导致模型的输入调用频率通常高于输出调用频率。

对于降价的目的,刘伟光表示:“作为中国第一大云计算公司,阿里云这次大幅降低大模型推理价格,就是希望加速AI应用的爆发。我们预计未来大模型API的调用量会有成千上万倍的增长。”

字节和阿里云大降价后,百度采取了更为激进的策略,宣布文心大模型两个主力模型(ERNIE Speed和ERNIE Lite)将全面免费。5月22日,科大讯飞也宣布讯飞星火Lite API永久免费开放,同日下午腾讯也宣布免费的免费、降价的降价。

部分创业公司暂不考虑降价

“我们也在花很大精力希望能够把它(价格)再降下来。”零一万物董事长兼CEO李开复在接受财经网科技等媒体采访时称,一定程度整个行业每年降低10倍推理成本是可以期待的,而且必然也应该发生的。

在他看来,降价对行业来说是好消息,但是ofo式的疯狂降价是“双输”打法。“我觉得大模型公司不会这么不理智,因为技术还是最重要的,如果是技术不行,就纯粹靠贴钱赔钱去做生意,我们绝对不会跟这样的一个定价来做对标。”不过,李开复也直言,“如果以后中国大模型市场就是这么卷,大家宁可赔光,通输也不让你赢,那我们就走外国市场”。

据了解,零一万物最新发布的Yi-Large模型的定价是20元100万tokens、yi-large-turbo是12元100万tokens、yi-large-rag是25元100万tokens……对于零一万物会不会降价,李开复回复到现在还没有调整价格的打算,并表示Yi-Large上线后的反馈是非常正面的。

据了解,在LMSYS盲测竞技场最新排名中,零一万物的最新千亿参数模型 Yi-Large 总榜排名世界第七,中国大模型中第一,已经超过 Llama-3-70B、Claude 3 Sonnet,中文榜更是与 GPT4o 并列第一。

5月22日,百川智能发布Baichuan 4及首款AI智能助手“百小应”。据智能涌现报道,百川智能CEO王小川也回应了当下大模型价格战,其表示百川并不会“掺和”到价格战中,原因在于,当前To B并不是百川的主要商业模式,价格战对其影响有限,百川更多的精力,还是会放在超级应用当中。

在价格战打得激烈的同时,猎豹移动CEO傅盛也在朋友圈发表了自己的看法,他认为短期来看,大模型的性能遇到了瓶颈,谁也甩不开谁,谁也拿不出杀手锏,降低推理成本,降低售价成了现在每一家的高优先级任务。

在他看来,降价的目标不是为了用户更多地直接使用,是为了吸引开发者,且认为降价对企业用户影响有限。

Lepton AI创始人、阿里巴巴原副总裁贾扬清同样在朋友圈发表了自己的看法,他表示站在整个AI业界的角度,降价是个拍脑袋就可以做的简单策略,但是真正的To B商业成功更难。

综合自大模型企业、21世纪经济报道、北京日报等

编辑:靖程
  • 热门排行
  • 大家喜欢