大模型“六小虎”的生存悬念

来源:财经网  作者:易婷    2025-01-20 22:13

岁末年初,大模型“六小虎”暗自较劲起来。

最先出牌的是智谱AI和阶跃星辰,先后宣布拿到了“过冬钱”,前者完成新一轮30亿元人民币融资,后者则完成B轮数亿美元融资。紧接着百川发布增强大模型Baichuan4-Finance、Minimax的海螺AI上线主体参考新功能……

1月6日晚,一则阿里云正在洽谈零一万物预训练团队的消息,让零一万物陷入可能被收购的舆论旋涡,“逼”得创始人李开复立马发朋友圈澄清。与此同时,关于大模型“六小虎”的生存问题再度被拉出来讨论。

在“六小虎”中,智谱AI的To B定位依然明确,根据智能超参数统计,2024年智谱AI中标项目数为32个,在通用大模型厂商中排名第三,远超于其他“五虎”。但值得注意的是,智谱AI的中标项目主要集中在上半年,下半年开始数量明显减少。

阶跃星辰则一直延续低调风格,据统计过去一年发布超10个自研基座模型。此前业内有消息称两家大模型公司将会放弃预训练,阶跃星辰和智谱AI两家则明确会继续投入基座大模型研发,因此业内也流传着“南阶跃、北智谱”的说法。

联创或高管的出走则加剧了业内对创业公司的生存担忧,12月上旬百川智能联创、商业化负责人洪涛已确认离职。往前追溯,零一万物联创黄文灏和李先刚双双离职、MiniMax“星野”产品负责人张千川离职、月之暗面几位出海产品负责人也被爆离职。

C端产品相对出圈的月之暗面和MiniMax还面临着来自明星创投机构或大厂的诉讼,前者则是被循环智能时期投资人在香港提起仲裁,称已委托律师处理,后者则是被爱奇艺指控在AI模型训练及内容生成流程中涉嫌侵犯其版权。

在智源研究院行业研究组负责人倪贤豪看来,“相较于互联网时代不一样,现在的AI时代,大厂不容易倾覆,大厂会继续留下来,但创业公司在这个阶段就必须想好,我做的公司最后是怎么退出的,如果想做成巨头,一开始就做最难的。”

昂贵的投入、务实的选择

大模型预训练烧钱是公认的事实,李开复曾透露,一次预训练成本约三四百万美元,即便是成本更低的Yi-Lightning,在训练时也用了2000张GPU,耗时一个半月,花费三百多万美元。

早在2023年8月硅谷明星AI企业Character.AI,宣布放弃预训练,转向与第三方模型合作。他们在官方博客中写道:这使我们能够投入更多资源进行后训练,并为不断增长的用户群体创造新的产品体验。

再到2024年10月,据《智能涌现》报道被称为“AI六小虎”的6家中国大模型独角兽中,已经有两家逐步放弃预训练模型,缩减了预训练算法团队人数,业务重心转向AI应用。当时业内的猜测指向了零一万物和百川智能,但很快这两家公司都向媒体进行了辟谣。

直到2025年1月6日,零一万物被曝要将团队整体打包卖给阿里。尽管李开复连夜在朋友圈辟谣否认出售。但是,这家公司退出基础大模型的竞争已经成为事实。

次日,在接受媒体采访时,李开复回应了零一万物的变动:主要聚焦在预训练团队及Infra团队,其中大部分预训练算法团队加入通义团队,Infra团队加入阿里云,成为阿里员工。这之后零一万物将不再追求训练超级大模型,但会继续训练参数适中的更快、更便宜的模型,基于后者打造可以赚钱的应用。

假设Scaling Law一直有效的情况下,加拿大工程院外籍院士、智象未来创始人兼CEO梅涛对5年后大模型研发资源进行了预判:模型计算量增加10000倍、算力规模增加10000倍、预训练费用增加250倍、数据增加1000倍、能源需求增加200倍。

倪贤豪分析道创业公司如果必须做大,理论上Scaling Law效果是最好的,海外很多厂商还在10万卡集群上做预训练,但是对于创业公司来说搭建一个10万卡集群需要耗费几百亿元,几乎不可能。“谁家有10万卡集群?或许只有大厂有。”

因而将预训练团队和Infra团队“打包”给阿里,有业内人士给出了另外一个角度的评估:务实的选择。在这之后,也有消息传出月之暗面也正在寻求与阿里的合作,截至发稿月之暗面未回应此消息。

激烈的竞争、生存的悬念

行业普遍不太相信“六小虎”最后都能作为独立“大模型公司”生存下来的。“六小虎”中几位创始人也在公开场合表达过类似的观点,比如MiniMax创始人闫俊杰认为未来全球只会剩下5家大模型企业,百川智能创始人王小川则称百模大战第一梯队最后可能不超过5家,其中有3家大厂。

经过2年的探索,“六小虎”的路线已经相对明晰:百川智能转型医疗这一垂直领域;阶跃星辰的“超级模型+超级应用”战略;月之暗面和MiniMax专注To C;智谱AI和阶跃星辰相似,在B端和C端均有布局,并在去年12月通过AutoGL亮明了与终端厂商的合作定位。

在进入2025年不到一个月时间里,智谱AI、MiniMax、阶跃星辰都在接二连三地发布自家的新产品或者新功能,另外智谱AI和阶跃星辰还公布了最新一轮的融资。但有意思的是,这两家融资消息的公布都有诸多隐藏信息,比如智谱AI没有公开具体的参投方,阶跃星辰则未公开具体的融资金额和估值。

“美元基金退出后,能拿到的钱基本大家都拿了个遍,2025年能看到的融资消息会更少。这几家创业公司账上的钱应该还能撑个1-3年,但要活得更久要有持续造血的能力。”一位投了近10家AI创业公司的投资人表示。

在李开复辟谣被阿里收购的朋友圈里,其也表示2025年是中国大模型考验年,应用爆发年,商业化淘汰年。然而在这场竞争中,不只是“六小虎”的竞争,而是所有大模型公司的battle,尤其是大厂,2024年最具代表性的就是字节跳动。

昆仑万维创始人周亚辉今年11月28日在朋友圈点评道:“年初说字节23年的AI战略不及格,但这完全不影响字节24年AI战略的满分表现。”他提到两点,第一点是快速把上万人的组织黄金比例分割整合成AI大军,第二点是字节大模型API一定会猛猛干。

在人才上字节毫不掩饰的大手笔招兵买马,不少创业公司的高管和联创加入了字节。2024年8月底,据接近字节跳动的知情人士称,原零一万物联创黄文灏确已加入字节,负责技术项目管理和规划,汇报给朱文佳。另外也有消息称面壁智能核心成员秦禹嘉已加入字节大模型团队。

大模型的价格战始于2024年5月,率先开启的是幻方量化旗下的DeepSeek,其发布了DeepSeek-V2,号称能力对标GPT-4,价格却仅为GPT-4的近1%,低廉的价格让DeepSeek被誉为“大模型界拼多多”。而后智谱AI调整了其入门级大模型GLM-3 Turbo模型调用价格。

紧接着字节跟上了节奏,火山引擎总裁谭待当场宣布“大模型从此以厘计价”,阿里通义千问、百度文心一言、腾讯混元、科大讯飞星火降价的降价、免费的免费。对创业公司来说,可谓是夹击。

在C端产品上,大厂的投放也相对“激进”。前段时间,一张体现国产AI产品广告投放金额的图片在圈内广泛流传——去年Q3豆包投放2亿、夸克投放1.9亿、Kimi投放1.5亿。虽然这一数字没有得到最终证实,但是圈内普遍认为豆包、夸克的投放优势更明显,一是背靠集团有渠道优势,二是有资金优势。

在招投标市场,根据智能超参数2024年TOP 6通用大模型厂商中标排行榜显示,“六小虎”仅一家上班,即智谱AI。

朱啸虎此前在接受媒体采访时指出“六小虎”最好的结果是卖给大厂。但在并购这件事上,创业公司很难证明自己有一种能力是大厂完全不能有的,“尤其技术人才,没有人会认为自己比别人不行。”

“大厂+小虎”的合作模式下,零一万物选择了一条更小而美的道路,消息释放出来后,网络上充斥着各种“笑话”的声音,也有一些不同的声音存在,其中有一个网友:不必冷嘲热讽,能及时退出的未必是坏事。

2025年,商业化速度的加快伴随着竞争的加剧,“六小虎”的生存仍是一个悬念。

综合自大模型厂商、界面新闻、晚点LatePost等

编辑:靖程
  • 热门排行
  • 大家喜欢