大模型“六小虎”的生存悬念_原创_科技频道首页_财经网

岁末年初，大模型“六小虎”暗自较劲起来。

最先出牌的是智谱AI和阶跃星辰，先后宣布拿到了“过冬钱”，前者完成新一轮30亿元人民币融资，后者则完成B轮数亿美元融资。紧接着百川发布增强大模型Baichuan4-Finance、Minimax的海螺AI上线主体参考新功能……

1月6日晚，一则阿里云正在洽谈零一万物预训练团队的消息，让零一万物陷入可能被收购的舆论旋涡，“逼”得创始人李开复立马发朋友圈澄清。与此同时，关于大模型“六小虎”的生存问题再度被拉出来讨论。

在“六小虎”中，智谱AI的To B定位依然明确，根据智能超参数统计，2024年智谱AI中标项目数为32个，在通用大模型厂商中排名第三，远超于其他“五虎”。但值得注意的是，智谱AI的中标项目主要集中在上半年，下半年开始数量明显减少。

阶跃星辰则一直延续低调风格，据统计过去一年发布超10个自研基座模型。此前业内有消息称两家大模型公司将会放弃预训练，阶跃星辰和智谱AI两家则明确会继续投入基座大模型研发，因此业内也流传着“南阶跃、北智谱”的说法。

联创或高管的出走则加剧了业内对创业公司的生存担忧，12月上旬百川智能联创、商业化负责人洪涛已确认离职。往前追溯，零一万物联创黄文灏和李先刚双双离职、MiniMax“星野”产品负责人张千川离职、月之暗面几位出海产品负责人也被爆离职。

C端产品相对出圈的月之暗面和MiniMax还面临着来自明星创投机构或大厂的诉讼，前者则是被循环智能时期投资人在香港提起仲裁，称已委托律师处理，后者则是被爱奇艺指控在AI模型训练及内容生成流程中涉嫌侵犯其版权。

在智源研究院行业研究组负责人倪贤豪看来，“相较于互联网时代不一样，现在的AI时代，大厂不容易倾覆，大厂会继续留下来，但创业公司在这个阶段就必须想好，我做的公司最后是怎么退出的，如果想做成巨头，一开始就做最难的。”

昂贵的投入、务实的选择

大模型预训练烧钱是公认的事实，李开复曾透露，一次预训练成本约三四百万美元，即便是成本更低的Yi-Lightning，在训练时也用了2000张GPU，耗时一个半月，花费三百多万美元。

早在2023年8月硅谷明星AI企业Character.AI，宣布放弃预训练，转向与第三方模型合作。他们在官方博客中写道：这使我们能够投入更多资源进行后训练，并为不断增长的用户群体创造新的产品体验。

再到2024年10月，据《智能涌现》报道被称为“AI六小虎”的6家中国大模型独角兽中，已经有两家逐步放弃预训练模型，缩减了预训练算法团队人数，业务重心转向AI应用。当时业内的猜测指向了零一万物和百川智能，但很快这两家公司都向媒体进行了辟谣。

直到2025年1月6日，零一万物被曝要将团队整体打包卖给阿里。尽管李开复连夜在朋友圈辟谣否认出售。但是，这家公司退出基础大模型的竞争已经成为事实。

次日，在接受媒体采访时，李开复回应了零一万物的变动：主要聚焦在预训练团队及Infra团队，其中大部分预训练算法团队加入通义团队，Infra团队加入阿里云，成为阿里员工。这之后零一万物将不再追求训练超级大模型，但会继续训练参数适中的更快、更便宜的模型，基于后者打造可以赚钱的应用。

假设Scaling Law一直有效的情况下，加拿大工程院外籍院士、智象未来创始人兼CEO梅涛对5年后大模型研发资源进行了预判：模型计算量增加10000倍、算力规模增加10000倍、预训练费用增加250倍、数据增加1000倍、能源需求增加200倍。

倪贤豪分析道创业公司如果必须做大，理论上Scaling Law效果是最好的，海外很多厂商还在10万卡集群上做预训练，但是对于创业公司来说搭建一个10万卡集群需要耗费几百亿元，几乎不可能。“谁家有10万卡集群？或许只有大厂有。”

因而将预训练团队和Infra团队“打包”给阿里，有业内人士给出了另外一个角度的评估：务实的选择。在这之后，也有消息传出月之暗面也正在寻求与阿里的合作，截至发稿月之暗面未回应此消息。

激烈的竞争、生存的悬念

行业普遍不太相信“六小虎”最后都能作为独立“大模型公司”生存下来的。“六小虎”中几位创始人也在公开场合表达过类似的观点，比如MiniMax创始人闫俊杰认为未来全球只会剩下5家大模型企业，百川智能创始人王小川则称百模大战第一梯队最后可能不超过5家，其中有3家大厂。

经过2年的探索，“六小虎”的路线已经相对明晰：百川智能转型医疗这一垂直领域；阶跃星辰的“超级模型+超级应用”战略；月之暗面和MiniMax专注To C；智谱AI和阶跃星辰相似，在B端和C端均有布局，并在去年12月通过AutoGL亮明了与终端厂商的合作定位。

在进入2025年不到一个月时间里，智谱AI、MiniMax、阶跃星辰都在接二连三地发布自家的新产品或者新功能，另外智谱AI和阶跃星辰还公布了最新一轮的融资。但有意思的是，这两家融资消息的公布都有诸多隐藏信息，比如智谱AI没有公开具体的参投方，阶跃星辰则未公开具体的融资金额和估值。

“美元基金退出后，能拿到的钱基本大家都拿了个遍，2025年能看到的融资消息会更少。这几家创业公司账上的钱应该还能撑个1-3年，但要活得更久要有持续造血的能力。”一位投了近10家AI创业公司的投资人表示。

在李开复辟谣被阿里收购的朋友圈里，其也表示2025年是中国大模型考验年，应用爆发年，商业化淘汰年。然而在这场竞争中，不只是“六小虎”的竞争，而是所有大模型公司的battle，尤其是大厂，2024年最具代表性的就是字节跳动。

昆仑万维创始人周亚辉今年11月28日在朋友圈点评道：“年初说字节23年的AI战略不及格，但这完全不影响字节24年AI战略的满分表现。”他提到两点，第一点是快速把上万人的组织黄金比例分割整合成AI大军，第二点是字节大模型API一定会猛猛干。

在人才上字节毫不掩饰的大手笔招兵买马，不少创业公司的高管和联创加入了字节。2024年8月底，据接近字节跳动的知情人士称，原零一万物联创黄文灏确已加入字节，负责技术项目管理和规划，汇报给朱文佳。另外也有消息称面壁智能核心成员秦禹嘉已加入字节大模型团队。

大模型的价格战始于2024年5月，率先开启的是幻方量化旗下的DeepSeek，其发布了DeepSeek-V2，号称能力对标GPT-4，价格却仅为GPT-4的近1%，低廉的价格让DeepSeek被誉为“大模型界拼多多”。而后智谱AI调整了其入门级大模型GLM-3 Turbo模型调用价格。

紧接着字节跟上了节奏，火山引擎总裁谭待当场宣布“大模型从此以厘计价”，阿里通义千问、百度文心一言、腾讯混元、科大讯飞星火降价的降价、免费的免费。对创业公司来说，可谓是夹击。

在C端产品上，大厂的投放也相对“激进”。前段时间，一张体现国产AI产品广告投放金额的图片在圈内广泛流传——去年Q3豆包投放2亿、夸克投放1.9亿、Kimi投放1.5亿。虽然这一数字没有得到最终证实，但是圈内普遍认为豆包、夸克的投放优势更明显，一是背靠集团有渠道优势，二是有资金优势。

在招投标市场，根据智能超参数2024年TOP 6通用大模型厂商中标排行榜显示，“六小虎”仅一家上班，即智谱AI。

朱啸虎此前在接受媒体采访时指出“六小虎”最好的结果是卖给大厂。但在并购这件事上，创业公司很难证明自己有一种能力是大厂完全不能有的，“尤其技术人才，没有人会认为自己比别人不行。”

“大厂+小虎”的合作模式下，零一万物选择了一条更小而美的道路，消息释放出来后，网络上充斥着各种“笑话”的声音，也有一些不同的声音存在，其中有一个网友：不必冷嘲热讽，能及时退出的未必是坏事。

2025年，商业化速度的加快伴随着竞争的加剧，“六小虎”的生存仍是一个悬念。

综合自大模型厂商、界面新闻、晚点LatePost等