Kimi爆火,长文本开“卷”

来源:财经网  2024-03-28 18:50

近期,由月之暗面带来的大模型应用Kimi引发了众人的关注。Kimi产生的效应不仅在资本市场上让概念股一度大涨,也让众多厂商加入,开始一起“卷”长文本。

开始“卷”长文本

公开资料显示,人工智能初创公司月之暗面成立于2023年4月,法定代表人杨植麟毕业于清华大学交叉信息学院。截至目前,月之暗面公司已完成三笔融资,获红杉中国、真格基金等机构投资,最新一轮融资超10亿美元,投资方包括阿里、红杉中国、小红书、美团等。

2023年10月,Kimi 智能助手初次亮相,约20万汉字的无损上下文能力,解锁了新的使用场景,包括专业学术论文的翻译和理解、辅助分析法律问题、一次性整理几十张发票、快速理解API开发文档等,获得了良好的用户口碑和用户量的快速增长。

月之暗面称,自3月18日起,支持200万字上下文的 Kimi 已启动“内测”。对大模型超长无损上下文能力有需求的用户,可到 Kimi 智能助手网页版 kimi.ai 首页申请抢先体验。

一时间,Kimi吸引了大量的目光,巨大的流量甚至让Kimi服务器一度宕机。

从行业来看,Kimi这一轮的突围,其优势在于长文本读取和解析能力。值得留意的是,近期,有更多企业也开始“卷”长文本能力。3 月22 日晚间,阿里高调宣布通义千问开放1000万字长文本能力。360紧随其后,宣布360智脑正式内测500万字长文本处理功能,即将入驻360AI浏览器。

另据《科创板日报》消息,百度也将在下个月开放200万-400万的长文本能力。

为何众多企业纷纷瞄准了长文本处理这个领域?多位专家指出,长文本能力在未来有可能成为国内大模型差异化的竞争力。

中国数实融合 50 人论坛智库专家洪勇认为,长文本处理能力不仅仅局限于处理文本长度本身,而是指模型对复杂文本结构、深层次语义理解和连贯性表达的能力,这对于提高各类业务场景中的自然语言处理精度和效率至关重要。

深度科技研究院院长张孝荣认为,国内AI技术创新受限因素较多,芯片和算法底座都受到制约,但在算法优化创新方面有一定空间,Kimi等模型的爆火,使得长文本生成成为业界新关注点,有可能引发各家AI大厂的跟进。

长文本是否是一阵风?

根据“AI产品榜aicpb.com”的统计数据,2024年2月Kimi智能助手的访问量305万,在大模型创业公司的“AI ChatBots”产品中排在第一,月环比增长率107.6%。

杨植麟曾指出,通往通用人工智能(AGI)的话,无损的长上下文将会是一个很关键的基础技术。从 word2vec 到 RNN、LSTM,再到Transformer,历史上所有的模型架构演进,本质上都是在提升有效的、无损的上下文长度。“上下文长度可能存在摩尔定律,但需要同时优化长度和无损压缩水平两个指标,才是有意义的规模化。”

长文档规模是否越大越好?对此,阶跃星辰CEO、前微软全球副总裁姜大昕对媒体表示,考虑长文档规模大小的时候还需要看智能水平,后者也是一项重要挑战,目前包括GPT-4、Gemini、Claude等模型均未达到理想水平。另外,长文档规模与智能水平也需要进行工程方面的ROI考量。

长文本处理成为一种热潮,吸引了更多企业的关注,开始布局以及升级自家的大模型产品,强化长文本的处理能力。这种重新审视长文本处理在大模型领域必要性和重要性的行为,是否只是一阵风?

产业观察家洪仕斌认为,长文本处理在处理复杂、详细的信息,或者生成具有解释性和语境敏感性的文本时,具有显著的优势。这并不会只是一阵风,随着技术的进步,我们会看到更多的应用场景出现。这种能力的商业化表现在很大程度上取决于如何将其与特定的业务需求相结合。

值得留意的是,月之暗面联合创始人周昕宇透露,目前团队正在持续探索优化产品的方案,会结合长文本等能力做出更好的设计,今年公司在自研的多模态大模型上会有新动向。

商业化变现难度不低

作为一款AI产品,Kimi受到了多方关注。此前,在二级市场上,Kimi概念股多现涨停。

3月25日,A股三大指数集体低开,Kimi概念盘初大幅跳水,中广天择闪崩触及跌停,华策影视跌超10%,海天瑞声、世纪天鸿、引力传媒等多股大跌。

事实上,长文本处理还面临着一些有待解决的问题。张孝荣认为,长文本处理商业化变现难度不低,目前没有明确的应用场景。技术壁垒方面,长文本生成涉及到大量的数据、算法和模型训练,具有一定的技术门槛。但随着时间的推移,更多大模型企业有望加入这个领域,竞争更加激烈。

另外,算力挑战也是长文本需面对的首要问题。华西证券认为,国内长文本带动大厂长文本能力迅速迭代,一方面将会缩小国内外大语言模型的代差,一方面将会进一步加大对底层算力的需求,算力需求爆发引发国内异构算力的构建,会带来AI行业的又一次变革,AI模型、语料库、算力租赁、算力运维、国产算力等将会继续受益。

除了长文本处理之外,2024 年AI领域还有望在哪些领域突破?洪仕斌认为,在AI领域,今年可能会有许多重大突破获得认可。其中之一可能是多模态的AI技术。多模态AI能够同时处理来自不同感官(如视觉、听觉、嗅觉等)的数据,这可能会在许多领域(如医疗、安全、娱乐等)中产生重大影响。另一个可能的重要突破是AI伦理和透明度的问题。随着AI技术的广泛应用,如何确保AI系统的公平性、透明度和安全性,以及如何处理潜在的偏见和歧视问题,将成为重要的研究课题。此外,随着AI与现实世界的融合加深,可能会有更多的创新应用出现,如无人驾驶、智能家居等。

“至于长文本大战,我仍然认为它是一个值得关注的发展趋势。”他指出,随着技术的进步,可能会看到更多的复杂、详细的信息被自动化地处理和生成,这将为许多领域带来巨大的价值。不过,这需要与商业需求紧密结合,以确保其实际应用和商业化。

综合自第一财经等

编辑:蒋菁
  • 热门排行
  • 大家喜欢