在中国大模型竞争的“下半场”,Kimi与Minimax正试图打破由DeepSeek带来的市场认知壁垒,通过深化技术路线(Kimi的垂直Agent与Minimax的全栈推理模型)和差异化策略,争夺行业新周期中的“下一个DeepSeek”心智,这不仅是技术实力的较量,更是对市场定位和团队前瞻性的深刻考验。
中国大模型领域的格局正在经历一场深刻的重塑。曾几何时,“六小龙”的称谓描绘了创业公司在这一赛道上的群雄逐鹿。然而,随着DeepSeek的横空出世,其在技术实力和市场声量上的快速崛起,彻底颠覆了既有的力量平衡,将牌局演变为“基模五强”的新秩序。在这场剧烈洗牌之后,长期保持沉寂的Kimi和Minimax,近期不约而同地采取了战略性新动作,试图在日益激烈的AI下半场中,为自己赢得新的生存空间和市场认知1。
技术突围与产品迭代:Kimi与Minimax的新篇章
市场竞争的焦点正从单纯的用户规模和市场投放,回归到核心技术前沿和深刻认知。真格基金合伙人戴雨森指出,这对于以技术大牛为核心的创业团队而言,反而是更有利的时机,因为与大厂在投放上硬碰硬并非长久之计1。正是在这种背景下,Kimi与Minimax选择在基础技术和应用创新上,展现其深厚底蕴。
Kimi,作为月之暗面旗下的核心产品,将其重心明确聚焦于Agent(智能体)赛道,并以“深度研究”作为其主要突破口。6月20日,Kimi官方发布消息,正式开启Kimi-Researcher(深度研究)的小范围灰度测试。这款Agent模型基于_端到端自主强化学习(end-to-end agentic RL)_技术训练,旨在解决专业领域的深度研究任务。根据官方数据,Kimi-Researcher在执行每个任务时平均进行23步推理,自主梳理并解决需求;规划平均74个关键词,寻找206个网址,并能从海量信息中筛选出质量最高的前3.2%内容,剔除冗余。其产出的报告平均长度可达万字以上,并引用约26个高质量、可溯源的信源2。这无疑直指对“低幻觉”有极高要求的金融、法律、学术研究等垂直领域。小红书等社交媒体的用户反馈印证了其在论文撰写和深度探索方面的实用性。专业评测博主mactalk尤其强调了Kimi生成内容在信源和形式上的突破,尤其是“网页化”的报告呈现,这预示着一种全新的交互方式正在形成1。
与此同时,Minimax也通过其全新的推理模型Minimax-M1,展现了强大的技术肌肉。极客公园报道指出,Minimax-M1在_长上下文理解能力_上,已达到全球前二的水平,超越了包括DeepSeek-R1-0528和Qwen3-235B在内的所有开源模型,甚至小幅超越OpenAI的GPT-4o和Claude 4 Opus,仅次于行业SOTA的Gemini 2.5 Pro。更重要的是,M1在训练和推理成本上展现出极高的性价比3。M1延续了业界前沿的_混合专家模型(MoE)_架构,并在注意力机制和强化学习算法上进行了创新。其总参数达到4560亿,原生支持100万token的上下文长度输入,以及目前所有模型中最长的80ktoken输出长度1。除了基础模型的突破,Minimax在Agent和多模态领域也亮点频频,例如为“吴彦祖教你学英语”等热门应用提供技术支持,其逼真度令投资者都难以辨别真伪1。
Kimi和Minimax的这些“大招”,绝非单纯的技术指标比拼,它们传递出更深层次的战略意图:打破大众对于大模型赛道,尤其是对创业公司生存路径的固有心智。
市场心智的争夺:DeepSeek阴影下的自我救赎
DeepSeek的崛起无疑是中国AI领域的一个标志性事件。其创始人杨植麟卓越的学术背景(清华、CMU,导师为苹果AI负责人和Google AI首席科学家)与成功的企业级AI创业经验,使其在资本市场获得了高频快速的融资和估值爬升。DeepSeek以“长文本技术是中国AGI突破口”的叙事,精准捕捉了资本的期待,迅速成为前DeepSeek时代的明星1。
然而,DeepSeek的光芒也一定程度上遮蔽了Kimi和Minimax的声音。尽管Kimi在技术实力上与DeepSeek不遑多让,尤其在基础研究环节,两者曾多次出现“撞车”现象。例如,今年2月18日,DeepSeek和月之暗面几乎同时发布了挑战Transformer架构核心注意力机制的最新论文,旨在更高效地处理更长上下文,双方技术明星创始人的名字均出现在各自报告中1。最近,两者在法律、医疗等专业方向的招聘相似性,也潜移默化地让外界感到,Kimi依然是能与DeepSeek并驾齐驱的存在。
Minimax的遗憾则更为直接。早在2023年下半年,当大部分国内大模型厂商还在迭代稠密模型时,Minimax创始人兼CEO闫俊杰就已将80%以上的研发和算力资源投入到_MoE混合专家模型_这一不确定方向上。2024年1月,Minimax上线的abab6成为国内首个MoE大模型。然而,尽管Minimax率先布局,但MoE架构的真正“出圈”和被大众熟知,却是在随后爆火的DeepSeek的应用下。这种时间上的错位,导致Minimax虽有先见之明,但在市场心智上却与DeepSeek产生了肉眼可见的落差1。
客观而言,Kimi与Minimax在技术实力上或不逊于DeepSeek,但在市场影响力上却难以匹敌。这种“被DeepSeek超越”的“不甘心”,正驱动着两家公司在Agent等“下一个周期”的争夺中,渴望一场真正意义上的翻身仗。正如戴雨森所强调的:“我们不是因为大模型投资Kimi,而是投资团队。现在是技术革命的早期,他们仍然是拥有中国最优秀团队的AI创业公司之一,以及拥有最多资源的AI创业公司之一。”他坚信,如果AI是一件大事,拥有顶尖团队和充足资源的创业公司,仍能大有所为1。
AI下半场生存法则:垂直化与认知优势
进入6月,AI应用的落地速度明显加快:罗永浩数字人直播带货创下天量成交,夸克与元宝在高考志愿填报中竞争,豆包上线AI播客,美团高层尝试AI外卖咖啡。这似乎印证了红杉AI峰会所提出的观点——下一轮AI,卖的将不再是工具,而是_收益_1。
然而,关于Agent未来演变方向的辩论仍在持续。拾象CEO李广密认为,当前Agent能力的80%依赖于底层的模型引擎。例如,GPT-3.5的出现催生了Chatbot产品形态,Claude 3.5的进步也成就了Cursor的代码补全能力4。换言之,没有强大的基座模型,Agent的效能将大打折扣。而AI Research Lead钟凯祺则持不同观点,他认为通用Agent的需求(如信息检索和轻度代码编写)已基本被GPT-4o等通用大模型很好地满足。因此,通用Agent市场将是大模型公司的主战场,创业公司很难仅凭通用需求做大,而应聚焦于_垂直(Vertical)领域_4。
Kimi和Minimax的战略选择,正是在回应这场辩论,并试图在这“下半场”中找到自己的独特坐标。Kimi通过深度研究Agent叩开垂类专业场景的大门,其“模型即Agent”的理念与端到端自主强化学习技术,旨在打造“高实用性”和“靠谱”的专业产品。这正是钟凯祺所倡导的“垂直领域”策略,通过“深度研究”的专业标签切割出差异化赛道,远离以生活服务为主的大厂射程,用“低幻觉”和“高实用性”对抗大厂的流量优势1。
而Minimax则通过推理模型M1刷新开源能力边界,试图以其MoE架构、创新的注意力机制和强化学习算法,构建全场景渗透的想象空间,并辅以多模态能力。这体现了其继续发力全方向布局的野心,试图通过技术实力和极高的_性价比_来弥补其在生态系统上的潜在短板1。
这两家公司的每一步动作都在印证同一个事实:大模型竞争早已超越“参数比拼”的初级阶段,进入到“心智占领”的核心战场1。DeepSeek的崛起证明,在巨头与创业公司的博弈中,技术突破与市场定位的精准耦合,足以重塑行业认知。这正是Kimi与Minimax此刻最迫切的目标。这场争夺的关键,正如戴雨森所言——“投资团队而非模型”1。当DeepSeek用技术叙事改写资本逻辑,Kimi与Minimax的核心竞争力,仍在创始团队对技术趋势的预判能力——如杨植麟对长文本技术的坚持、闫俊杰对MoE架构的提前布局。
在巨头凭借资源优势加速内卷的当下,创业公司的破局点从来不是“硬碰硬”,而是像DeepSeek那样,在某个技术维度建立不可替代的认知优势,进而占领用户心智。如今的AI下半场,既是技术落地的“马拉松”,也是心智认知的“闪电战”。Kimi与Minimax的每一次开源、每一个Agent的迭代,都是在为“下一个DeepSeek”的叙事加码。当行业泡沫逐渐消散,真正能穿越周期的,或许正是那些既能在技术深水区扎根,又能在用户心智中刻下独特标签的团队。这场没有硝烟的战争,才刚刚开始。