大模型战争进入第二阶段:OpenAI 的焦虑,Claude 的悖论,Google 的从容

GPT-6 还没发布,市场已经先替它写好了判词。这本身就很说明问题。
如果一家公司的新品在真正问世之前,大家讨论的已经不是“它会不会带来新东西”,而是“它还能不能证明自己没有掉队”,那它其实已经输了半场。至少,在叙事上输了。
最近几个月,OpenAI 给人的感觉越来越不是一个在主动定义时代节奏的领导者,而更像一个被竞争逼着不断应招的先行者。先行者和领导者从来不是一回事。很多时候,先行者只是第一个冲进战场的人,而领导者是那个最后决定战场规则的人。
GPT-4 之后,OpenAI 最大的问题已经不只是模型能力,而是产品线开始出现一种肉眼可见的碎片化。命名混乱、节奏分裂、版本关系说不清楚、定位越来越模糊。你当然可以说这是竞争加速下的正常现象,但问题在于,用户的困惑并不会因为“这是行业常态”而减少半分。
当一个产品线开始让用户反复发问:为什么这个版本只有 chat,没有 codex?为什么那个版本又有 codex,却没有完整主产品?5.3 和 5.4 到底是什么关系?到底哪个才是真正该用的主线版本?这就说明问题已经不只是技术节奏快,而是产品叙事正在崩坏。
OpenAI 过去最强的地方,在于它总能给行业一个非常清晰的“下一步”。GPT-3 到 GPT-4 的跃迁,不只是模型升级,而是一种时代感的重估。问题在于,真正革命性的优势一旦消失,原本依赖领先叙事维持的光环就会迅速褪色。后面的每一步都不再自动被解释为“定义未来”,而更容易被看成“补齐短板”或“应对竞争”。
从这个角度看,Claude 的崛起并不只是某个模型分数更高,或者编程能力更强,而是它在一段时间里给人一种非常罕见的感觉:它的进步方向是连贯的。从 4.5 到 4.6,市场感知到的是一种“效率提升”和“能力增强”直接相连的体验,而不是支离破碎的产品拆分。
但 Anthropic 也不是没有问题。恰恰相反,它身上现在浮现出来的是另一种更高级的悖论。
它一方面不断在行业里强调一个越来越重要的事实:在新时代,真正决定智能体上限的,也许不再只是模型本身,而是 harness。也就是工具编排、上下文组织、权限控制、观测、恢复、反馈和工作流结构。这一点我其实完全同意。模型正在逐渐商品化,而 harness 会成为越来越重要的差异化来源。
但另一方面,如果 harness 比模型更重要,那么当一家公司的 harness 设计、工程结构、关键实现思路不断外泄的时候,它的优势又还剩多少?
这是 Claude 现在最大的结构性问题。它并不是模型不够强,而是它一边告诉全世界“真正的价值在 harness”,一边又在把自己最宝贵的 harness 优势暴露得越来越多。你可以说这是速度带来的代价,也可以说这是组织和边界管理的问题,但不管怎么解释,这都是一个真实的风险。
所以 Claude 很强,但 Claude 并不天然稳坐王座。
而在 OpenAI 的焦虑和 Anthropic 的锋芒之间,Google 反而显得越来越像这场战争里最危险、也最被低估的选手。
Google 的可怕,不在于它有没有制造最轰动的头条,而在于它在大多数关键战场上都没有真正掉队。长上下文、搜索整合、Notebook、视频、多模态、基础设施、开发工具、生态协同,它几乎每一个方向都在跟,而且很多时候不是高调地跟,而是 quietly compounding,悄悄积累,悄悄扩张,悄悄占位。
和 OpenAI 相比,Google 少了一种好大喜功的焦躁。和 Anthropic 相比,它也少了一种道德姿态上的表演感。它更像一个真正意义上的老牌帝国:未必最轻盈,未必最性感,未必每一步都最惊艳,但资源深、护城河宽、组织厚、节奏稳。很多新贵公司在高速增长时都会给人一种“时代的主角感”,但只有少数公司有能力把这种主角感撑过长周期。Google 恰恰有这个潜力。
如果再把视角拉远一点,真正改变战局的也不只是这三家。
Meta 在几年前通过 Llama 系列推动的开源浪潮,其实是这场战争里非常关键的一次力量释放。它未必直接赢得了王座,但它改变了整个战场的底层结构。没有这股开源浪潮,中国大模型今天也很难形成这种百花齐放、快速追赶的局面。很多时候,历史上真正重要的玩家,不一定是最后的胜者,而是那个重新定义“别人也可以上桌”的人。
所以这场 AI 大战到今天,一个越来越明显的事实是:最早领先的人未必会笑到最后,最会讲故事的人未必最能打,最锋利的模型也未必拥有最长久的优势。
OpenAI 现在的问题,是先行者的优势正在转化为先行者的包袱。Anthropic 的问题,是它看见了未来的胜负手,但未必能长期守住自己的领先结构。Google 的机会,在于它既不急着证明自己是革命者,也不拒绝在每一个关键节点有效出手。至于开源和中国模型,则像是汹涌而来的地壳运动,不一定立刻成为王者,但足以让整个旧秩序失去稳定性。
GPT-6 也许会很强,也许会带来新的多模态整合,也许会暂时重新点燃市场情绪。但从更大的格局看,单次发布已经越来越难决定战局。真正决定下一阶段胜负的,不是某一个版本号,而是:谁的产品线更清晰,谁的 harness 更稳,谁的生态更厚,谁能把模型能力转化成长期可复利的系统能力。
说到底,AI 战争已经从“谁先造出最强模型”,进入了“谁能把模型、harness、产品、生态和节奏整合成长期优势”的第二阶段。
有些角色,到了这一阶段会越来越强。也有些角色,会开始显得力不从心。


