AI编程混战，谁在拼命谁在拼命赚钱

这周AI编程赛道同时发生了三件事，每件单独看都够上头条，放在一起看更有意思。

OpenAI把Codex塞进了手机，不是让你在小屏幕上写代码，是让你在地铁上远程指挥跑在Mac上干活的Codex。xAI发布了Grok Build，马斯克承认落后，但还是冲进了编程Agent赛道。Cursor年营收据传突破20亿美元，过去90天从10亿翻倍，但InfoQ一篇文章的标题写的是「Cursor正经历生死存亡」。

拼命的和拼命赚钱的，居然是同一个人。

Codex上了手机

5月15日，OpenAI把Codex集成进了ChatGPT移动端APP，iOS和Android同步上线preview版，面向所有套餐用户，包括Free和Go。

OpenAI的定位很清楚，手机不是写代码的地方，手机是「多智能体工作的移动控制台与指挥中心」。用户通过手机连接跑在云端或macOS桌面端的Codex沙箱，远程查看实时代码差异、测试截图、终端反馈，语音或文字下达迭代指令，审批高风险终端命令，甚至一键推送GitHub PR。

还适配了iOS的「实时活动」功能，锁屏状态下就能追踪后台跑码进度。

目前每周超过400万开发者使用Codex，移动端的推出让它彻底摆脱桌面限制。坦率的讲，这个设计思路很聪明，不去硬做手机上的代码编辑器，而是把手机做成Agent调度入口。开发者不需要盯着代码看，需要的是知道Agent在干什么、需不需要我点头。

Anthropic的Claude Code也有类似的Dispatch远程控制功能，但Codex移动版的优势是直接同步桌面版对话，切换更无缝。OpenAI在产品整合上的能力确实强，ChatGPT本身就是月活过亿的超级入口，Codex只是它里面的一个tab。

Grok Build入场

5月14日，xAI发布首款AI编程智能体Grok Build，以CLI形式交付，目前仅向SuperGrok Heavy订阅用户开放，月费300美元。

功能层面，Grok Build有几个亮点。计划模式，复杂任务先出执行计划，用户审核、修改甚至重写后再执行，代码变更以diff呈现。并行子智能体机制，大规模任务拆分给多个子智能体同步执行，支持深度代码仓库集成。兼容AGENTS.md配置、插件、钩子和MCP服务器，还支持无头模式和完整的ACP协议。

但这些都是设计文档里写的。实际性能和稳定性还没经过市场验证。

马斯克承认xAI在编程Agent领域落后，Grok Build是追赶的第一步。腾讯网一篇报道的标题直接写「马斯克承认落后，xAI推出首款编程智能体，剑指行业顶流Claude Code」。

说实话我也不确定Grok Build能不能追上。但有一个值得注意的信号，它兼容AGENTS.md和MCP。也就是说xAI在生态层面选了「不造新墙」的策略，你现有的配置和工作流可以无缝迁移过来。对一个后来者来说，这是最聪明的打法。

Cursor的20亿和生死存亡

上周Bloomberg报道，Cursor 2025年销售额突破20亿美元，未来12个月营收运行率比三个月前翻了一番。从2023年约100万美元，到2024年突破1亿美元ARR，再到2026年跨越20亿美元，成为SaaS史上增长最快的产品之一。超过500家财富500强企业纳入工程师日常工具链，企业客户贡献约60%营收。

同时还传出了500亿美元估值的新一轮融资。SpaceX宣布获得年内以600亿美元收购Cursor的选择权，即使最终不买也要支付100亿美元合作费用。

但InfoQ那篇文章说，「Cursor正经历生死存亡」。

为什么？

因为赛道变了。Codex上了手机、Grok Build入局、Claude Managed Agents公测，AI coding赛道从「工具竞争」升级为「生态战争」。Cursor的增长靠的是Agentic范式先发优势和独立开发者口碑，但当OpenAI和微软把Copilot塞进GitHub+VS Code全链路、Anthropic把Claude Code做成编程Agent标杆、xAI带着GPU集群和X平台流量冲进来，Cursor的护城河在哪里？

上周微软封杀Claude Code的内部决策已经说明了一件事，AI编程工具的竞争已经过了「谁好用谁」的阶段，进入了「谁控制工作流」的阶段。Cursor不是GitHub，不控制代码托管。Cursor不是ChatGPT，不控制用户入口。Cursor不是X平台，不控制流量分发。

20亿美元的营收很耀眼，但一个营收狂飙的公司同时面临生死存亡的风险，这听起来矛盾，其实不矛盾。在SaaS领域，增长越快的公司，对平台依赖越敏感。Notion增长飞快，但有人担心它被微软Teams挤压。Figma增长飞快，但Adobe一度想收购它消除威胁。Cursor增长飞快，但它同时被OpenAI、微软、Anthropic三面夹击。

4个MIT辍学生把Cursor从客厅做到了20亿美元，这个故事够传奇。但传奇不等于安全。

文心5.1的6%

就在编程赛道打得不可开交的时候，大模型底层也在发生一件容易被忽略的事。

5月9日，百度发布文心大模型5.1。最炸裂的数据是，预训练成本仅为业界同规模模型的约6%。

6%，不是60%。别人烧100块钱训练出来的效果，百度用6块钱搞定了，而且成绩还更好。

背后的技术叫「多维弹性预训练」，一次训练生成多种规模模型，总参数压缩至约三分之一，激活参数压缩至约二分之一。文心5.1在LMArena搜索榜以1223分登顶国内第一、全球第四，Agent能力超越DeepSeek-V4-Pro。

推理成本更是海外模型的1/10。同样一个复杂数据分析任务，文心5.1调用成本0.012元，GPT-5.5是0.12元，差了10倍。

这个事情的意味比看起来深远。之前国产模型的成本优势主要来自人力和算力廉价，是「投入少」换来的性价比。但文心5.1的6%不是少花钱，是用更聪明的方法花更少的钱达到同等甚至更好的效果。这是技术路线层面的创新，不是成本控制层面的妥协。

对整个行业来说，这提出了一个严肃的问题，如果6%的成本就能达到同等效果，那些每年烧几十亿美元训练模型的公司，钱都花到哪里去了？

清华DECO，手机上的大模型

另一条线更前沿，也更贴近普通人的日常。

清华大学计算机系和人工智能研究院提出DECO架构（DEnse COmparable Sparse MoE），专门为边缘设备量身设计。论文编号arXiv

.10933，2026年5月发布。

核心问题是，在参数总量和训练数据量完全相同的前提下，稀疏激活的混合专家模型能不能达到传统密集模型相当的性能？此前学术界一直存疑，DECO给出的回答是，可以。

边缘设备上的大模型部署一直有个不可能三角，高性能、低计算量、小存储占用，三者很难同时实现。密集模型性能强但计算量大，大规模MoE计算量小但存储占用大，压缩后的模型存储小但性能打折。

DECO的思路是把MoE的专家粒度做细，配合路由策略优化，让稀疏激活模型在同等参数量下逼近密集模型的性能，同时保持MoE固有的计算效率优势和更小的存储需求。

坦率的讲，这项研究目前还在论文阶段，离大规模商用还有距离。但它指向的方向很明确，大模型从云端走向终端是必然趋势，而终端的核心瓶颈不是算法能力，是能不能塞进手机里跑起来。

如果把文心5.1的「6%成本」和DECO的「端侧架构」放在一起看，两条线交汇的方向就很清晰了，大模型的下一个战场不在云端比谁更大，在终端比谁更小更省。

混战之下

回到开头。编程赛道三方混战，大模型底层两线突破，这周的AI行业信息密度高到有点喘不过气。

但梳理下来，有一条暗线贯穿始终，效率。

Codex上手机，是为了让开发者不在电脑前也能高效调度Agent。Grok Build入场，是为了用更聪明的架构弥补时间上的落后。Cursor20亿营收却喊生死存亡，是因为效率飞涨的公司在生态绑定面前也会脆弱。文心5.1的6%成本，是训练效率的数量级跃升。DECO架构，是推理效率在终端的突破。

我自己的感受是，AI行业正在经历一场从「谁能跑得最快」到「谁能用最少的资源跑得最远」的范式转换。前几年大家比的是参数量、比的是训练成本、比的是谁先做出最大最聪明的模型。现在开始比成本效率、比端侧部署、比生态整合。

这个转换对创业公司不全是坏消息。当大模型成本降到6%，当边缘设备也能跑大模型，意味着AI能力的门槛在快速下降。门槛越低，创新的机会越多。

但门槛低也意味着护城河浅。Cursor的20亿美元营收和生死存亡的焦虑，就是门槛降低最真实的写照。

反正我觉得，接下来半年，AI编程赛道会有一次大洗牌。不是谁赢谁输的问题，是赛道本身的定义可能会变。当Agent能自主完成80%的代码工作，编程工具的价值从「帮人写代码」变成「帮人管Agent」，整个产品逻辑都得重来。

谁先想明白这件事，谁就可能在混战中活下来。

杨晏