AI编程混战,谁在拼命谁在拼命赚钱
AI编程混战,谁在拼命谁在拼命赚钱

这周AI编程赛道同时发生了三件事,每件单独看都够上头条,放在一起看更有意思。
OpenAI把Codex塞进了手机,不是让你在小屏幕上写代码,是让你在地铁上远程指挥跑在Mac上干活的Codex。xAI发布了Grok Build,马斯克承认落后,但还是冲进了编程Agent赛道。Cursor年营收据传突破20亿美元,过去90天从10亿翻倍,但InfoQ一篇文章的标题写的是「Cursor正经历生死存亡」。
拼命的和拼命赚钱的,居然是同一个人。
Codex上了手机
5月15日,OpenAI把Codex集成进了ChatGPT移动端APP,iOS和Android同步上线preview版,面向所有套餐用户,包括Free和Go。
OpenAI的定位很清楚,手机不是写代码的地方,手机是「多智能体工作的移动控制台与指挥中心」。用户通过手机连接跑在云端或macOS桌面端的Codex沙箱,远程查看实时代码差异、测试截图、终端反馈,语音或文字下达迭代指令,审批高风险终端命令,甚至一键推送GitHub PR。
还适配了iOS的「实时活动」功能,锁屏状态下就能追踪后台跑码进度。
目前每周超过400万开发者使用Codex,移动端的推出让它彻底摆脱桌面限制。坦率的讲,这个设计思路很聪明,不去硬做手机上的代码编辑器,而是把手机做成Agent调度入口。开发者不需要盯着代码看,需要的是知道Agent在干什么、需不需要我点头。
Anthropic的Claude Code也有类似的Dispatch远程控制功能,但Codex移动版的优势是直接同步桌面版对话,切换更无缝。OpenAI在产品整合上的能力确实强,ChatGPT本身就是月活过亿的超级入口,Codex只是它里面的一个tab。 
Grok Build入场
5月14日,xAI发布首款AI编程智能体Grok Build,以CLI形式交付,目前仅向SuperGrok Heavy订阅用户开放,月费300美元。
功能层面,Grok Build有几个亮点。计划模式,复杂任务先出执行计划,用户审核、修改甚至重写后再执行,代码变更以diff呈现。并行子智能体机制,大规模任务拆分给多个子智能体同步执行,支持深度代码仓库集成。兼容AGENTS.md配置、插件、钩子和MCP服务器,还支持无头模式和完整的ACP协议。
但这些都是设计文档里写的。实际性能和稳定性还没经过市场验证。
马斯克承认xAI在编程Agent领域落后,Grok Build是追赶的第一步。腾讯网一篇报道的标题直接写「马斯克承认落后,xAI推出首款编程智能体,剑指行业顶流Claude Code」。
说实话我也不确定Grok Build能不能追上。但有一个值得注意的信号,它兼容AGENTS.md和MCP。也就是说xAI在生态层面选了「不造新墙」的策略,你现有的配置和工作流可以无缝迁移过来。对一个后来者来说,这是最聪明的打法。 
Cursor的20亿和生死存亡
上周Bloomberg报道,Cursor 2025年销售额突破20亿美元,未来12个月营收运行率比三个月前翻了一番。从2023年约100万美元,到2024年突破1亿美元ARR,再到2026年跨越20亿美元,成为SaaS史上增长最快的产品之一。超过500家财富500强企业纳入工程师日常工具链,企业客户贡献约60%营收。
同时还传出了500亿美元估值的新一轮融资。SpaceX宣布获得年内以600亿美元收购Cursor的选择权,即使最终不买也要支付100亿美元合作费用。
但InfoQ那篇文章说,「Cursor正经历生死存亡」。
为什么?
因为赛道变了。Codex上了手机、Grok Build入局、Claude Managed Agents公测,AI coding赛道从「工具竞争」升级为「生态战争」。Cursor的增长靠的是Agentic范式先发优势和独立开发者口碑,但当OpenAI和微软把Copilot塞进GitHub+VS Code全链路、Anthropic把Claude Code做成编程Agent标杆、xAI带着GPU集群和X平台流量冲进来,Cursor的护城河在哪里?
上周微软封杀Claude Code的内部决策已经说明了一件事,AI编程工具的竞争已经过了「谁好用谁」的阶段,进入了「谁控制工作流」的阶段。Cursor不是GitHub,不控制代码托管。Cursor不是ChatGPT,不控制用户入口。Cursor不是X平台,不控制流量分发。
20亿美元的营收很耀眼,但一个营收狂飙的公司同时面临生死存亡的风险,这听起来矛盾,其实不矛盾。在SaaS领域,增长越快的公司,对平台依赖越敏感。Notion增长飞快,但有人担心它被微软Teams挤压。Figma增长飞快,但Adobe一度想收购它消除威胁。Cursor增长飞快,但它同时被OpenAI、微软、Anthropic三面夹击。
4个MIT辍学生把Cursor从客厅做到了20亿美元,这个故事够传奇。但传奇不等于安全。 
文心5.1的6%
就在编程赛道打得不可开交的时候,大模型底层也在发生一件容易被忽略的事。
5月9日,百度发布文心大模型5.1。最炸裂的数据是,预训练成本仅为业界同规模模型的约6%。
6%,不是60%。别人烧100块钱训练出来的效果,百度用6块钱搞定了,而且成绩还更好。
背后的技术叫「多维弹性预训练」,一次训练生成多种规模模型,总参数压缩至约三分之一,激活参数压缩至约二分之一。文心5.1在LMArena搜索榜以1223分登顶国内第一、全球第四,Agent能力超越DeepSeek-V4-Pro。
推理成本更是海外模型的1/10。同样一个复杂数据分析任务,文心5.1调用成本0.012元,GPT-5.5是0.12元,差了10倍。
这个事情的意味比看起来深远。之前国产模型的成本优势主要来自人力和算力廉价,是「投入少」换来的性价比。但文心5.1的6%不是少花钱,是用更聪明的方法花更少的钱达到同等甚至更好的效果。这是技术路线层面的创新,不是成本控制层面的妥协。
对整个行业来说,这提出了一个严肃的问题,如果6%的成本就能达到同等效果,那些每年烧几十亿美元训练模型的公司,钱都花到哪里去了? 
清华DECO,手机上的大模型
另一条线更前沿,也更贴近普通人的日常。
清华大学计算机系和人工智能研究院提出DECO架构(DEnse COmparable Sparse MoE),专门为边缘设备量身设计。论文编号arXiv
.10933,2026年5月发布。核心问题是,在参数总量和训练数据量完全相同的前提下,稀疏激活的混合专家模型能不能达到传统密集模型相当的性能?此前学术界一直存疑,DECO给出的回答是,可以。
边缘设备上的大模型部署一直有个不可能三角,高性能、低计算量、小存储占用,三者很难同时实现。密集模型性能强但计算量大,大规模MoE计算量小但存储占用大,压缩后的模型存储小但性能打折。
DECO的思路是把MoE的专家粒度做细,配合路由策略优化,让稀疏激活模型在同等参数量下逼近密集模型的性能,同时保持MoE固有的计算效率优势和更小的存储需求。
坦率的讲,这项研究目前还在论文阶段,离大规模商用还有距离。但它指向的方向很明确,大模型从云端走向终端是必然趋势,而终端的核心瓶颈不是算法能力,是能不能塞进手机里跑起来。
如果把文心5.1的「6%成本」和DECO的「端侧架构」放在一起看,两条线交汇的方向就很清晰了,大模型的下一个战场不在云端比谁更大,在终端比谁更小更省。 
混战之下
回到开头。编程赛道三方混战,大模型底层两线突破,这周的AI行业信息密度高到有点喘不过气。
但梳理下来,有一条暗线贯穿始终,效率。
Codex上手机,是为了让开发者不在电脑前也能高效调度Agent。Grok Build入场,是为了用更聪明的架构弥补时间上的落后。Cursor20亿营收却喊生死存亡,是因为效率飞涨的公司在生态绑定面前也会脆弱。文心5.1的6%成本,是训练效率的数量级跃升。DECO架构,是推理效率在终端的突破。
我自己的感受是,AI行业正在经历一场从「谁能跑得最快」到「谁能用最少的资源跑得最远」的范式转换。前几年大家比的是参数量、比的是训练成本、比的是谁先做出最大最聪明的模型。现在开始比成本效率、比端侧部署、比生态整合。
这个转换对创业公司不全是坏消息。当大模型成本降到6%,当边缘设备也能跑大模型,意味着AI能力的门槛在快速下降。门槛越低,创新的机会越多。
但门槛低也意味着护城河浅。Cursor的20亿美元营收和生死存亡的焦虑,就是门槛降低最真实的写照。 
反正我觉得,接下来半年,AI编程赛道会有一次大洗牌。不是谁赢谁输的问题,是赛道本身的定义可能会变。当Agent能自主完成80%的代码工作,编程工具的价值从「帮人写代码」变成「帮人管Agent」,整个产品逻辑都得重来。
谁先想明白这件事,谁就可能在混战中活下来。