Home
avatar

杨晏

Anthropic 双拳出击,微软掀桌自研,AI 编程 Agent 大战打到明面上了

Anthropic 双拳出击,微软掀桌自研,AI 编程 Agent 大战打到明面上了

图片

上周 Anthropic 发了 Opus 4.8,微软紧接着就宣布要在 Build 大会上亮出自研编程大模型。连 Trae 靠免费策略抢走 380 万月活这种事,放在一个月前都没人敢想。

AI 编程 Agent 这条赛道,6 月直接打明牌了。


一、Anthropic 的双拳

图片

Claude Code + Opus 4.8,Anthropic 打的是一套组合拳。

Opus 4.8 不是那种「跑分炸裂但没啥用」的升级。它的核心改进很务实,代码缺陷漏报率比前代降了约四倍。SWE-bench Pro 从 64.3% 涨到 **69.2%**,Dynamic Workflows 支持数百个子 Agent 并行跑任务,effort 控制让你自己选「要多认真」。

快速模式速度提升 2.5 倍,价格还降了三倍。

更关键的是 Claude Code 这张牌。市场份额增速最快 +10%,用户满意度 **84%**,Agent 能力公认最强。很多开发者的感受是「用了就回不去」。

Anthropic 在做的不是发一个模型,是建一个生态。


二、微软掀桌了

图片

纳德拉要求内部 6 月前全面停用 Claude,切到自家 Copilot。官方说法是 Claude 太贵,但结合 Build 大会的节奏看,这是在给自研编程模型铺路。

6 月 4-6 日,旧金山 Build 大会,微软要亮牌了。

核心看点是 Mustafa Suleyman 团队的自研编程大模型。这个团队过去两年没出过登顶模型,这次是首考。模型将直接用于升级 GitHub Copilot,正面迎战 Cursor 和 Claude Code。

微软的算盘很清楚。现在 Copilot 上调 Claude 和 GPT,计费溢价 3 到 5 倍,高的甚至 10 倍以上。自研模型一旦有竞争力,运营成本和用户价格都能砍下来。

除了编程模型,微软还计划同步推出覆盖转录、推理、语音、图像等多个垂直领域的自研模型。全栈 AI,一套自己的牌。

但问题也很明显,自研模型能不能打,Build 大会见分晓。


三、免费玩家 Trae 抢了 Cursor 的份额

图片 字节跳动的 Trae,380 万月活,600 万+注册用户,87% 是个人开发者。凭什么?就凭两个字,免费。

**永久免费基础版,无调用次数限制。**Pro 版 $10/月,只有 Cursor 的一半。

代码生成准确率 **98%**(CSDN 实测),基于 VS Code 架构插件无缝迁移,Q2 版本已经支持 Claude 3.5 Sonnet 和 GPT-4o 多模型切换。

Cursor 占 31% 份额仍是第一,Copilot **24%**,Claude Code 增速最快。但 Trae 的免费策略正在切走 Cursor 底部的个人开发者群体。

而今天网易报道,国产 AI 编程工具五巨头同时出牌,腾讯 CodeBuddy、字节 Trae、阿里通义灵码和 Qoder、百度 Comate,各自抢占细分市场。Qoder 直接对标 Claude Code,Comate 个人免费加 59 元月费争腰部。

AI 编程工具的中国战场,免费是入场券,不是优惠。


四、6 月的三个看点

图片 第一,微软 Build 大会。自研编程模型到底行不行,这是 Suleyman 团队的验证时刻。如果模型能力够硬,Copilot 的价格体系可能直接洗牌。

第二,Anthropic 怎么守。Claude Code 生态在加速扩张,Opus 4.8 在编程可靠性上的改进很实在。但面对微软自研+Trae 免费的双面夹击,光靠模型能力够不够?

第三,国产五巨头的格局。免费策略能走多远?字节 Trae 600 万用户之后怎么赚钱?Qoder 对标 Claude Code 的底气在哪?

AI 编程 Agent 的三国杀已经不够形容了,现在是四面楚歌八方混战。6 月,每个玩家都要亮底牌。 图片

随笔