Home
avatar

杨晏

72小时:Claude Fable 5从"地表最强"到全球下架,谁来填这个真空?

72小时:Claude Fable 5从”地表最强”到全球下架,谁来填这个真空?

图片


6月9日到6月13日,72小时

这是AI商业史上最短命的旗舰模型。

6月9日,Anthropic 发布了 Claude Fable 5 和 Mythos 5。SWE-bench 49.2%,HumanEval 96.4%,智谱最好的编程模型 GLM-5.1 被按在地上摩擦。Anthropic 官方措辞是「Mythos-class capability」,意思是这类模型的能力已经超出了常规评测的刻度。

6月13日,美国商务部发了一封信。

信的内容大致是:Anthropic,你的 Fable 5 被找到了一个 jailbreak 方法,我们要求你立刻停止向所有非美籍用户提供访问。注意,不管这个用户在美国境内还是境外,哪怕是 Anthropic 自己的外籍员工也不行。

Anthropic 内部评估后做了一个决定:不打补丁,全面下架。 不是暂停,不是限区,是每一个用户、每一个地区,全部切断。

从发布到下架,72小时。人类商业史上第一次,一个已经部署到数亿用户手中的大模型被强制召回。 图片


那封信里到底写了什么?

Anthropic 后来在官方声明里披露了一些细节,信息量很大。

美国政府声称发现了一个绕过 Fable 5 安全护栏的方法。Anthropic 自己复现了这个演示,结论是:这个 jailbreak 本质上就是让模型读一个特定的代码库,然后找出里面的软件漏洞。

说实话?GPT-5.5 也能干这事。OpenAI 自己部署的安全研究团队每天都在用模型做同样的事。Anthropic 在声明里原话是:「这个能力水平在行业里已经被广泛使用,每天都在被防御者用来保护系统安全。」

但美国政府不管这些。国家安全这四个字,就是一张空白支票。

更微妙的是 Anthropic 的态度。他们照做了,但不同意。声明的原话是:「我们不同意发现一个狭窄的潜在 jailbreak 应该成为召回一个已部署商业模型的理由。如果这个标准被全行业应用,基本上所有前沿模型的新部署都会停下来。」

翻译一下:我们遵守法律,但你们这个头一开,以后谁都别想好好发模型了。 图片


下架之后的真空,谁来填?

有意思的事情来了。

就在美国对 Anthropic 下达出口管制的同一天,智谱发了一段话:「在一些前沿模型突然变得不可用的时刻,我们选择相信另一条路:前沿智能不应只属于少数人,也不应被少数规则随时收回。它应该开放、可用、可构建,并服务于每一位开发者。」

6月17日,GLM-5.2 上线。MIT 开源协议,免费商用,不设地域限制。

几个关键数据:

Code Arena 全球可用模型第一。 不是开源模型第一,是全球所有可用模型的第一。百万用户盲测的前端开发评估系统,GLM-5.2 干到了榜首。

FrontierSWE 仅比 Claude Opus 4.8 低1%。 注意,不是跟 Opus 4.7 比,是跟 Opus 4.8 比。而且超过 GPT-5.5 模型1%。在另一个权威基准 Terminal-Bench 上差距也只有1%-4%。

1M上下文,88万词元的长程任务。 GLM-5.2 能自主完成从开发、联调、测试到打包上线的完整链路。阿波罗11号制导计算机的Rust重写——4600行定点CPU逐比特移植,65000行飞控程序原样起飞——全程由智能体自主走完。

发布当天完成全部国产算力平台适配。 华为昇腾、摩尔线程、寒武纪、海光、壁仞,一个不落。 图片


马斯克说”2027年一季度”,智谱说”用不了那么久”

GLM-5.2 上线后的热闹程度超出了所有人的预期。

HuggingFace 做了一个前所未有的决定:自掏腰包为 GLM-5.2 提供6小时的全球免费算力支持。这是 HuggingFace 第一次真金白银为国产模型开”专属VIP通道”。

马斯克在X上回复网友时说:“中国达到Fable级别,或许2027年一季度。”

智谱创始人唐杰隔空喊话:“用不了那么久。”

a16z 联合创始人 Marc Andreessen 下场了,Perplexity CEO 也发声了。海外网友直接刷屏 #won’t take that long。

美国开源模型知名研究员 Nathan Lambert 的评论更直接:“GLM-5.2 在智能体能力上超过了谷歌 Gemini。这是一份极具分量的成就。”

这意味着谷歌、OpenAI、Anthropic “御三家”的铁三角,第一次被一家中国企业撬开了一个口子。 图片


开源 = 安全感

说到底,Fable 5 事件给整个行业敲了一个警钟。

过去几年,开发者选模型看什么?看 benchmark、看能力、看价格。但 Fable 5 告诉我们一个新的维度:你用的模型,会不会有一天突然被关掉?

这不是假设。Fable 5 已经是一个活生生的案例。数亿用户,一夜之间,不能用就是不能用了。

GLM-5.2 给出的答案是另一条路。MIT 协议开源,代码全开放,权重全公开。你可以自己部署,自己跑,自己改。没有远程 kill switch,没有谁能一封信把你的模型关掉。

这不是”退而求其次”的妥协,而是正在变成一种核心竞争力。

当闭源模型越来越像一张需要审核资格的通行证,开源模型给的是另一种承诺:你的工具不会被任何人夺走。 图片

从追赶叙事到同桌竞争,中国大模型把计价单位从”年”缩短到了”月”。而这一次,开放路线可能是比性能参数更稀缺的东西。

随笔