Home
avatar

杨晏

黄仁勋14亿次AI编程,开源模型成本降10倍,AI编程的拐点已经来了

黄仁勋14亿次AI编程,开源模型成本降10倍,AI编程的拐点已经来了

图片

黄仁勋在GTC Taipei 2026大会上抛出一组数据,让全场安静了几秒。

2023年全年,全球AI编程调用3亿次。2024年4亿次。2025年5亿次。2026年前几个月,这个数字飙升至14亿次。

不到一年,是过去三年的总和。


一、14亿次,这不是增长,是拐点

图片

从3亿到4亿到5亿,每年增长1亿次,看起来是线性增长。但2026年前几个月直接跳到14亿次,几乎翻了两倍。

黄仁勋说,全球有3000万到4000万专业软件开发者以编程为生。算下来每个开发者平均每天在调用AI编程工具。

他驳斥了「AI减少工作岗位」的说法,直言这是胡说八道。软件工程师的数量正在增加,Token已经成为利润单位,AI是GDP的生成器。

代理式AI和实用型AI时代,已经到来。

这不是预测,这是已经发生的事实。


二、开源模型,正在追平闭源王者

图片

MiniMax M3刚刚发布,SWE-Bench Pro 59.0%的准确率,超越GPT-5.5和Gemini 3.1 Pro,与Claude 3.5 Opus的差距缩小到微小范围。

更关键的是技术架构。MiniMax自研的MSA稀疏注意力机制,让处理百万级上下文时单个Token的计算量较前代降低50%。预填充阶段处理速度提升9倍以上,解码生成阶段达到15倍加速。

100万token上下文窗口,原生多模态交互能力。这是全球首个同时具备这三项特性的开源模型。

DeepSeek-R1的API价格只有0.5美元每百万token,而GPT-5 Ultra是5美元。成本差距约10倍。

Gemma 4 31B参数,手机就能跑,能力比肩GPT-5-high,完全免费可商用。

开源模型不是在追赶,是在重新定义性价比。


三、成本降10倍,意味着什么

图片

当开源模型的能力追平GPT-5级别,而成本只有1/10时,行业格局开始改变。

GPT-5 Ultra输入5美元每百万token,输出15美元。Claude 4 Opus 8美元。Gemini 3 Ultra 3美元。DeepSeek-R1 0.5美元。

同样的工作负载,用开源模型的成本只有闭源模型的5%到10%。

这不是省钱的问题,这是整个行业的定价权被重新分配。

企业可以选择自托管Llama 4免费运行,或者调用DeepSeek-R1以极低成本完成推理任务。闭源厂商的定价优势正在被迅速侵蚀。


四、AI编程从辅助工具到基础设施

图片

14亿次调用背后的意义,比数字本身更重要。

AI编程不再是「写代码时偶尔用一下」的辅助工具,它已经成为开发流程中的基础设施。每个开发者每天多次调用,跨文件编辑、自动调试、代码审查、重构建议,AI已经渗透到每一个环节。

黄仁勋说,AI在六个月前才刚刚变得高效和有用。我们才刚刚站在拐点之上。

未来几个月,这个数字还会继续飙升。


五、三个判断

图片

第一,AI编程的拐点已经确认。14亿次调用不是终点,而是起点。代理式AI时代,每个软件开发者都会成为AI协作开发者。

第二,开源模型的性价比优势将扩大。MiniMax M3、DeepSeek-R1、Gemma 4,开源阵营正在用技术和成本双重优势,重新定义AI编程的基准线。

第三,闭源厂商的护城河正在变浅。当开源模型的能力追平、成本只有1/10时,闭源厂商只能靠生态和体验维持优势。GPT-5 Ultra、Claude 4 Opus,它们的护城河正在被开源模型从底部侵蚀。

AI编程从辅助工具到生产力基础设施,这个拐点,黄仁勋用14亿次数据帮我们确认了。

AI NVIDIA 英伟达 黄仁勋