Home
avatar

杨晏

DeepSWE 一出来,AI 编程排行榜直接翻桌了

AI热点

DeepSWE 一出来,AI 编程排行榜直接翻桌了

DeepSWE一出来,AI编程排行榜直接翻桌了今天AI圈发生了一件比「谁赢了」更值得关注的事,排行榜本身被质疑了。Datacurve发布了一个叫DeepSWE的新评测,结果GPT-5.5拿了70%通过率断层第一。但这不是重点。重点是,他们顺手抓到了ClaudeOpus4.7在SWE-benchPro

DeepSeek终于能看图了,AI编程工具也疯了

AI热点

DeepSeek终于能看图了,AI编程工具也疯了

DeepSeek终于能看图了,AI编程工具也疯了昨天,DeepSeek灰度上线了识图模式。今天,多模态技术报告正式发布。这份报告的名字很有意思,《用视觉原语思考》(ThinkingwithVisualPrimitives)。核心创新是,把点、边界框这些空间标记提升为「思维的基本单元」,让模型在推理时

Claude Code生态爆发,AI编程进入Harness时代

AI热点

Claude Code生态爆发,AI编程进入Harness时代

ClaudeCode生态爆发,AI编程进入Harness时代3月底,Anthropic的ClaudeCode因为一个意外事件被推到了聚光灯下。npm发布包中的sourcemap文件意外暴露了存储在官方R2存储桶内的未混淆源码。超过51万行TypeScript代码的工程样本,让外界第一次看清了工业级A

AI编程工具大战,今天打到了明面上

AI热点

AI编程工具大战,今天打到了明面上

AI编程工具大战,今天打到了明面上5月29日,AI行业同时发生了三件大事。凌晨,Anthropic发布ClaudeOpus4.8,同时宣布完成650亿美元H轮融资,投后估值9650亿美元,超过OpenAI,逼近万亿美元关口。上午,市场消息传出,DeepSeek首轮融资洽谈接近尾声,由国家集成电路产业

API白菜价时代,开发者红利来了

AI热点

API白菜价时代,开发者红利来了

API白菜价时代,开发者红利来了5月22日,DeepSeek宣布V4-Pro的API价格永久降到原价的四分之一。5月27日,小米跟进,MiMo-V2.5系列API永久降价,最高降幅99%。Pro版缓存命中输入降到0.025元/百万token,标准版甚至更低到0.02元。前后脚,同一个价位,甚至更低。

AI模型赛道裂开了

AI热点

AI模型赛道裂开了

AI模型赛道裂开了这一周,AI行业同时发生了两件完全相反的事。一边,OpenAI的GPT-5.6在Codex后台日志里被开发者翻了出来,代号iris-alpha,150万token上下文窗口,比GPT-5.5多了43%,6月就要正式发布。同一时间,阿里Qwen3.7-Max在CodeArena全球编

中美大模型Agent对决,5月20日这一天太巧了

AI热点

中美大模型Agent对决,5月20日这一天太巧了

中美大模型Agent对决,5月20日这一天太巧了说真的,5月20日这天挺魔幻的。凌晨GoogleI/O,皮查伊发布Gemini3.5Flash;白天阿里云峰会,Qwen3.7-Max亮相。中美两大AI巨头在同一天掏出压箱底的Agent模型,这概率跟中彩票差不多。但真正有意思的不是时间撞车,而是两条路

AI 编程工具安全与效率两难

AI热点

AI 编程工具安全与效率两难

AI编程工具安全与效率两难当ClaudeCode去年3月高调推出时,Anthropic把“安全优先”挂在嘴边。结果呢?它的网络沙箱从去年10月到今年4月,整整5个多月、130个版本,一直都能被完整绕过。独立安全研究员关傲男5月20日公布的这项研究显示,漏洞根源是SOCKS5协议里的空字节注入。我在想

国产模型把桌子掀了

AI热点

国产模型把桌子掀了

国产模型把桌子掀了5月22号晚上,两件事几乎同时发生。DeepSeek宣布V4-Pro的2.5折优惠不再限时,直接变成永久定价。Qwen3.7-Max悄悄上线,编程能力反超了ClaudeOpus4.6。一边是把价格砸到地板,一边是把能力推到天花板。国产大模型这一周,像是商量好了一起重锤出击。然后第二

1 24