Anthropic 与地缘政治
Anthropic 指控三家中国 AI 公司「蒸馏」Claude
Anthropic 公开指控 DeepSeek、月之暗面(Moonshot AI)和 MiniMax 通过超过 2.4 万个虚假账号,对 Claude 发起了大规模蒸馏攻击,累计产生超过 1600 万次对话。三家公司各有侧重:DeepSeek 针对基础逻辑和对齐能力(约 15 万次交互),月之暗面瞄准 Agent 推理和工具调用(340 万次),MiniMax 则聚焦 Agent 编码和编排能力(1300 万次),甚至在 Claude 新模型发布时将近一半流量用于能力抽取。
- 蒸馏(distillation)本是 AI 实验室用于压缩自家模型的常见技术,但被竞争对手用来「抄作业」则是另一回事
- 此事发生在美国芯片出口管制辩论的敏感时期,Anthropic 显然在借此推动更严格的行业协调
- DeepSeek V4 据报道即将发布,编码能力可能超越 Claude 和 ChatGPT——这让蒸馏指控更具戏剧性
美国防部长召见 Anthropic CEO,就 Claude 军事用途摊牌
国防部长 Pete Hegseth 将于周二召见 Anthropic CEO Dario Amodei,就 Claude 的军事使用问题进行会谈。五角大楼威胁将 Anthropic 列为「供应链风险」——这一标签通常只用于外国对手。起因是 Anthropic 拒绝让国防部将 Claude 用于大规模监控美国公民和开发无人类参与的自主武器。
- Anthropic 去年夏天与国防部签了 2 亿美元合同,Claude 据报道曾在 1 月 3 日抓捕委内瑞拉总统马杜罗的特种行动中被使用
- Hegseth 的态度很明确:要么配合,要么出局。但替换 Anthropic 并非易事
- 这是 AI 伦理从学术讨论走向真实政治博弈的标志性事件——当你的产品足够好,拒绝的代价也足够大
AI 行业动态
AI 投资忠诚度已死:至少 12 家 OpenAI 投资方同时押注 Anthropic
Anthropic 本月完成 300 亿美元 G 轮融资(估值 3800 亿美元),至少 12 家 OpenAI 的直接投资方同时参投,包括 Founders Fund、Iconiq、Insight Partners 和 Sequoia Capital。更令人意外的是,BlackRock 旗下基金也参与了 Anthropic 的融资——而 BlackRock 高管 Adebayo Ogunlesi 同时是 OpenAI 的董事会成员。
- 风投行业一直标榜「创始人友好」和排他性忠诚,但在 AI 这个赛道上,对冲押注已成常态
- Sam Altman 2024 年曾给投资人列出竞对黑名单(包括 Anthropic),但显然没能阻止资本的逐利本能
- 这反映了一个现实:没人确定谁会赢,所以所有人都在买保险
OpenAI 联手四大咨询巨头推进企业市场
OpenAI 宣布「Frontier Alliances」计划,与 BCG、McKinsey、Accenture 和 Capgemini 建立多年合作伙伴关系,通过咨询公司推动企业客户采用其 AI 技术。OpenAI 的前沿部署工程团队将与咨询巨头合作,帮助客户将 OpenAI Frontier(2 月初发布的无代码 Agent 构建平台)集成到技术栈中。
- 企业 AI 采用率一直偏低,ROI 难以证明——找咨询公司当「推销员」是个务实的策略
- Anthropic 也在做类似的事(Deloitte、Accenture),这条赛道正在变成渠道之争
- 本质上是承认:光有好模型不够,还需要有人帮企业想清楚怎么用
Google Cloud AI 负责人谈模型能力的三个前沿
Google Cloud Vertex AI 产品副总裁 Michael Gerstenhaber(前 Anthropic 员工)提出了一个有趣的框架:AI 模型正在同时推进三个前沿——原始智能、响应速度,以及能否以足够低的成本在大规模不可预测的场景下部署。第三个维度往往被忽视,但对企业落地至关重要。
- Google 的优势在于从芯片到推理到应用的全栈垂直整合
- 「成本前沿」这个概念很有洞察力——很多模型够聪明也够快,但跑不起大规模 Agent 场景
- 从 Anthropic 跳到 Google 的人越来越多,说明 Google 在 AI 人才争夺战中并未落后
AI 技术与研究
Guide Labs 发布新型可解释 LLM「Steerling-8B」
旧金山初创公司 Guide Labs 开源了 80 亿参数的 LLM Steerling-8B,采用全新架构:在模型中插入「概念层」,将数据分类到可追溯的类别中,使每个生成的 token 都能追溯到训练数据来源。CEO Julius Adebayo 在 MIT 读博期间的研究表明,现有的模型解释方法并不可靠,因此他选择从底层重新设计架构。
- 传统可解释性研究是对已有模型做「神经科学」,Guide Labs 的方法是从头工程化,让模型天生可解释
- 这对金融(贷款审批不能考虑种族)、内容安全(精确控制输出)等受监管行业意义重大
- 模型仍然保留了涌现能力——团队追踪到模型自主「发现」了量子计算等概念
AI Agent 可能如何摧毁经济?一份来自未来的报告
分析机构 Citrini Research 发布了一篇引发热议的文章,以 2028 年回顾视角描绘了 Agent AI 导致经济崩溃的场景:AI 能力提升 → 企业裁员 → 失业者消费下降 → 利润压力推动更多 AI 投资 → 形成无自然刹车的负反馈循环。在这个场景中,失业率翻倍,股市总值缩水超过三分之一。
- 这不是 Skynet 式的末日论,而是关注经济结构本身的渐进瓦解
- 核心洞察:当外包商被更便宜的内部 AI 替代,整个 B2B 交易链条都会受冲击
- 即使是场景推演而非预测,也很难指出具体哪个环节「不会发生」
开发者与工程实践
Simon Willison 启动「Agentic Engineering Patterns」系列
Simon Willison 开始系统性地整理 Agent 工程模式——帮助专业开发者从 coding agent(如 Claude Code、Codex)中获得最佳结果的实践指南。首批发布两章:「Writing code is cheap now」探讨代码生成成本趋近于零后对工作方式的影响;「Red/green TDD」描述测试驱动开发如何与 Agent 工程完美结合。
- 这是 Simon 将 345 篇 AI 辅助编程文章的经验提炼为结构化指南的尝试
- 「Agentic Engineering」与「Vibe Coding」的区分很重要:前者是专业工程师放大专业能力,后者是不看代码的随性创作
- 对于正在摸索 AI 编程工作流的开发者来说,这可能是目前最有价值的参考资料之一
Ladybird 浏览器采用 Rust,AI 辅助完成关键移植
独立浏览器项目 Ladybird 在放弃 Swift 后转向 Rust,创始人 Andreas Kling 使用 Claude Code 和 Codex 将 JavaScript 引擎 LibJS 的词法分析器、解析器、AST 和字节码生成器移植为约 25000 行 Rust 代码。整个移植耗时约两周,手动完成预计需要数月。关键保障:要求 Rust 管线与 C++ 管线产生逐字节一致的输出,通过 test262 测试套件验证零回归。
- 这是 AI 辅助大规模代码移植的教科书级案例:有明确的正确性标准(字节一致)+ 完善的测试套件
- 「人类指导,AI 执行」的模式——数百个小 prompt,每一步都由人决定移植什么、代码应该长什么样
- 再次证明:有高质量测试套件的项目,最适合用 Agent 工程来加速
Claude C 编译器:Chris Lattner 的深度评审
Simon Willison 分享了 Chris Lattner(Swift、LLVM、Clang、Mojo 之父)对 Anthropic Nicholas Carlini 用并行 Claude 构建的 C 编译器(CCC)的评审。Lattner 认为 CCC 看起来不像实验性研究编译器,更像一个优秀本科团队在项目早期构建的教科书级实现——这本身就很了不起。但距离生产级编译器还有很长的路,一些设计选择暗示模型在「通过测试」而非「构建通用抽象」。
- AI 擅长组装已知技术并针对可衡量标准优化,但在需要开放式泛化的生产系统上仍有差距
- 一个深层问题:如果 AI 能复现公开代码中的结构和模式,学习与复制的边界在哪里?
- 这篇评审对理解 AI 编程的能力边界非常有价值
硬件与基础设施
ASML 公布 EUV 光源突破,2030 年前芯片产量有望提升 50%
ASML 在其投资者日上公布了 EUV(极紫外光刻)光源技术的重大进展,新技术有望在 2030 年前将芯片产量提升 50%。这一突破对于满足 AI 训练和推理对先进芯片的爆炸性需求至关重要。
- EUV 光刻是当前最先进芯片制造的瓶颈环节,光源功率直接决定产能
- 50% 的产量提升意味着在不建新厂的情况下大幅增加供给,对芯片短缺问题是重大利好
- ASML 在高端光刻机领域的垄断地位进一步巩固
趣闻
FreeBSD 没有我的 Wi-Fi 驱动?让 AI 写一个
一位开发者想在 2016 款 MacBook Pro 上运行 FreeBSD,但系统不支持 Broadcom BCM4350 Wi-Fi 芯片。他让 Claude Code 参考 Linux 的 brcmfmac 驱动和 FreeBSD 的 LinuxKPI 兼容层,尝试移植一个原生 FreeBSD 内核模块。这个故事在 Hacker News 上引发热议。
- 内核驱动移植是极其底层的工作,AI 能在这个层面提供有意义的帮助,说明 coding agent 的能力边界在不断扩展
- 这类「个人痒点驱动」的 AI 编程故事越来越多,正在改变开源社区的贡献模式