今天的科技圈相当热闹——五角大楼对 Anthropic 下最后通牒、Meta 砸千亿买 AMD 芯片、开源项目因 AI 被迫「闭源测试」。一起看看。
AI 行业动态
五角大楼向 Anthropic 下最后通牒
美国国防部给 Anthropic 设了最后期限:本周五之前必须同意将 Claude 模型开放给所有「合法用途」,包括大规模国内监控和自主武器系统——而这些恰恰是 Anthropic 一直明确禁止的使用场景。如果不从,合同直接取消。国防部长 Pete Hegseth 甚至威胁要将 Anthropic 列为「供应链风险」,或动用《国防生产法》强制合作。
这事儿的本质是:政府在试探 AI 公司的底线到底在哪。Anthropic 一直以「安全优先」作为品牌核心,现在被逼到墙角了。
Anthropic 放松 AI 安全承诺
与此同时,Anthropic 正在软化其核心安全政策。此前,如果模型被评估为「危险」,Anthropic 会暂停开发工作。现在新规则是:如果竞争对手已经发布了同等或更强的模型,Anthropic 就不再暂停。
说白了就是「别人都不讲武德了,我也没法独善其身」。这个逻辑能理解,但也意味着 AI 安全的「军备竞赛底线」正在被集体拉低。值得警惕。
Meta 与 AMD 达成超 1000 亿美元 AI 芯片协议
Meta 同意从 AMD 购买 6 吉瓦的 AI 算力,交易价值超过 1000 亿美元。作为交换,AMD 授予 Meta 认股权证,可以每股 0.01 美元的价格购买最多 1.6 亿股 AMD 股票(约占 AMD 10% 的股份)。与此同时,Meta 上周还宣布将购买数百万块 Nvidia GPU。
Meta 的算力野心已经不是「大」能形容的了——本十年内部署数十吉瓦,长期目标是数百吉瓦。这笔交易也说明 AMD 在 AI 芯片市场终于拿到了一张真正的大单,不再只是 Nvidia 的陪跑。
KiloClaw 发布:60 秒部署 OpenClaw Agent
Kilo 推出 KiloClaw 托管服务,让用户在 60 秒内部署 OpenClaw agent,无需折腾基础设施。基于 Fly.io 多租户 VM 运行,内置监控和持久化能力,集成 Kilo Gateway 可访问 500+ 模型。还附带一个叫 PinchBench 的基准测试工具,帮你挑选最适合实际任务的模型。
OpenClaw 生态在加速成熟,从「极客玩具」到「一键部署」的距离越来越短了。
AI 工具与实践
Claude Code 推出 Remote Control,Cowork 支持定时任务
Anthropic 昨天连放两个功能:Claude Code 现在支持「远程控制」模式——在电脑上启动一个 session,然后通过 Web、iOS 或桌面端发送指令操控它。Simon Willison 试了一圈,评价是「有点糙但方向对」,目前还不支持 --dangerously-skip-permissions,每个操作都要手动批准。
同时 Cowork(Claude 的通用 agent 产品)也上线了定时任务功能,但有个硬伤:电脑休眠或 app 关闭时任务会被跳过。Simon 的评价很到位:「我真希望他们在做 Cowork Cloud。」
对比 OpenClaw 这种 7×24 运行的方案,Anthropic 的桌面端方案还是差了一截。但方向是对的——大厂也在往「个人 AI agent」这条路上走。
Mitchell Hashimoto 谈 AI 如何改变他的编程方式
Pragmatic Engineer 播客采访了 HashiCorp 联合创始人 Mitchell Hashimoto。几个亮点:
- 新规则:永远让一个 agent 在后台跑着。 「如果我在写代码,我希望 agent 在做规划。如果它在写代码,我就去 review。」出门前先给 agent 布置任务——调研、边界情况分析、库对比——回来就有结果了。
- Terraform 是第 7 个进入市场的,不是第 1 个。 赢靠的是社区建设和开发者体验,不是先发优势。
- 开源正在从「默认信任」转向「默认拒绝」。 AI 让创建看起来合理但实际低质量的贡献变得太容易了。
- Git 和 GitHub 可能撑不过 agent 时代。 Agent 造成的代码变动太频繁,merge queue 不堪重负。Mitchell 把这比作「版本控制的 Gmail 时刻」。
这期播客信息密度极高,强烈推荐完整收听。
用 CLI 替代 MCP,Token 消耗降低 94%
HN 热帖。作者做了个实验:把 MCP server 转成 CLI 工具,同样的功能,Token 消耗直降 94%。原因很简单——MCP 在会话开始时把所有工具的完整 JSON Schema 一股脑塞进上下文(84 个工具约 15540 tokens),而 CLI 只加载轻量的工具列表(约 300 tokens),按需发现细节。
Anthropic 自己的 Tool Search 方案能降 85%,但仍然比 CLI 贵,而且只支持 Anthropic 模型。CLI 方案模型无关,更通用。
这篇文章还引用了 OpenClaw 的 available_skills 格式作为 CLI 工具列表的参考实现。对于跑大量工具的 agent 来说,这个优化思路值得认真考虑。
来源:kanyilmaz.me
一位妈妈用 5 个 OpenClaw Agent 管理家庭、财务和代码
Lenny’s Newsletter 采访了 Jesse Genet——一位四个孩子的妈妈,用 5 个专门的 OpenClaw agent 分别负责家庭教育、财务、日程、开发和运营。每个 agent 跑在独立的 Mac Mini 上,有自己的 SOUL.md 人设文件和明确的职责边界。
几个有意思的细节:拍下整本教材的照片,让 agent 自动生成结构化教案;零终端经验的情况下,4 天内用 coding agent 做出一个自定义儿童电视 app 并部署到真实电视上;把家里所有玩具、书籍、物资拍照建库,AI 在备课时能推荐真实的实物教具。
这是目前我见过的最「接地气」的多 agent 实践案例。不是炫技,是真的在解决日常问题。
开源与开发
tldraw 因 AI 威胁将测试套件转为闭源
tldraw(协作绘图库)宣布将测试套件迁移到私有仓库。原因很直接:过去几个月的经验表明,一套完整的测试用例足以让 AI 从零构建出整个开源库的全新实现,甚至可以换一种语言。
这个决定的直接导火索是 Cloudflare 用 AI 在一周内将 Next.js 移植到 Vite 的项目。tldraw 团队还开了个玩笑 issue:「把源码翻译成繁体中文」来防止 AI 复制。
这是一个值得关注的趋势:AI 正在改变开源的博弈规则。当测试套件本身就是「完整规格说明书」时,商业开源项目的护城河在哪里?
Qwen3.5-35B-A3B 发布
通义千问发布 Qwen3.5 系列,集成多模态学习、混合架构、大规模强化学习和全球语言覆盖。原生支持最长 262144 tokens 的上下文窗口。35B 参数量但只激活 3B(MoE 架构),在效率和性能之间找到了不错的平衡点。
国产大模型的迭代速度确实不慢。
系统设计
X(Twitter)推荐算法深度解析
ByteByteGo 详细拆解了 xAI 工程团队开源的 X 推荐算法。核心架构:从「关注内容」和「非关注内容」两个来源获取候选帖子,通过基于 Grok 的 Transformer 模型进行评分、过滤和排序。几乎所有手工规则都被机器学习取代了。
非关注内容的发现依赖相似度搜索——如果你的历史行为暗示你会对某条帖子感兴趣,即使你从未关注过作者,它也会出现在你的 Feed 里。
对做推荐系统的同学来说,这是难得的一手资料。
来源:ByteByteGo
科技大事件
美国命令外交官对抗各国数据主权倡议
Reuters 报道,美国政府正式指示外交官在全球范围内反对数据主权相关立法。这意味着美国正在系统性地阻止其他国家要求数据本地化存储的努力。与此同时,已有 6 家美国公司和 1 家中国公司表示有兴趣在太空建数据中心——轨道数据中心可能将关键基础设施置于许多国家的监管之外。
数据主权这个话题会越来越热。当算力可以上天的时候,「数据存在哪」这个问题的答案可能比我们想象的更复杂。
Stripe 考虑收购 PayPal
据报道,Stripe 正在考虑收购 PayPal 的全部或部分业务。Stripe 周二估值达到 1590 亿美元,一年前还是 915 亿美元。而 PayPal 在竞争日益激烈的支付行业中增长乏力。Stripe 联合创始人 John Collison 表示公司目前不急于 IPO,因为那会分散产品和业务增长的注意力。
如果这笔交易成了,将是金融科技史上最大的并购之一。
以上就是今天的资讯。五角大楼 vs Anthropic 的对峙本周五见分晓,值得持续关注。