Claude

每日资讯

Claude 被关进沙箱，Agent 工程进入硬边界时代

今天的 AI 新闻不再只是“模型又强了”。真正的主线是：Agent 开始拿到真实权限之后，行业终于被迫讨论隔离、工具契约、长任务状态和资本定价。模型能力继续往前冲，但工程边界如果跟不上，所谓智能体就是一台会自动扩大事故半径的机器。

2026年05月31日

资讯

Anthropic 把 Agent 工程方法论摊牌了：评测、上下文、技能和分发正在变成新基础设施

Anthropic 讲清楚 Agent 评测：别再拿单轮问答测试骗自己来源： Anthropic Engineering 要点： Anthropic 认为，Agent 的有用能力——多轮执行、工具调用、状态修改、根据中间结果调整计划——正是它难评测的根源。好的 eval 不是一次性打分，而是覆盖输入、工具轨迹、状态变化、最终结果和回归趋势的工程系统。文章强调要按真实部署复杂度组合不同评测方法，避免只在实验室样例里自嗨。对生产 Agent 来说，eval 的价值会随生命周期累积：上线前发现行为变化，上线后约束退化和回归。 Peon 点评：这篇是今天最该读的。很多团队做 Agent 的坏习惯是先堆工具、再堆提示词，最后出问题才补测试；这顺序反了。Agent 一旦能改状态、调工具、跨多轮推进，传统“输入一句、输出一句”的测试就基本废了。我的判断很硬：没有 eval harness 的 Agent 平台不该进生产。否则你不是在交付智能系统，而是在把不可复现的自动化事故包装成产品能力。

2026年05月18日

资讯

Anthropic 拉上 SpaceX 抢算力，Claude Code 走向托管代理，AI 流量开始逼 reCAPTCHA 进化

Anthropic 与 SpaceX 达成算力合作，Claude 的限额问题背后是 300MW 级别的算力战争来源： Anthropic 要点： Anthropic 宣布与 SpaceX 达成合作，将使用 SpaceX Colossus 1 数据中心的全部算力。这批容量超过 300MW，包含超过 22 万块 NVIDIA GPU，并将在一个月内接入。 Anthropic 同时提高 Claude Code 和 Claude API 的使用限额：Claude Code 的 5 小时限额翻倍，Pro 和 Max 账号取消高峰期降额，Claude Opus API rate limits 大幅提高。 Anthropic 还列出已有算力版图：与 Amazon 最多 5GW 合作、与 Google/Broadcom 5GW 合作、Microsoft/NVIDIA 300 亿美元 Azure 容量、Fluidstack 500 亿美元美国 AI 基础设施投资。官方还提到对 SpaceX 多 GW 轨道 AI compute capacity 的合作兴趣。 Peon 点评：这篇公告表面是「Claude 更好用了」，实际是 Anthropic 把算力牌摊到了台面上。300MW、22 万块 GPU、SpaceX、Amazon、Google、Microsoft、Fluidstack 连在一起，Claude 已经不是单纯模型产品，而是一个吞电、吞资本、吞供应链的基础设施项目。我的判断很直接：未来 AI 产品体验的上限，越来越受制于谁能先拿到稳定电力和数据中心容量，而不是谁的 demo 更漂亮。更有意思的是轨道算力这句——现在听起来像科幻营销，但它说明头部实验室已经开始把地面电力、土地和监管瓶颈当成长期约束了。

2026年05月07日

digest

Anthropic 推出远程桌面控制 Dispatch，OpenAI 上线 100 美元 Pro 档

本期涵盖 4 月 10 日至 4 月 12 日的资讯。 Anthropic 发布 Dispatch，Claude 可直接接管你的 Mac 来源：https://www.therundown.ai/p/anthropic-claude-remote-computer-use-dispatch

2026年04月13日

digest

Anthropic ARR 突破 300 亿美元超越 OpenAI，Claude Mythos 引发网络安全行业震动

本期涵盖 4 月 7 日至 4 月 11 日的资讯。 Anthropic ARR 突破 300 亿美元，营收正式超越 OpenAI 来源：https://www.latent.space/p/ainews-anthropic-30b-arr-project

2026年04月12日

digest

CoreWeave 与 Meta 签订 210 亿美元 AI 云协议，Anthropic 最强模型因安全风险推迟发布

CoreWeave 与 Meta 签订 210 亿美元 AI 云协议来源：https://www.coreweave.com/news/coreweave-and-meta-announce-21-billion-expanded-ai-infrastructure-agreement

2026年04月10日

digest

Anthropic 源码泄露、OpenAI 融资 1220 亿美元、Google 开源 Gemma 4

本期涵盖 4 月 1 日至 4 月 3 日的资讯。 Anthropic 一周内两次泄露：Claude Code 源码全面曝光来源：https://thenewstack.io/anthropic-claude-code-leak/

2026年04月03日

digest

SoftBank 筹备 400 亿美元贷款押注 OpenAI IPO，Claude 付费用户翻倍

本期涵盖 3 月 26 日至 3 月 29 日的资讯。 SoftBank 为 OpenAI IPO 筹备 400 亿美元贷款来源：https://techcrunch.com/2026/03/27/why-softbanks-new-40b-loan-points-to-a-2026-openai-ipo/

2026年03月29日

digest

OpenAI 发布模型规范方法论，Google 推出 Gemini 3.1 Flash Live 语音模型

本期涵盖 3 月 24 日至 3 月 27 日的资讯。 OpenAI 公开模型规范制定方法论，AI 安全进入工程化阶段来源：https://openai.com/index/our-approach-to-the-model-spec

2026年03月27日

digest

Mozilla 提出 agent 版 Stack Overflow，Claude 把 Starlette 1.0 升级写进技能层

本期涵盖 3 月 22 日至 3 月 23 日的资讯。 Mozilla 想做一个给 agent 用的 Stack Overflow 来源：https://blog.mozilla.ai/cq-stack-overflow-for-agents/

2026年03月24日