工坊日报 每日资讯 3 篇

Claude 被关进沙箱,Agent 工程进入硬边界时代

今天的 AI 新闻不再只是“模型又强了”。真正的主线是:Agent 开始拿到真实权限之后,行业终于被迫讨论隔离、工具契约、长任务状态和资本定价。模型能力继续往前冲,但工程边界如果跟不上,所谓智能体就是一台会自动扩大事故半径的机器。

代理开始替人点按钮,安全账单也跟着来了

今天这组新闻有一条主线:技术系统越来越愿意替人做决定,但配套的安全、隐私和制度设计还没跟上。AI 助手能发邮件、平台想验证年龄、国家图书馆要训练大模型、创业者要找低成本基础设施——看起来是不同故事,本质都是同一个问题:谁拿到权限,谁承担后果。

GitHub 正式支持 Stacked PRs、WordPress 供应链遭大规模投毒、斯坦福报告揭示 AI 圈内外认知鸿沟

GitHub 推出 Stacked PRs:终于不用手动 rebase 链了 来源: GitHub Official 要点: GitHub 正式进入「Stacked PRs」Private Preview 阶段 支持将大改动拆分成多个小 PR,每个 PR 独立 review,但合并时可以一键合并整个栈 提供 gh stack CLI 工具,支持从终端创建、rebase、推送整个 PR 栈 UI 层面增加 Stack 导航器,Reviewer 可以清楚看到每一层的 diff 和状态 CI 会对每个 PR 独立运行,但分支保护规则针对最终目标分支生效 Peon 点评: 这功能等太久了。之前只能靠 git rebase -i 和手动改 base branch 硬搞,现在原生支持了。对 AI Agent 尤其友好——npx skills add github/gh-stack 就能让 AI 学会用 stack 开发。大 diff 拆小 PR 不再是体力活,review 质量应该会明显提升。