工坊日报 AI 安全 8 篇

📰 每日资讯 | 2026-03-10

本期涵盖 03-08 ~ 03-10 的资讯。 这期有几条挺值得看:一条是 OpenAI 往 AI 安全工具链继续下沉;一条是 Anthropic 把 benchmark 里那些平时没人愿意细讲的「基础设施噪声」摊开讲明白了;还有一条来自 Simon Willison,属于数据库工程师看了会立刻想动手试的那种文章。

📰 每日资讯 | 2026-03-04

今日信息量巨大:OpenAI 和 Google 同日发布新模型,Apple 全线硬件更新,Cursor 收入爆发式增长,Anthropic 与美国政府的对峙持续升级。一个词概括——「加速」。

📰 每日资讯 | 2026-03-02

本期涵盖 02-25 ~ 03-01 的资讯:OpenAI 与美国国防部签约引争议、Claude 记忆导入原来是个 prompt、Anthropic 自省研究揭示 AI 内省能力、Google Nano Banana 2 图像生成模型发布等。

📰 每日资讯 | 2026-02-28

本期涵盖 02-27 ~ 02-28 的资讯 🏛️ AI 与政府 特朗普政府禁止 Anthropic 进入政府系统,国防部将其列为供应链风险 来源:NPR 这可能是本周最重磅的 AI 新闻。特朗普总统签署行政令,禁止美国政府使用 Anthropic 的产品,五角大楼同时将 Anthropic 列为「供应链风险实体」——这一标签此前只用于美国的对手国家,从未公开用于一家美国公司。

📰 每日资讯 | 2026-02-27

Anthropic 公开对抗美国国防部拒绝移除安全护栏;Google 发布 Nano Banana 2 图像生成模型;Perplexity 推出 19 模型 AI Computer;Simon Willison 揭露 Google API Key 安全隐患

📰 每日资讯 | 2026-02-24

Anthropic 与地缘政治 Anthropic 指控三家中国 AI 公司「蒸馏」Claude Anthropic 公开指控 DeepSeek、月之暗面(Moonshot AI)和 MiniMax 通过超过 2.4 万个虚假账号,对 Claude 发起了大规模蒸馏攻击,累计产生超过 1600 万次对话。三家公司各有侧重:DeepSeek 针对基础逻辑和对齐能力(约 15 万次交互),月之暗面瞄准 Agent 推理和工具调用(340 万次),MiniMax 则聚焦 Agent 编码和编排能力(1300 万次),甚至在 Claude 新模型发布时将近一半流量用于能力抽取。

📰 每日资讯 | 2026-02-18

🔥 头条 Anthropic 发布 Claude Sonnet 4.6:性价比之王 来源:Anthropic / Hacker News(740 赞) Anthropic 发布了 Claude Sonnet 4.6,这是迄今为止最强的 Sonnet 模型。核心亮点: