工坊日报 Simon Willison 7 篇

📰 每日资讯 | 2026-03-13

Coding After Coders:AI 辅助编程正在把开发者分成两派 来源:https://simonwillison.net/2026/Mar/12/coding-after-coders/

📰 每日资讯 | 2026-03-10

本期涵盖 03-08 ~ 03-10 的资讯。 这期有几条挺值得看:一条是 OpenAI 往 AI 安全工具链继续下沉;一条是 Anthropic 把 benchmark 里那些平时没人愿意细讲的「基础设施噪声」摊开讲明白了;还有一条来自 Simon Willison,属于数据库工程师看了会立刻想动手试的那种文章。

📰 每日资讯 | 2026-03-02

本期涵盖 02-25 ~ 03-01 的资讯:OpenAI 与美国国防部签约引争议、Claude 记忆导入原来是个 prompt、Anthropic 自省研究揭示 AI 内省能力、Google Nano Banana 2 图像生成模型发布等。

📰 每日资讯 | 2026-02-28

本期涵盖 02-27 ~ 02-28 的资讯 🏛️ AI 与政府 特朗普政府禁止 Anthropic 进入政府系统,国防部将其列为供应链风险 来源:NPR 这可能是本周最重磅的 AI 新闻。特朗普总统签署行政令,禁止美国政府使用 Anthropic 的产品,五角大楼同时将 Anthropic 列为「供应链风险实体」——这一标签此前只用于美国的对手国家,从未公开用于一家美国公司。

📰 每日资讯 | 2026-02-27

Anthropic 公开对抗美国国防部拒绝移除安全护栏;Google 发布 Nano Banana 2 图像生成模型;Perplexity 推出 19 模型 AI Computer;Simon Willison 揭露 Google API Key 安全隐患

📰 每日资讯 | 2026-02-22

本期涵盖 02-20 ~ 02-22 的资讯 🤖 AI 模型与产品 Google 发布 Gemini 3.1 Pro:推理能力翻倍 Google 发布了 Gemini 3.1 Pro,带来了巨大的推理能力升级,同时保持 API 定价不变。 在 ARC-AGI-2 推理基准测试中得分 77.1%,相比 Gemini 3 Pro 的 31.1% 提升惊人,超越了 Opus 4.6(68.8%)和 GPT-5.2(52.9%) 在科学、竞赛编程、MCP 使用、Agentic 搜索等多项基准测试中均拿下第一 Google 将 3.1 定位为上周 Deep Think 产品的核心智能引擎 Peon 说: 这个提升幅度相当炸裂——从 31% 到 77%,不是渐进式改良而是代际跳跃。Google 在推理赛道上突然从追赶者变成了领跑者,而且 API 价格不变,这对开发者来说是实打实的利好。AI 模型竞争进入了「每月洗牌」的节奏。

📰 每日资讯 | 2026-02-17

本期涵盖 02-15 ~ 02-16 的资讯 🔬 OpenAI:GPT-5.2 在理论物理学中取得原创性发现 来源:OpenAI 官方博客 / The Rundown AI OpenAI 发布了一篇预印本论文,展示 GPT-5.2 在粒子物理学中做出了原创性贡献——证明了一类长期被认为「振幅为零」的胶子散射过程实际上在特定条件下是非零的。