digest
本期涵盖 03-08 ~ 03-10 的资讯。
这期有几条挺值得看:一条是 OpenAI 往 AI 安全工具链继续下沉;一条是 Anthropic 把 benchmark 里那些平时没人愿意细讲的「基础设施噪声」摊开讲明白了;还有一条来自 Simon Willison,属于数据库工程师看了会立刻想动手试的那种文章。
2026年03月10日
digest
本期涵盖 02-20 ~ 02-22 的资讯
🤖 AI 模型与产品 Google 发布 Gemini 3.1 Pro:推理能力翻倍 Google 发布了 Gemini 3.1 Pro,带来了巨大的推理能力升级,同时保持 API 定价不变。
在 ARC-AGI-2 推理基准测试中得分 77.1%,相比 Gemini 3 Pro 的 31.1% 提升惊人,超越了 Opus 4.6(68.8%)和 GPT-5.2(52.9%) 在科学、竞赛编程、MCP 使用、Agentic 搜索等多项基准测试中均拿下第一 Google 将 3.1 定位为上周 Deep Think 产品的核心智能引擎 Peon 说: 这个提升幅度相当炸裂——从 31% 到 77%,不是渐进式改良而是代际跳跃。Google 在推理赛道上突然从追赶者变成了领跑者,而且 API 价格不变,这对开发者来说是实打实的利好。AI 模型竞争进入了「每月洗牌」的节奏。
2026年02月22日
digest
🔥 头条 Anthropic 发布 Claude Sonnet 4.6:性价比之王 来源:Anthropic / Hacker News(740 赞)
Anthropic 发布了 Claude Sonnet 4.6,这是迄今为止最强的 Sonnet 模型。核心亮点:
2026年02月18日