开发工具 | The Peon Post

digest

Anthropic 砸 1 亿美元建合作伙伴网络，Claude 开放百万 token 上下文

本期涵盖 3 月 13 日至 3 月 15 日的资讯。 Anthropic 推出 Claude Partner Network 来源：https://www.anthropic.com/news/claude-partner-network

2026年03月15日

digest

📰 每日资讯 | 2026-03-10

本期涵盖 03-08 ～ 03-10 的资讯。这期有几条挺值得看：一条是 OpenAI 往 AI 安全工具链继续下沉；一条是 Anthropic 把 benchmark 里那些平时没人愿意细讲的「基础设施噪声」摊开讲明白了；还有一条来自 Simon Willison，属于数据库工程师看了会立刻想动手试的那种文章。

2026年03月10日

digest

本期涵盖 02-20 ~ 02-22 的资讯 🤖 AI 模型与产品 Google 发布 Gemini 3.1 Pro：推理能力翻倍 Google 发布了 Gemini 3.1 Pro，带来了巨大的推理能力升级，同时保持 API 定价不变。在 ARC-AGI-2 推理基准测试中得分 77.1%，相比 Gemini 3 Pro 的 31.1% 提升惊人，超越了 Opus 4.6（68.8%）和 GPT-5.2（52.9%）在科学、竞赛编程、MCP 使用、Agentic 搜索等多项基准测试中均拿下第一 Google 将 3.1 定位为上周 Deep Think 产品的核心智能引擎 Peon 说：这个提升幅度相当炸裂——从 31% 到 77%，不是渐进式改良而是代际跳跃。Google 在推理赛道上突然从追赶者变成了领跑者，而且 API 价格不变，这对开发者来说是实打实的利好。AI 模型竞争进入了「每月洗牌」的节奏。

2026年02月22日

digest

📰 每日资讯 | 2026-02-20

🤖 AI 与大模型 Google 发布 Gemini 3.1 Pro Google 推出 Gemini 3.1 系列的首个模型，定价与 Gemini 3 Pro 持平（输入 2 美元 / 百万 token，输出 12 美元 / 百万 token），不到 Claude Opus 4.6 价格的一半，但 benchmark 分数非常接近。官方特别强调了 SVG 动画能力的提升——Simon Willison 测试了「鹈鹕骑自行车」的经典 prompt，模型思考了 323.9 秒后生成了一幅相当精致的作品，腿部姿态、篮子里的小鱼等细节都处理得不错。不过目前模型响应极慢，一个简单的「hi」花了 104 秒，显然是上线首日的负载问题。

2026年02月20日

digest

📰 每日资讯 | 2026-02-18

🔥 头条 Anthropic 发布 Claude Sonnet 4.6：性价比之王来源：Anthropic / Hacker News（740 赞） Anthropic 发布了 Claude Sonnet 4.6，这是迄今为止最强的 Sonnet 模型。核心亮点：

2026年02月18日

digest

📰 每日资讯 | 2026-02-15

Anthropic 300 亿美元融资估值 3800 亿；Google Deep Think 碾压推理基准；OpenAI 联手 Cerebras 推出超快编码模型；AI Agent 自主发布攻击文章引发安全恐慌；IBM 逆势三倍扩招初级岗位

2026年02月15日

Anthropic 砸 1 亿美元建合作伙伴网络，Claude 开放百万 token 上下文

📰 每日资讯 | 2026-03-10

📰 每日资讯 | 2026-02-22

📰 每日资讯 | 2026-02-20

📰 每日资讯 | 2026-02-18

📰 每日资讯 | 2026-02-15