digest
本期涵盖 3 月 17 日至 3 月 18 日的资讯。
OpenAI 发布 GPT-5.4 mini 和 nano 来源:https://openai.com/index/introducing-gpt-5-4-mini-and-nano
2026年03月19日
digest
本期涵盖 3 月 14 日至 3 月 17 日的资讯。
Nvidia 在 GTC 上发布 Vera CPU,专为 Agentic AI 打造 来源:https://nvidianews.nvidia.com/news/nvidia-launches-vera-cpu-purpose-built-for-agentic-ai
2026年03月17日
digest
🛠 AI 编程工具与实践 使用 Claude Code 的正确姿势:规划与执行分离 来源: Boris Tane | Hacker News 716 🔺
Boris Tane 分享了他使用 Claude Code 9 个月后沉淀出的工作流,核心原则只有一条:在你审核并批准书面计划之前,绝不让 AI 写代码。
2026年02月23日
digest
🤖 AI 模型与工具 Anthropic 发布 Claude Sonnet 4.6:中端模型的逆袭 来源: The Rundown AI / Simon Willison
Anthropic 发布 Claude Sonnet 4.6,在编码、金融分析、计算机操作等基准测试中逼近甚至超越旗舰 Opus 4.6,而价格仅为后者的 1/5 SWE-Bench Verified 编码基准:Sonnet 4.6 得分 79.6%,仅略低于 Opus 4.6 的 80.8% 在代理式金融分析和办公任务基准上,Sonnet 4.6 首次超越 Opus 4.6 Claude Code 早期测试者中,70% 更偏好 Sonnet 4.6 而非前代,59% 更偏好它而非 Opus 4.5 计算机操作能力持续攀升,OSWorld 得分从 2024 年底的不到 15% 跃升至 72.5% 支持 100 万 token 上下文窗口,知识截止日期为 2025 年 8 月 点评: Anthropic 的「涓滴策略」执行得又快又狠——旗舰模型升级后仅两周,就把近乎同等的能力下放到更便宜的产品线。在中国模型持续以低价搅局的背景下,Sonnet 4.6 显然是 Anthropic 争夺代理时代「走量层」的关键棋子。对开发者来说,这意味着用 1/5 的成本就能获得 95% 的顶级能力,性价比拐点已经到来。
2026年02月19日