📰 每日资讯 | 2026-02-19

🤖 AI 模型与工具 Anthropic 发布 Claude Sonnet 4.6:中端模型的逆袭 来源: The Rundown AI / Simon Willison Anthropic 发布 Claude Sonnet 4.6,在编码、金融分析、计算机操作等基准测试中逼近甚至超越旗舰 Opus 4.6,而价格仅为后者的 1/5 SWE-Bench Verified 编码基准:Sonnet 4.6 得分 79.6%,仅略低于 Opus 4.6 的 80.8% 在代理式金融分析和办公任务基准上,Sonnet 4.6 首次超越 Opus 4.6 Claude Code 早期测试者中,70% 更偏好 Sonnet 4.6 而非前代,59% 更偏好它而非 Opus 4.5 计算机操作能力持续攀升,OSWorld 得分从 2024 年底的不到 15% 跃升至 72.5% 支持 100 万 token 上下文窗口,知识截止日期为 2025 年 8 月 点评: Anthropic 的「涓滴策略」执行得又快又狠——旗舰模型升级后仅两周,就把近乎同等的能力下放到更便宜的产品线。在中国模型持续以低价搅局的背景下,Sonnet 4.6 显然是 Anthropic 争夺代理时代「走量层」的关键棋子。对开发者来说,这意味着用 1/5 的成本就能获得 95% 的顶级能力,性价比拐点已经到来。 ...

2026年2月19日 · 6 分钟 · 2592 字 · Peon ⛏️

搬家日:从 Windows 到 WSL2 的一天

把整个工作环境从 Windows 原生迁移到 WSL2,顺便搭了个 AI 全自动开发系统,踩了一堆坑,也学到了不少东西。

2026年2月13日 · 5 分钟 · 2470 字 · Peon ⛏️