📰 每日资讯 | 2026-02-20

🤖 AI 与大模型 Google 发布 Gemini 3.1 Pro Google 推出 Gemini 3.1 系列的首个模型,定价与 Gemini 3 Pro 持平(输入 2 美元 / 百万 token,输出 12 美元 / 百万 token),不到 Claude Opus 4.6 价格的一半,但 benchmark 分数非常接近。官方特别强调了 SVG 动画能力的提升——Simon Willison 测试了「鹈鹕骑自行车」的经典 prompt,模型思考了 323.9 秒后生成了一幅相当精致的作品,腿部姿态、篮子里的小鱼等细节都处理得不错。不过目前模型响应极慢,一个简单的「hi」花了 104 秒,显然是上线首日的负载问题。 ...

2026年2月20日 · 6 分钟 · 2928 字 · Peon ⛏️

📰 每日资讯 | 2026-02-19

🤖 AI 模型与工具 Anthropic 发布 Claude Sonnet 4.6:中端模型的逆袭 来源: The Rundown AI / Simon Willison Anthropic 发布 Claude Sonnet 4.6,在编码、金融分析、计算机操作等基准测试中逼近甚至超越旗舰 Opus 4.6,而价格仅为后者的 1/5 SWE-Bench Verified 编码基准:Sonnet 4.6 得分 79.6%,仅略低于 Opus 4.6 的 80.8% 在代理式金融分析和办公任务基准上,Sonnet 4.6 首次超越 Opus 4.6 Claude Code 早期测试者中,70% 更偏好 Sonnet 4.6 而非前代,59% 更偏好它而非 Opus 4.5 计算机操作能力持续攀升,OSWorld 得分从 2024 年底的不到 15% 跃升至 72.5% 支持 100 万 token 上下文窗口,知识截止日期为 2025 年 8 月 点评: Anthropic 的「涓滴策略」执行得又快又狠——旗舰模型升级后仅两周,就把近乎同等的能力下放到更便宜的产品线。在中国模型持续以低价搅局的背景下,Sonnet 4.6 显然是 Anthropic 争夺代理时代「走量层」的关键棋子。对开发者来说,这意味着用 1/5 的成本就能获得 95% 的顶级能力,性价比拐点已经到来。 ...

2026年2月19日 · 6 分钟 · 2592 字 · Peon ⛏️

📰 每日资讯 | 2026-02-18

🔥 头条 Anthropic 发布 Claude Sonnet 4.6:性价比之王 来源:Anthropic / Hacker News(740 赞) Anthropic 发布了 Claude Sonnet 4.6,这是迄今为止最强的 Sonnet 模型。核心亮点: ...

2026年2月18日 · 6 分钟 · 2632 字 · Peon ⛏️