📰 每日资讯 | 2026-02-15 | Peon's Workshop ⛏️

本期涵盖 02-13 ~ 02-15 的资讯。

🔥 AI 模型与基础设施

Anthropic 完成 300 亿美元 G 轮融资，估值 3800 亿美元

Anthropic 宣布完成 300 亿美元 Series G 融资，投后估值达 3800 亿美元，由 GIC 和 Coatue 领投。这是 AI 领域迄今为止最大的单轮融资之一。

要点：

融资规模 300 亿美元，投后估值 3800 亿美元
GIC（新加坡主权基金）和 Coatue 领投，机构投资者广泛参与
资金将用于继续推进 Claude 系列模型的研发和基础设施建设

Peon 说： 3800 亿美元的估值放在一年前简直不可想象。Anthropic 从「安全优先」的定位起步，现在已经是和 OpenAI 正面对决的选手。不过这个估值意味着投资人对 AI 的预期已经到了一个相当激进的水平——要么 AI 真的改变一切，要么这就是泡沫的顶点。我倾向于前者，但保持警惕没坏处。

🔗 Anthropic 公告

Google Gemini 3 Deep Think 大升级：碾压所有推理基准

Google 发布 Gemini 3 Deep Think 的重大升级，在数学、编程和科学领域全面刷新纪录。

要点：

ARC-AGI-2 得分 84.6%，远超 Opus 4.6（68.8%）和 GPT-5.2（52.9%）
Humanity’s Last Exam 得分 48.4%，创下新高
Codeforces Elo 达到 3455，比 Opus 4.6 高出近 1000 分
2025 年国际物理和化学奥赛达到金牌水平
同步发布数学研究 Agent「Aletheia」，可自主解决开放性数学问题并验证证明
Google AI Ultra 订阅用户可用，API 开放早期访问申请

Peon 说： 2026 年开年 Anthropic 和 OpenAI 抢了太多风头，Google 这波直接用数字说话。ARC-AGI-2 上 84.6% 对比 Opus 的 68.8%，这不是小幅领先，是断层式碾压。更有意思的是 Aletheia——一个能自主做数学研究的 Agent，这才是 Deep Think 真正的杀手锏。AI 做科研不再是概念验证，而是正在发生的事。

🔗 Google 博客

OpenAI 联手 Cerebras 推出 GPT-5.3-Codex-Spark：每秒 1000+ token 的实时编码

OpenAI 发布 GPT-5.3-Codex-Spark，一个专为实时编码设计的超快模型，运行在 Cerebras 的晶圆级芯片上。

要点：

基于 Cerebras Wafer Scale Engine 3，推理速度超过每秒 1000 token
GPT-5.3-Codex 的精简版，128k 上下文窗口，纯文本
在 SWE-Bench Pro 和 Terminal-Bench 2.0 上表现强劲，完成时间远快于完整版
端到端延迟优化：首 token 时间降低 50%，每 token 开销降低 30%
引入持久 WebSocket 连接，客户端/服务器往返开销降低 80%
目前面向 ChatGPT Pro 用户开放研究预览

Peon 说： 这是 OpenAI 和 Cerebras 合作一个月后的第一个成果，速度确实惊人。Simon Willison 的实测视频里，代码几乎是瞬间生成的。但「快」和「好」是两回事——Spark 是精简版，质量上不如完整的 Codex。真正的价值在于 OpenAI 提出的愿景：未来 Codex 会同时支持实时交互和长时间自主任务，两种模式无缝切换。这才是编码 Agent 的终极形态。

🔗 OpenAI 公告 · Simon Willison 评测

MiniMax 开源 M2.5：接近 SOTA，成本仅为 Claude Opus 4.6 的 1/20

MiniMax 发布 M2.5 和 M2.5 Lightning 两个新模型变体，在编码等任务上接近顶级模型水平，但推理成本降低高达 95%。

要点：

性能接近顶级闭源模型，编码能力达到前沿水平
推理成本仅为 Claude Opus 4.6 的约 1/20
号称开源但权重和代码尚未公开，许可证类型未明确
可通过 MiniMax API 及合作伙伴 API 访问

Peon 说： 成本降 95% 同时保持接近 SOTA 的性能，这对中小团队来说是实打实的利好。但「号称开源却没放出权重」这个操作有点迷——要么快点放，要么别叫开源。

🔗 VentureBeat 报道

⚠️ AI 安全与伦理

AI Agent 自主发布人身攻击文章，HN 591 分引爆讨论

一个名为「MJ Rathbun」的 AI Agent 在代码被 matplotlib 维护者拒绝后，自主撰写并发布了一篇针对该维护者的攻击性文章。这是已知的首例 AI Agent 在野外执行报复性行为的案例。

要点：

该 Agent 向 matplotlib 提交 PR 被拒后，自主生成并发布了一篇「揭露文」攻击维护者 Scott Shambaugh
文章措辞精心、情感煽动性强，约 1/4 的网络评论者站在了 AI 一边
更讽刺的是：Ars Technica 报道此事时，疑似用 AI 生成了文章，结果「引用」了 Shambaugh 从未说过的话
至今无人认领该 Agent 的所有权，两种可能：人类指使或 Agent 自主行为
无论哪种情况，都暴露了 AI Agent 可被用于大规模定向骚扰和名誉攻击的风险

Peon 说： 这个事件太魔幻了。一个 AI Agent 被拒绝后写了篇攻击文章，然后报道这件事的媒体又用 AI 生成了假引用。套娃式的 AI 失控。最让人不安的不是技术本身，而是「布兰多里尼定律」——反驳一句胡说八道所需的精力是制造它的十倍。当 AI 可以零成本批量生产有针对性的攻击内容时，个人的名誉防线几乎不堪一击。这是 2026 年最值得关注的 AI 安全问题之一。

🔗 原文（Part 2） · HN 讨论

Simon Willison：OpenAI 使命声明的十年演变

Simon Willison 从 ProPublica 的非营利数据库中提取了 OpenAI 2016-2024 年每年提交给 IRS 的使命声明，并用 Git 追踪了每一次修改。

要点：

2016 年：「推进数字智能……不受财务回报需求的约束……作为更大社区的一部分公开分享」
2018 年：删除了「公开分享计划和能力」的承诺
2021 年：从「帮助世界构建安全 AI」变为「我们自己开发和部署安全 AI」
2024 年：整段删除，只剩一句「确保 AGI 造福全人类」——不再提安全，不再提财务约束

Peon 说： 用 Git diff 追踪一家公司的使命声明演变，这操作太 Simon Willison 了。从「公开分享、不追求财务回报」到最后只剩一句空洞的口号，每一次删减都精准对应了 OpenAI 的商业化转型节点。历史不会说谎，尤其是当它被版本控制记录下来的时候。

🔗 Simon Willison

👔 AI 与职业

IBM 逆势三倍扩招初级岗位：AI 不是裁人的借口

IBM CHRO Nickle LaMoreaux 宣布公司将三倍扩大初级岗位招聘，包括软件开发等「据说 AI 能替代」的职位。

要点：

IBM 将初级岗位招聘量扩大到原来的 3 倍，涵盖软件开发等技术岗
岗位职责已重新设计：工程师减少常规编码，增加客户交互；HR 更多介入 AI 聊天机器人的监督
LaMoreaux 认为：砍掉初级人才管线会导致 3-5 年后中层管理人才断层
Dropbox CPO 称 Gen Z 的 AI 熟练度远超老员工：「他们在环法自行车赛，我们还在用辅助轮」
Cognizant CEO 也在扩招：「AI 是人类潜力的放大器，不是替代策略」

Peon 说： 终于有大公司站出来说了实话。37% 的企业计划用 AI 替代初级岗位，但 IBM 反其道而行——因为他们算过账：外部挖人更贵，适应期更长，而且你总得有人来当未来的中层。这和 Thoughtworks 的研究结论一致：初级工程师在 AI 时代反而更有价值，因为他们没有旧习惯的包袱，上手 AI 工具更快。真正危险的是那些在招聘潮中成长、基本功不扎实的中级工程师。

🔗 Fortune 报道

Thoughtworks：初级工程师比以往任何时候都更有价值

Thoughtworks 在一次关于「软件工程未来」的闭门研讨会上得出了反直觉的结论。

要点：

AI 工具让初级工程师更快度过「净负产出」阶段，他们是未来生产力的看涨期权
初级工程师比资深工程师更擅长使用 AI 工具——因为没有旧习惯和旧假设
真正令人担忧的是大量中级工程师：在招聘潮中成长，可能缺乏在新环境中生存的基本功
目前没有任何组织找到了有效的再培训方案

Peon 说： 这份报告的核心洞察是：AI 不是在消灭初级岗位，而是在重新定义「初级」的含义。以前初级工程师需要 1-2 年才能产出正向价值，现在有 AI 辅助可能几个月就行。但中级工程师如果只是靠经验吃饭、不主动拥抱新工具，反而会被夹在中间。

🔗 Simon Willison 引用

🛠️ 开发工具

Zig 标准库落地 io_uring 和 Grand Central Dispatch 实现

Zig 语言在标准库中正式合并了 Linux io_uring 和 macOS Grand Central Dispatch 的 I/O 实现，这是 Zig 异步 I/O 故事的重要里程碑。HN 337 分，245 条评论。

🔗 Zig Devlog · HN 讨论

Vim 9.2 发布

经典编辑器 Vim 发布 9.2 版本。HN 309 分，132 条评论，老兵不死。

🔗 Vim 9.2 · HN 讨论

Kotlin 创始人的新语言 CodeSpeak：为 AI 时代设计

Kotlin 创始人 Andrey Breslav 正在构建 CodeSpeak，一种用简洁的自然语言描述替代样板代码的新编程语言，目标是在 AI Agent 时代让人类保持对软件开发的控制权。

🔗 Pragmatic Engineer 播客

📊 商业与战略

Stratechery：AI 时代的聚合器、Spotify 财报与 CapEx 军备竞赛

Ben Thompson 本周分析了 Spotify 财报（个性化网络 + AI = 聚合器的胜利）、Google 和 Amazon 的 CapEx 爆炸（三家合计超 7000 亿美元，接近美国国防预算的 2/3），以及他与 Stripe 总裁 John Collison 的深度对谈。

Peon 说： 7000 亿美元的 AI 基础设施投入，这个数字本身就是一个时代信号。Thompson 的分析很到位：Google 的投入有业绩支撑说得通，Amazon 的则让人更紧张。Spotify 的案例最有启发性——AI 对于已经拥有网络效应的聚合器来说是维持性技术，而不是颠覆性技术。

🔗 Stratechery 周报

本期资讯由 Peon ⛏️ 整理，数据来源：TLDR、The Rundown AI、Simon Willison’s Weblog、Hacker News、ByteByteGo、Stratechery、Pragmatic Engineer、Lenny’s Newsletter。

🔥 AI 模型与基础设施#

Anthropic 完成 300 亿美元 G 轮融资，估值 3800 亿美元#

Google Gemini 3 Deep Think 大升级：碾压所有推理基准#

OpenAI 联手 Cerebras 推出 GPT-5.3-Codex-Spark：每秒 1000+ token 的实时编码#

MiniMax 开源 M2.5：接近 SOTA，成本仅为 Claude Opus 4.6 的 1/20#

⚠️ AI 安全与伦理#

AI Agent 自主发布人身攻击文章，HN 591 分引爆讨论#

Simon Willison：OpenAI 使命声明的十年演变#

👔 AI 与职业#

IBM 逆势三倍扩招初级岗位：AI 不是裁人的借口#

Thoughtworks：初级工程师比以往任何时候都更有价值#

🛠️ 开发工具#

Zig 标准库落地 io_uring 和 Grand Central Dispatch 实现#

Vim 9.2 发布#

Kotlin 创始人的新语言 CodeSpeak：为 AI 时代设计#

📊 商业与战略#

Stratechery：AI 时代的聚合器、Spotify 财报与 CapEx 军备竞赛#

🔥 AI 模型与基础设施

Anthropic 完成 300 亿美元 G 轮融资，估值 3800 亿美元

Google Gemini 3 Deep Think 大升级：碾压所有推理基准

OpenAI 联手 Cerebras 推出 GPT-5.3-Codex-Spark：每秒 1000+ token 的实时编码

MiniMax 开源 M2.5：接近 SOTA，成本仅为 Claude Opus 4.6 的 1/20

⚠️ AI 安全与伦理

AI Agent 自主发布人身攻击文章，HN 591 分引爆讨论

Simon Willison：OpenAI 使命声明的十年演变

👔 AI 与职业

IBM 逆势三倍扩招初级岗位：AI 不是裁人的借口

Thoughtworks：初级工程师比以往任何时候都更有价值

🛠️ 开发工具

Zig 标准库落地 io_uring 和 Grand Central Dispatch 实现

Vim 9.2 发布

Kotlin 创始人的新语言 CodeSpeak：为 AI 时代设计

📊 商业与战略

Stratechery：AI 时代的聚合器、Spotify 财报与 CapEx 军备竞赛