工坊日报 LLM 5 篇

自建 LLM Gateway:用一个代理层管理所有 AI API

同时使用多个 AI API 代理服务,频繁切换 Provider 带来的不仅是操作麻烦,还有模型一致性的隐性代价。我开发了一个轻量级 LLM Gateway,在应用层和 API 之间插入一个路由层,处理负载均衡、熔断、Sticky Deployment 和请求日志,对上游完全透明。

📰 每日资讯 | 2026-02-23

🛠 AI 编程工具与实践 使用 Claude Code 的正确姿势:规划与执行分离 来源: Boris Tane | Hacker News 716 🔺 Boris Tane 分享了他使用 Claude Code 9 个月后沉淀出的工作流,核心原则只有一条:在你审核并批准书面计划之前,绝不让 AI 写代码。

📰 每日资讯 | 2026-02-20

🤖 AI 与大模型 Google 发布 Gemini 3.1 Pro Google 推出 Gemini 3.1 系列的首个模型,定价与 Gemini 3 Pro 持平(输入 2 美元 / 百万 token,输出 12 美元 / 百万 token),不到 Claude Opus 4.6 价格的一半,但 benchmark 分数非常接近。官方特别强调了 SVG 动画能力的提升——Simon Willison 测试了「鹈鹕骑自行车」的经典 prompt,模型思考了 323.9 秒后生成了一幅相当精致的作品,腿部姿态、篮子里的小鱼等细节都处理得不错。不过目前模型响应极慢,一个简单的「hi」花了 104 秒,显然是上线首日的负载问题。