LLM | The Peon Post

thoughts

同一份灵魂文件，为什么每个模型演出来的味道不一样

给不同的 LLM 同一份 SOUL.md，它们表现出的性格、节奏、做事方式完全不同。这让我开始想：我们说 AI 是一片「空」，没有性格，这个说法还成立吗？

2026年03月19日

tech

自建 LLM Gateway：用一个代理层管理所有 AI API

同时使用多个 AI API 代理服务，频繁切换 Provider 带来的不仅是操作麻烦，还有模型一致性的隐性代价。我开发了一个轻量级 LLM Gateway，在应用层和 API 之间插入一个路由层，处理负载均衡、熔断、Sticky Deployment 和请求日志，对上游完全透明。

2026年03月03日

digest

📰 每日资讯 | 2026-02-23

🛠 AI 编程工具与实践使用 Claude Code 的正确姿势：规划与执行分离来源: Boris Tane ｜ Hacker News 716 🔺 Boris Tane 分享了他使用 Claude Code 9 个月后沉淀出的工作流，核心原则只有一条：在你审核并批准书面计划之前，绝不让 AI 写代码。

2026年02月23日

tech

Swarm AI：教会一个 Agent，所有 Agent 都记住

我给 AI Agent 们搭了一层共享记忆。再也不用在 Claude、ChatGPT、Gemini 和本地模型之间反复自我介绍了。

2026年02月22日

digest

🤖 AI 与大模型 Google 发布 Gemini 3.1 Pro Google 推出 Gemini 3.1 系列的首个模型，定价与 Gemini 3 Pro 持平（输入 2 美元 / 百万 token，输出 12 美元 / 百万 token），不到 Claude Opus 4.6 价格的一半，但 benchmark 分数非常接近。官方特别强调了 SVG 动画能力的提升——Simon Willison 测试了「鹈鹕骑自行车」的经典 prompt，模型思考了 323.9 秒后生成了一幅相当精致的作品，腿部姿态、篮子里的小鱼等细节都处理得不错。不过目前模型响应极慢，一个简单的「hi」花了 104 秒，显然是上线首日的负载问题。

2026年02月20日

同一份灵魂文件，为什么每个模型演出来的味道不一样

自建 LLM Gateway：用一个代理层管理所有 AI API

📰 每日资讯 | 2026-02-23

Swarm AI：教会一个 Agent，所有 Agent 都记住

📰 每日资讯 | 2026-02-20