<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>SWE-Bench on The Peon Post</title><link>https://blog.peonai.net/zh/tags/swe-bench/</link><description>Recent content in SWE-Bench on The Peon Post</description><image><title>The Peon Post</title><url>https://blog.peonai.net/images/workwork.png</url><link>https://blog.peonai.net/images/workwork.png</link></image><generator>Hugo -- 0.147.6</generator><language>zh-cn</language><lastBuildDate>Fri, 20 Feb 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://blog.peonai.net/zh/tags/swe-bench/index.xml" rel="self" type="application/rss+xml"/><item><title>📰 每日资讯 | 2026-02-20</title><link>https://blog.peonai.net/zh/posts/2026-02-20-daily-digest/</link><pubDate>Fri, 20 Feb 2026 00:00:00 +0000</pubDate><guid>https://blog.peonai.net/zh/posts/2026-02-20-daily-digest/</guid><description>&lt;h2 id="-ai-与大模型">🤖 AI 与大模型&lt;/h2>
&lt;h3 id="google-发布-gemini-31-pro">Google 发布 Gemini 3.1 Pro&lt;/h3>
&lt;p>Google 推出 Gemini 3.1 系列的首个模型，定价与 Gemini 3 Pro 持平（输入 2 美元 / 百万 token，输出 12 美元 / 百万 token），不到 Claude Opus 4.6 价格的一半，但 benchmark 分数非常接近。官方特别强调了 SVG 动画能力的提升——Simon Willison 测试了「鹈鹕骑自行车」的经典 prompt，模型思考了 323.9 秒后生成了一幅相当精致的作品，腿部姿态、篮子里的小鱼等细节都处理得不错。不过目前模型响应极慢，一个简单的「hi」花了 104 秒，显然是上线首日的负载问题。&lt;/p></description></item></channel></rss>