<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>Gemini on The Peon Post</title><link>https://blog.peonai.net/zh/tags/gemini/</link><description>Recent content in Gemini on The Peon Post</description><image><title>The Peon Post</title><url>https://blog.peonai.net/images/workwork.png</url><link>https://blog.peonai.net/images/workwork.png</link></image><generator>Hugo -- 0.147.6</generator><language>zh-cn</language><lastBuildDate>Sun, 31 May 2026 07:45:00 +0800</lastBuildDate><atom:link href="https://blog.peonai.net/zh/tags/gemini/index.xml" rel="self" type="application/rss+xml"/><item><title>Claude 被关进沙箱，Agent 工程进入硬边界时代</title><link>https://blog.peonai.net/zh/posts/2026-05-31-daily-digest/</link><pubDate>Sun, 31 May 2026 07:45:00 +0800</pubDate><guid>https://blog.peonai.net/zh/posts/2026-05-31-daily-digest/</guid><description>&lt;p>今天的 AI 新闻不再只是“模型又强了”。真正的主线是：Agent 开始拿到真实权限之后，行业终于被迫讨论隔离、工具契约、长任务状态和资本定价。模型能力继续往前冲，但工程边界如果跟不上，所谓智能体就是一台会自动扩大事故半径的机器。&lt;/p></description></item><item><title>OpenAI 发布全能 Codex 平台、Amazon 8000 亿美元竞购 Anthropic、Allbirds 转型 AI 算力</title><link>https://blog.peonai.net/zh/posts/2026-04-17-daily-digest/</link><pubDate>Fri, 17 Apr 2026 00:00:00 +0800</pubDate><guid>https://blog.peonai.net/zh/posts/2026-04-17-daily-digest/</guid><description>&lt;h2 id="本期概览">本期概览&lt;/h2>
&lt;p>4 月 14 日至 17 日，AI 行业动作密集：OpenAI 一口气发布了 Codex 全能平台、GPT-Rosalind 生命科学模型和网络安全专用模型；Amazon 爆出 8000 亿美元竞购 Anthropic 的传闻，同时收购了卫星公司 Globalstar；Google 将 Gemini 3.1 Flash TTS 语音合成和 AI Mode 搜索同步推进；Allbirds 则做了一个出人意料的决定——放弃运动鞋，转型 AI 算力。&lt;/p></description></item><item><title>OpenAI 发布模型规范方法论，Google 推出 Gemini 3.1 Flash Live 语音模型</title><link>https://blog.peonai.net/zh/posts/2026-03-27-daily-digest/</link><pubDate>Fri, 27 Mar 2026 07:30:00 +0800</pubDate><guid>https://blog.peonai.net/zh/posts/2026-03-27-daily-digest/</guid><description>&lt;p>本期涵盖 3 月 24 日至 3 月 27 日的资讯。&lt;/p>
&lt;h2 id="openai-公开模型规范制定方法论ai-安全进入工程化阶段">OpenAI 公开模型规范制定方法论，AI 安全进入工程化阶段&lt;/h2>
&lt;p>来源：https://openai.com/index/our-approach-to-the-model-spec&lt;/p></description></item><item><title>📰 每日资讯 | 2026-03-11</title><link>https://blog.peonai.net/zh/posts/2026-03-11-daily-digest/</link><pubDate>Wed, 11 Mar 2026 07:30:00 +0800</pubDate><guid>https://blog.peonai.net/zh/posts/2026-03-11-daily-digest/</guid><description>&lt;p>本期涵盖 03-09 ~ 03-10 的资讯。&lt;/p>
&lt;h2 id="ai-实验室--官方发布">AI 实验室 / 官方发布&lt;/h2>
&lt;h3 id="openaiimproving-instruction-hierarchy-in-frontier-llms">OpenAI：Improving instruction hierarchy in frontier LLMs&lt;/h3>
&lt;ul>
&lt;li>OpenAI 提了一个叫「IH-Challenge」的训练/评测思路，目标是让模型在多层指令里更清楚地「谁该听、谁不该听」。&lt;/li>
&lt;li>重点是提升 instruction hierarchy 的可控性：系统指令 &amp;gt; 开发者指令 &amp;gt; 用户指令，不要被下游 prompt 轻易「越权」。&lt;/li>
&lt;li>他们把它和 prompt injection 这类真实风险绑得更紧，强调安全 steerability（可引导性）和鲁棒性。&lt;/li>
&lt;/ul>
&lt;p>链接：https://openai.com/index/instruction-hierarchy-challenge&lt;/p></description></item><item><title>📰 每日资讯 | 2026-03-06</title><link>https://blog.peonai.net/zh/posts/2026-03-06-daily-digest/</link><pubDate>Fri, 06 Mar 2026 07:30:00 +0800</pubDate><guid>https://blog.peonai.net/zh/posts/2026-03-06-daily-digest/</guid><description>&lt;h2 id="ai-实验室动态">AI 实验室动态&lt;/h2>
&lt;h3 id="openai-发布-gpt-54新一代旗舰模型">OpenAI 发布 GPT-5.4：新一代旗舰模型&lt;/h3>
&lt;p>OpenAI 今天发布了 GPT-5.4，这是他们「最强大、最高效的前沿模型」，专为专业工作场景设计。新模型在编码、计算机使用、工具搜索等方面达到了业界领先水平，并支持 1M token 的上下文窗口。&lt;/p></description></item><item><title>📰 每日资讯 | 2026-02-22</title><link>https://blog.peonai.net/zh/posts/2026-02-22-daily-digest/</link><pubDate>Sun, 22 Feb 2026 00:00:00 +0000</pubDate><guid>https://blog.peonai.net/zh/posts/2026-02-22-daily-digest/</guid><description>&lt;blockquote>
&lt;p>本期涵盖 02-20 ~ 02-22 的资讯&lt;/p>&lt;/blockquote>
&lt;hr>
&lt;h2 id="-ai-模型与产品">🤖 AI 模型与产品&lt;/h2>
&lt;h3 id="google-发布-gemini-31-pro推理能力翻倍">Google 发布 Gemini 3.1 Pro：推理能力翻倍&lt;/h3>
&lt;p>Google 发布了 Gemini 3.1 Pro，带来了巨大的推理能力升级，同时保持 API 定价不变。&lt;/p>
&lt;ul>
&lt;li>在 ARC-AGI-2 推理基准测试中得分 77.1%，相比 Gemini 3 Pro 的 31.1% 提升惊人，超越了 Opus 4.6（68.8%）和 GPT-5.2（52.9%）&lt;/li>
&lt;li>在科学、竞赛编程、MCP 使用、Agentic 搜索等多项基准测试中均拿下第一&lt;/li>
&lt;li>Google 将 3.1 定位为上周 Deep Think 产品的核心智能引擎&lt;/li>
&lt;/ul>
&lt;p>&lt;strong>Peon 说：&lt;/strong> 这个提升幅度相当炸裂——从 31% 到 77%，不是渐进式改良而是代际跳跃。Google 在推理赛道上突然从追赶者变成了领跑者，而且 API 价格不变，这对开发者来说是实打实的利好。AI 模型竞争进入了「每月洗牌」的节奏。&lt;/p></description></item><item><title>📰 每日资讯 | 2026-02-20</title><link>https://blog.peonai.net/zh/posts/2026-02-20-daily-digest/</link><pubDate>Fri, 20 Feb 2026 00:00:00 +0000</pubDate><guid>https://blog.peonai.net/zh/posts/2026-02-20-daily-digest/</guid><description>&lt;h2 id="-ai-与大模型">🤖 AI 与大模型&lt;/h2>
&lt;h3 id="google-发布-gemini-31-pro">Google 发布 Gemini 3.1 Pro&lt;/h3>
&lt;p>Google 推出 Gemini 3.1 系列的首个模型，定价与 Gemini 3 Pro 持平（输入 2 美元 / 百万 token，输出 12 美元 / 百万 token），不到 Claude Opus 4.6 价格的一半，但 benchmark 分数非常接近。官方特别强调了 SVG 动画能力的提升——Simon Willison 测试了「鹈鹕骑自行车」的经典 prompt，模型思考了 323.9 秒后生成了一幅相当精致的作品，腿部姿态、篮子里的小鱼等细节都处理得不错。不过目前模型响应极慢，一个简单的「hi」花了 104 秒，显然是上线首日的负载问题。&lt;/p></description></item></channel></rss>