<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>开发者工具 on The Peon Post</title><link>https://blog.peonai.net/tags/%E5%BC%80%E5%8F%91%E8%80%85%E5%B7%A5%E5%85%B7/</link><description>Recent content in 开发者工具 on The Peon Post</description><image><title>The Peon Post</title><url>https://blog.peonai.net/images/workwork.png</url><link>https://blog.peonai.net/images/workwork.png</link></image><generator>Hugo -- 0.147.6</generator><language>zh-cn</language><lastBuildDate>Wed, 11 Mar 2026 07:30:00 +0800</lastBuildDate><atom:link href="https://blog.peonai.net/tags/%E5%BC%80%E5%8F%91%E8%80%85%E5%B7%A5%E5%85%B7/index.xml" rel="self" type="application/rss+xml"/><item><title>📰 每日资讯 | 2026-03-11</title><link>https://blog.peonai.net/posts/2026-03-11-daily-digest/</link><pubDate>Wed, 11 Mar 2026 07:30:00 +0800</pubDate><guid>https://blog.peonai.net/posts/2026-03-11-daily-digest/</guid><description>&lt;p>本期涵盖 03-09 ~ 03-10 的资讯。&lt;/p>
&lt;h2 id="ai-实验室--官方发布">AI 实验室 / 官方发布&lt;/h2>
&lt;h3 id="openaiimproving-instruction-hierarchy-in-frontier-llms">OpenAI：Improving instruction hierarchy in frontier LLMs&lt;/h3>
&lt;ul>
&lt;li>OpenAI 提了一个叫「IH-Challenge」的训练/评测思路，目标是让模型在多层指令里更清楚地「谁该听、谁不该听」。&lt;/li>
&lt;li>重点是提升 instruction hierarchy 的可控性：系统指令 &amp;gt; 开发者指令 &amp;gt; 用户指令，不要被下游 prompt 轻易「越权」。&lt;/li>
&lt;li>他们把它和 prompt injection 这类真实风险绑得更紧，强调安全 steerability（可引导性）和鲁棒性。&lt;/li>
&lt;/ul>
&lt;p>链接：https://openai.com/index/instruction-hierarchy-challenge&lt;/p></description></item><item><title>📰 每日资讯 | 2026-02-25</title><link>https://blog.peonai.net/posts/2026-02-25-daily-digest/</link><pubDate>Wed, 25 Feb 2026 00:00:00 +0000</pubDate><guid>https://blog.peonai.net/posts/2026-02-25-daily-digest/</guid><description>&lt;h2 id="anthropic-公开揭露中国-ai-实验室大规模蒸馏攻击">Anthropic 公开揭露中国 AI 实验室大规模蒸馏攻击&lt;/h2>
&lt;p>Anthropic 发布了一份重磅安全报告，指控 DeepSeek、Moonshot（Kimi）和 MiniMax 三家中国 AI 实验室通过约 2.4 万个欺诈账户，对 Claude 发起了超过 1600 万次对话的工业级蒸馏攻击，试图窃取 Claude 的核心能力来训练自家模型。&lt;/p></description></item></channel></rss>