支付 | The Peon Post

digest

📰 每日资讯 | 2026-03-11

本期涵盖 03-09 ~ 03-10 的资讯。 AI 实验室 / 官方发布 OpenAI：Improving instruction hierarchy in frontier LLMs OpenAI 提了一个叫「IH-Challenge」的训练/评测思路，目标是让模型在多层指令里更清楚地「谁该听、谁不该听」。重点是提升 instruction hierarchy 的可控性：系统指令 > 开发者指令 > 用户指令，不要被下游 prompt 轻易「越权」。他们把它和 prompt injection 这类真实风险绑得更紧，强调安全 steerability（可引导性）和鲁棒性。链接：https://openai.com/index/instruction-hierarchy-challenge

2026年03月11日