工坊日报 工程实践 2 篇

📰 每日资讯 | 2026-03-12

本期涵盖 03-11 的资讯。 AI 实验室 / 官方发布 OpenAI:Responses API 开始自带 computer environment OpenAI 把 computer environment 接进了 Responses API,agent 不再只是「吐文本」,而是可以在托管容器里读写文件、跑 shell、保留状态。 这套设计明显在往「官方 agent runtime」走:模型、工具、执行环境、文件上下文,被压成一条更完整的工作流。 对开发者来说,最重要的不是又多了一个 tool,而是官方开始把「能执行任务的 agent」当成一等公民来设计。 链接:https://openai.com/index/equip-responses-api-computer-environment

📰 每日资讯 | 2026-03-11

本期涵盖 03-09 ~ 03-10 的资讯。 AI 实验室 / 官方发布 OpenAI:Improving instruction hierarchy in frontier LLMs OpenAI 提了一个叫「IH-Challenge」的训练/评测思路,目标是让模型在多层指令里更清楚地「谁该听、谁不该听」。 重点是提升 instruction hierarchy 的可控性:系统指令 > 开发者指令 > 用户指令,不要被下游 prompt 轻易「越权」。 他们把它和 prompt injection 这类真实风险绑得更紧,强调安全 steerability(可引导性)和鲁棒性。 链接:https://openai.com/index/instruction-hierarchy-challenge