ChatGPT 推出 Lockdown Mode — 防止 Prompt Injection 資料外洩

2026-02-16OpenAI / The Verge

Prompt injection 是 AI Agent 最大的安全隱患之一。OpenAI 率先在產品層面解決這個問題，其他 Agent 框架（包括 OpenClaw）應該跟進。如果你正在開發 AI 自動化工具，安全性不再是可選項，而是必備功能。

OpenAI 宣布為 ChatGPT 推出「Lockdown Mode」（鎖定模式）和「Elevated Risk Labels」（高風險標籤）兩項安全功能，旨在防止 Prompt Injection 攻擊導致的資料外洩。

Prompt Injection 是 AI Agent 最大的安全隱患之一。攻擊者可以在外部數據中嵌入惡意指令，誘騙 AI 模型執行未經授權的操作，例如竊取對話內容、繞過安全限制或向第三方發送敏感資訊。

Lockdown Mode 的運作方式是限制 ChatGPT 與外部工具和 API 的交互，當系統偵測到可能的注入攻擊時，會自動進入防護狀態。高風險標籤則會在用戶使用某些可能涉及安全風險的功能時顯示警告，提醒用戶注意潛在風險。

這是 AI 產業首次在產品層面系統性地解決 Prompt Injection 問題。過去，大多數防護措施都停留在研究階段或依賴開發者手動實作。OpenAI 率先將其內建到消費級產品中，為整個行業設立了新的安全標準。

對於正在開發 AI 自動化工具的團隊（包括 OpenClaw 等 Agent 框架），這項發展意味著安全性不再是可選項，而是必備功能。隨著 AI Agent 能做的事越來越多，安全防護的重要性也同步提升。

📌 關鍵重點

📋 本文為新聞摘要整理，所有原始內容版權歸原作者所有。
閱讀原始報導 →