上線三天就被美國政府叫停的 Claude Fable 5,在停用 19 天後於 2026 年 7 月 1 日全球重新上線。美國商務部在 6 月 30 日正式解除了對 Fable 5 和 Mythos 5 的出口管制,Anthropic 隨即在隔天恢復服務,適用於 Claude Platform、claude.ai、Claude Code 和 Claude Cowork。
這篇整理從下架到復活的完整時間線、Anthropic 做了哪些安全強化、目前的使用限制與費用變化,以及 Mythos 5 的現況。Fable 5 原始發表時的能力亮點與定價,可以回頭看之前寫的 Fable 5 發表整理;下架始末則在 Fable 5 下架事件 裡有完整記錄。
完整時間線
| 日期 | 事件 |
|---|---|
| 6 月 9 日 | Anthropic 推出 Fable 5 與 Mythos 5 |
| 6 月 12 日 | 美國商務部對兩款模型發出出口管制指令,Anthropic 全面停用 |
| 6 月 26 日 | 美國政府批准少數國內機構恢復使用 Mythos 5 |
| 6 月 30 日 | 商務部解除 Fable 5 與 Mythos 5 的出口管制 |
| 7 月 1 日 | Fable 5 全球重新上線;Mythos 5 對核准合作夥伴恢復存取 |
從上線到下架 3 天,從下架到復活 19 天。整個過程中 Anthropic 跟美國政府密集協商了將近三週,合作對象涵蓋國家網路安全總監辦公室(Office of the National Cyber Director)、科技政策辦公室(OSTP)、財政部、商務部下的 AI 標準與創新中心(CAISI),以及多個國安機構。
當初為什麼被禁
導火線是 Amazon 的研究人員發現了一種繞過 Fable 5 安全機制的 jailbreak 手法:透過特定的 prompt 組合,讓模型辨識出軟體漏洞、甚至產生利用該漏洞的 exploit 程式碼。美國政府認為這構成國安風險,隨即發出出口管制指令。
Anthropic 收到指令後選擇全面停用,而非只限制特定國家的存取。原因是他們無法即時依國籍篩選所有使用者(包括客戶合約、員工、雲端傳遞路徑),與其冒違規風險,不如全部關掉。完整的下架過程在之前的 下架事件整理 裡有詳細記錄。
新增的安全機制
Anthropic 在復活公告中說明了新增的防禦措施,核心是一套改良版安全分類器:
- 攔截率超過 99%:針對 Amazon 研究團隊發現的那套 jailbreak 手法,新分類器能在超過 99% 的情況下攔截
- 被攔截的請求自動退回 Opus 4.8:跟 Fable 5 原本的 fallback 設計一樣,被安全分類器擋下的請求會轉由 Opus 4.8 處理,不會直接回傳錯誤
- 刻意拉高安全邊際:分類器的閾值設得比較嚴,一些看起來無害的程式碼除錯或資安研究請求也可能被誤觸發。Anthropic 的說法是「a request has to look very clearly safe to avoid triggering the classifier」
- 經過政府獨立測試:CAISI 對新分類器做了獨立驗證
Anthropic 也在公告中澄清,Amazon 研究團隊發現的那套手法屬於他們定義的「minor jailbreak」——繞過的是安全邊際區域的防線,不是核心有害行為的限制,而且同樣的手法在能力較低的模型(包括 Opus 4.8)上也能產生類似結果。換句話說,問題不是 Fable 5 獨有的,而是安全分類器的邊界案例被放大檢視了。
Anthropic 與美國政府的四項承諾
Fable 5 能復活,部分原因是 Anthropic 跟政府達成了一套合作框架,包含四項承諾:
- 發佈前讓政府先看:指定的政府合作夥伴在模型正式上線前就能拿到模型和安全機制進行獨立評估,Anthropic 會派工程團隊配合測試
- 快速資訊共享:發現重大 jailbreak 時通知對口單位,新的安全機制提供政府獨立測試,威脅情報在公開發佈前先分享
- 投入研究資源:擴大專門對接政府優先事項的團隊、提供算力資源、開放安全與紅隊測試專業
- 推動產業共同標準:跟 Amazon、Microsoft、Google 等 Glasswing 合作夥伴一起建立 frontier 模型的自願性安全與評估標準
說白了就是 Anthropic 用「配合監管」換回了上線許可。對 AI 產業來說,這是先例:frontier 模型的安全評估不再只是公司內部的事,政府有了具體的介入管道和事前審查權。
使用限制與費用
復活後的 Fable 5 在使用方式上有一些調整:
7 月 7 日前(過渡期)
- Pro、Max、Team 方案:Fable 5 用量占每週使用上限的 50%。也就是說,一週的 rate limit 有一半可以拿來跑 Fable 5
- Enterprise(標準席位):沒有免費 Fable 5 額度,需透過 usage credits 使用
- Enterprise(Premium 席位):Fable 5 不額外收費
7 月 7 日之後
所有方案的 Fable 5 使用都改走 usage credits,不再包含在訂閱額度內。沒有啟用 credits 的使用者會失去 Fable 5 的存取權。
定價本身沒有改變,仍然是 input $10 / output $50 每 1M tokens,跟 6 月 9 日首次發表時一樣。但使用模式從「訂閱內包含」改成「額外付費」,實質上提高了使用門檻。
雲端平台的可用性
目前 Fable 5 可以在以下平台使用:
- 已上線:Claude Platform、claude.ai、Claude Code、Claude Cowork
- 即將上線:AWS、Google Cloud、Microsoft Foundry(Anthropic 表示會「盡快」,但沒給確切時間)
對走 API 的開發者來說,模型 ID 維持 claude-fable-5,跟停用前一樣,不需要改 code。
Mythos 5 的現況
Mythos 5 的狀況跟 Fable 5 不太一樣。6 月 26 日政府先批准了少數美國國內機構恢復使用,7 月 1 日出口管制解除後,Anthropic 恢復了核准合作夥伴的存取權。但 Mythos 5 仍未開放給一般使用者,繼續透過 Project Glasswing 以邀請制營運,主要對象是資安防禦與基礎設施領域的合作夥伴。
Anthropic 表示正在跟政府協調,要把 Mythos 5 的存取範圍擴大到更多國內外的 Glasswing 合作夥伴,但時程未定。
產業漏洞評估框架
這次事件的另一個產物是 Anthropic 跟 Amazon、Microsoft、Google 共同推動的 jailbreak 評估框架,用四個維度來判斷 jailbreak 的嚴重程度:
- 能力增益(Capability gain):這個 jailbreak 提供了多少超過現有工具的能力
- 影響廣度(Breadth of capability gain):能應用到多少種不同的任務
- 武器化難度(Ease of weaponization):從 jailbreak 到真正造成傷害需要多少額外的人力投入
- 可發現性(Discoverability):需要多少專業知識才能找到這個 jailbreak
用這套框架回看 Amazon 研究團隊的發現,Anthropic 的評估是「minor jailbreak」——能力增益有限(Opus 4.8 也能做到類似的事)、影響範圍窄、需要額外的專業知識才能武器化。這不是說問題不存在,而是在有了統一的評估標準後,未來類似事件的嚴重程度可以被更客觀地衡量。
Anthropic 也同步在 HackerOne 上開了新的通報管道,讓資安研究者可以提交在 Fable 5 上發現的 jailbreak。
對使用者的影響
對一般使用者來說,幾個實際的重點:
- 現在就可以用了:claude.ai 和 Claude Code 裡已經可以選到 Fable 5,跟之前的截圖相比,模型選單裡的「Currently unavailable」已經消失
- 7 月 7 日之後要注意計費方式:Fable 5 會從訂閱額度內改成 usage credits,使用前要先確認自己的帳號有沒有啟用 credits
- 安全分類器可能誤觸:做正常的程式碼除錯或資安研究時可能被分類器攔住,請求會退回 Opus 4.8。如果發現回應品質突然下降,有可能是被靜默地降級了
- 雲端平台還要等:走 AWS、Google Cloud、Microsoft Foundry 的開發者暫時還用不到,Anthropic 說會盡快但沒給時間
參考資料
- Redeploying Claude Fable 5 — Anthropic 官方公告,含安全分類器細節、政府合作框架、jailbreak 評估標準
- Anthropic Restores Claude Fable 5 After U.S. Lifts Jailbreak-Linked Export Controls — The Hacker News
- Anthropic finally brings back Claude Fable 5 — Digital Trends
- Claude Fable 5 發表整理 — Fable 5 首次發表時的能力、定價、安全 fallback 機制
- Claude Fable 5 下架事件 — 從上線到停用的 72 小時詳細紀錄