Anthropic 在 2026 年 6 月 9 日發表 Claude Fable 5,這是他們首次把 Mythos 級別的模型開放給一般開發者與訂閱用戶使用。原本在 Project Glasswing 裡以邀請制運作的 Claude Mythos Preview 也升級為正式版 Claude Mythos 5。Anthropic 在公告裡直接說 Fable 5 的能力「exceed those of any model we’ve ever made generally available」,意指這是他們目前公開發佈過的所有模型來看,Fable 5 是最強的。

這篇文章整理 Fable 5 和 Mythos 5 的關係、定價、跟 Opus 4.8 的差異、主要能力亮點,以及它獨特的安全分類器 fallback 機制。

Fable 5 跟 Mythos 5 的關係

Fable 5 和 Mythos 5 是同一個底層模型,差別在安全防護的層級。Anthropic 自己解釋命名時說「Fable is from the Latin fabula, ‘that which is told,’ akin to the Greek mythos. The safeguards are what distinguish the two models.」——也就是說,這不是兩個不同能力等級的模型,而是同一個模型穿了不同的護甲。

具體來說:

  • Claude Fable 5claude-fable-5):面向所有開發者與訂閱用戶,加了安全分類器。當使用者的請求觸及網路安全攻擊、生物化學敏感領域、或是大規模模型蒸餾時,會自動降級到 Opus 4.8 來回應,而不是直接拒絕
  • Claude Mythos 5claude-mythos-5):同一個底層模型,但安全分類器在特定領域被移除。僅限 Project Glasswing 的授權用戶使用,主要對象是美國政府的網路防禦單位與基礎設施供應商

Anthropic 給出的實際影響範圍是:超過 95% 的 Fable 5 對話完全不會觸發 fallback——也就是 95% 以上的時候,Fable 5 的表現跟 Mythos 5 一模一樣。只有碰到敏感領域時,使用者才會「被轉接」到 Opus 4.8。這個設計思路比單純拒絕請求好得多,至少使用者還是能拿到一個有用的回應。

定價與規格

Fable 5 跟 Opus 4.8 Fast Mode相同,是 Opus 4.8 的兩倍價格:

項目Claude Fable 5Claude Opus 4.8Opus 4.8 Fast Mode
模型 IDclaude-fable-5claude-opus-4-8claude-opus-4-8(Fast Mode)
Input 價格$10 / 1M tokens$5 / 1M tokens$10 / 1M tokens
Output 價格$50 / 1M tokens$25 / 1M tokens$50 / 1M tokens
Context window1M tokens1M tokens1M tokens
Max output128K tokens128K tokens128K tokens
Adaptive thinking有(預設開啟)
Extended thinking
Claude 模型 input 計費折線圖:Fable 5 與 Opus 4.8 Fast Mode 同為 $10/M 斜率最陡,Opus 4.8 一般模式 $5/M,Sonnet 4.6 $3/M,Haiku 4.5 $1/M 但 context 上限 200K
Fable 5 跟 Opus 4.8 Fast Mode 同為 $10/M(紫色虛線與棕色實線重疊)。

Fable 5 的定價剛好是 Opus 4.8 一般模式的 2 倍,跟 Opus 4.8 Fast Mode 的價格一模一樣。Anthropic 說這「不到 Mythos Preview 的一半」,代表之前 Mythos Preview 的定價至少在 $20/$100 以上。從這個角度看,Fable 5 等於是用比之前便宜一半以上的價格,把 Mythos 級的能力帶到一般開發者手上。

不過要注意 Fable 5 使用的是 Opus 4.7 開始的新 tokenizer,同樣的文字會產生比之前更多的 tokens,根據不同語言與內文可能多出 30%。這不是 Fable 5 獨有的問題(Opus 4.7、4.8 也一樣),但如果是從 Opus 4.6 或更早的模型跳上來,實際帳單會比單看單價差距更高。

如果 Opus 4.8 的能力已經足夠,沒有必要為了「用最強模型」多付兩倍。Fable 5 的價值在於它能處理 Opus 4.8 處理不了、或處理得明顯不夠好的任務——例如複雜的多步驟推理、長時間自主 agent、或是需要頂級視覺理解的場景。Prompt caching 與 Batch API 在 Fable 5 上也同樣適用,實際帳單會比表面單價低不少。跨廠商的定價比較可以參考之前寫過的 Claude Opus 4.8 發表整理,這邊不再重複。

主要能力亮點

Anthropic 在公告裡請了 14 家合作夥伴提供早期使用回饋,加上內部實驗的數據,幾個比較值得展開講的方向整理如下。

軟體工程

Stripe 用 Fable 5 對一個 5,000 萬行的 Ruby codebase 做遷移,原本預估需要一整個團隊花兩個月以上,結果在一天之內完成。Stripe 的回饋是「compressed months of engineering into days」。

在 Cognition 的 FrontierCode 評測上,Fable 5 拿到前端模型(frontier model)中的最高分,而且是在 medium effort 設定下就做到。Anaconda 的回饋是 Fable 5 在每個 effort level 都勝過 Opus 4.8。Anthropic 內部測試也指出 Fable 5 比過去的 Claude 模型更節省 tokens——用更少的對話輪次就能完成同樣的工程任務。

視覺能力

Anthropic 用了一個很有趣的方式來展示 Fable 5 的視覺能力:讓它玩 Pokémon FireRed。過去的 Claude 模型要玩遊戲需要搭建複雜的輔助系統,但 Fable 5 只靠一個「極簡的、只看畫面的 harness」就能破關。

更實用的場景包括:從科學論文的圖表中精確提取數字、從截圖反向還原 web app 的原始碼。Replit 的回饋是 Fable 5 在 ViBench(視覺 benchmark)上拿到他們測過所有模型的最高分。對於需要處理大量圖表、報表截圖、或 UI 截圖的工作流,Fable 5 的視覺理解能力是目前最強的。

科學研究與藥物設計

這個部分的數據是從 Mythos 5(無安全分類器限制)的實驗來的,但因為底層模型相同,代表的是 Fable 5 潛在的能力上限。

蛋白質藥物設計方面,Anthropic 的內部專家團隊用 Mythos 5 做藥物設計,結果把部分流程加速了大約 10 倍。14 個蛋白質標靶中有 9 個成功產生有潛力的藥物候選分子。Anthropic 的評估是 Mythos 5 在配備適當工具的情況下,「matches or beats skilled human operators」——跟熟練的人類操作者一樣好或更好。

分子生物學假說方面更有意思:科學家在盲測中有大約 80% 的時間偏好 Mythos 5 產生的假說。其中一個關於大腸桿菌蛋白質的假說,後來被一個獨立研究團隊的論文證實——那個團隊完全不知道 Mythos 5 的存在,是自己獨立得出同樣結論的。

基因體學方面,Mythos 5 在超過一週的時間內進行了大量自主研究,涵蓋 138 個動物物種、數百萬個細胞的單細胞數據。它自行設計並訓練了一個機器學習模型,在性能上超越了一篇 Science 期刊論文發表的模型,而且參數規模小了 100 倍。

長 context 與記憶

Fable 5 在處理百萬等級 tokens 的長文本時比 Opus 4.8 更穩定。Anthropic 拿 Slay the Spire 遊戲做了一個記憶實驗:給模型一個可以持久化的檔案系統記憶,Fable 5 善用記憶之後的表現提升了 3 倍(相對於 Opus 4.8 的提升幅度),而且到達遊戲最終幕的次數多了 3 倍。

分析類工作方面,Databricks 回饋 Fable 5 是第一個在他們的核心分析 benchmark 上突破 90% 的模型,比 Opus 4.8 高出 10 個百分點。試算表任務的完成速度也比 Opus 4.8 快了 25–30%。

網路安全

Anthropic 直接宣稱 Mythos 5 擁有「the strongest cybersecurity capabilities of any model in the world」——任何模型中最強的網路安全能力。這包括發現與利用軟體漏洞、偵察、橫向移動等 agent 式的滲透測試技巧。

這也是為什麼 Mythos 5 的網路安全能力被限制在 Project Glasswing 框架內。Fable 5 一般使用者碰到攻擊性的網路安全請求時會被分類器攔下、fallback 到 Opus 4.8,避免這些能力被濫用。

安全分類器與 Fallback 機制

Fable 5 的安全機制跟過去所有 Claude 模型都不一樣。過去的做法是模型自己判斷要不要拒絕,Fable 5 改用外掛的 AI 分類器來偵測敏感請求,觸發時不是直接拒絕、而是把這次對話轉給 Opus 4.8 來回應。Anthropic 的說法是「a far better experience than an outright refusal」。

三個會觸發 fallback 的領域:

  • 網路安全:攻擊性的漏洞利用、滲透測試相關請求。外部測試發現 zero harmful single-turn requests 成功通過,不管有沒有使用 30 種不同的公開 jailbreak 技巧都擋住了
  • 生物與化學:大部分跟生物化學相關的請求都會 fallback。這是為了防止基因療法與病毒設計方面的雙重用途風險。Anthropic 未來計畫開放一個給生醫研究者的信任存取方案,保留網路安全分類器但放寬生物化學的限制
  • 蒸餾:擋住大規模擷取模型能力來訓練競爭模型的嘗試

Jailbreak 防禦方面,外部 bug bounty 在超過 1,000 小時的測試中沒有找到通用型 jailbreak。外部紅隊組織在長時間 agent 任務測試中也沒有成功。英國 AI 安全研究所(UK AISI)在短期初步測試中取得了一些進展,但尚未成功。Anthropic 引用一位外部合作夥伴的說法:Fable 5 的防護是他們測過所有模型中最強的。

另外,所有 Mythos 級模型的 API 流量都有 30 天的資料保留政策。Anthropic 不會拿這些資料來訓練新模型或做安全以外的用途,30 天後在絕大多數情況下會刪除。新的隱私措施包括記錄所有人類存取資料的行為。

誰可以用、怎麼用

Claude Fable 5

Fable 5 從 6 月 9 日起已全面上架,走 API 的模型 ID 是 claude-fable-5,各平台的 ID 整理如下:

  • Claude APIclaude-fable-5
  • Amazon Bedrockanthropic.claude-fable-5
  • Google Vertex AIclaude-fable-5
  • Microsoft Foundryclaude-fable-5

訂閱方案(Pro、Max、Team、Enterprise)的可用性有一個過渡期:

  • 6 月 9 日 ~ 6 月 22 日:訂閱方案內不需額外付費、消耗 credits
  • 6 月 23 日起:需要使用 usage credits(額度制)
  • 容量充足後:恢復為訂閱方案的標準功能

也就是說,現在到 6 月 22 日之間是體驗 Fable 5 的最佳時機——訂閱用戶可以直接用,不需要額外花錢。6 月 23 日之後會暫時轉為按量計費,等到 Anthropic 的算力供應穩定後才會重新納入訂閱方案。

Claude Code 更新重啟後即可看到 Fable 5

Claude Mythos 5

Mythos 5 不是一般開發者能用的模型。它透過 Project Glasswing 發佈,對象是美國政府的網路防禦單位、基礎設施供應商,以及後續計畫開放的信任存取方案參與者。原本使用 Mythos Preview 的用戶會自動升級到 Mythos 5。

對使用者的意義

Fable 5 的推出代表 Anthropic 在產品線策略上做了一個明確的分層:Opus 是工作馬、Fable 是天花板。Opus 4.8 繼續當日常旗艦處理大部分任務,Fable 5 則是需要最強能力時才出動的選項。這跟 OpenAI 的 GPT-5.5 標準版 vs Pro 版、Google 的 Gemini Flash vs Pro 的分層邏輯類似,只是 Anthropic 多了一層安全分類器的設計。

  • 一般開發者:對大多數 API 使用場景,Opus 4.8 的 $5/$25 仍然是更為划算的選擇。Fable 5 的 $10/$50 適合在 Opus 4.8 明顯不夠用的場合使用——例如極複雜的多步驟推理、需要頂級視覺理解的場景、或是長時間完全自主運作的 agent 任務
  • Claude Code 使用者:目前 Fable 5 已可透過 /model 指令切換使用。對於大型 codebase migration 或跨數百個檔案的重構工作,Fable 5 的工程能力與 token 效率提升會比較有感。日常 coding 繼續用 Opus 4.8 即可
  • 知識工作者:金融分析、法律文件審閱、研究報告撰寫這類需要頂級推理能力的工作,Fable 5 在多個第三方 benchmark 上都拿到最高分。6 月 22 日前可以先用訂閱方案免費試用看看效果
  • 生醫研究者:Fable 5 的生物化學分類器會攔下大部分相關請求。如果研究工作需要完整的生物化學能力,目前只能等 Anthropic 開放計畫中的生醫信任存取方案
  • 不確定該不該升級的使用者:先把目前用 Opus 4.8 跑不好的任務列出來——如果都跑得不錯、品質也夠用,繼續用 Opus 4.8 是合理的選擇。新模型不代表一定要切,特別是價格直接翻倍的情況下

參考資料


Sponsored Links

發佈留言