Anthropic 在 2026 年 6 月 30 日推出 Claude Sonnet 5,接替 Sonnet 4.6 成為 Claude 產品線的中階模型。官方定位是「性能接近 Opus 4.8,但價格維持在 Sonnet 級距」,並且在 8 月 31 日前提供 $2/$10 的優惠價(正式價 $3/$15),比 Sonnet 4.6 的 $3/$15 還便宜。

Sonnet 5 已經成為 claude.ai Free 與 Pro 方案的預設模型,Max、Team、Enterprise 也同步可用。對 API 開發者來說,模型 ID 是 claude-sonnet-5,Amazon Bedrock、Google Vertex AI 也在同一天上架。

這篇整理 Sonnet 5 跟 Sonnet 4.6 的差異、與 Opus 4.8 和其他模型的定價與 benchmark 對照、安全性改進,以及各平台的使用方式。

快速比較

與 Sonnet 4.6 的差異

項目Sonnet 4.6Sonnet 5
模型 IDclaude-sonnet-4-6claude-sonnet-5
Input 價格$3 / 1M tokens$3(優惠期 $2)
Output 價格$15 / 1M tokens$15(優惠期 $10)
Context window1M tokens1M tokens
Max output(同步 API)128K tokens128K tokens
Max output(Batch API beta)300K tokens300K tokens
Adaptive thinking
Extended thinking
Effort 預設值API 與 Claude Code 預設 high
Tokenizer舊版新版(同 Opus 4.7 起)
知識截止2026-012026-01
延遲FastFast

比較明顯的變化:Context window 從 Sonnet 4.5 時代的 200K 一路升到 4.6 的 1M,Sonnet 5 維持 1M 不變。Max output 從 Sonnet 4.5 的 64K 升到 128K,追平了 Opus 4.8。Tokenizer 換成新版(同 Opus 4.7 起),token 數會增加約 30%,詳見下方 Tokenizer 章節。

Extended thinking 在 Sonnet 5 上已經移除,改為 Adaptive thinking(跟 Opus 4.7、4.8 一樣)。如果既有的工作流有依賴 Sonnet 4.6 的 extended thinking 行為,升級前要確認一下。

Claude 完整產品線價格對照

把目前在線的所有 Claude 模型放在一起,比較容易看出 Sonnet 5 的定位。單價都是每 1M tokens 美元:

模型InputOutputContextMax output定位
Fable 5$10$501M128K頂級旗艦,極限推理與長任務 agent
Opus 4.8(Fast Mode)$10$501M128KOpus 2.5× 速度,延遲敏感場景
Opus 4.8$5$251M128K複雜推理與長任務 agent
Sonnet 5(正式價)$3$151M128K速度與智能平衡,日常 agent 任務
Sonnet 5(優惠價至 8/31)$2$101M128K同上,限時優惠
Haiku 4.5$1$5200K64K最快、成本敏感場景

Sonnet 5 正式價跟 Sonnet 4.6 完全一樣($3/$15),等於免費升級。8 月底前的優惠價 $2/$10 則比 Sonnet 4.6 便宜了 33%,對想趁便宜大量跑 agent 任務的開發者來說是個不錯的時間窗口。

跟 Opus 4.8 比,Sonnet 5 的 input 便宜 40%($3 vs $5)、output 便宜 40%($15 vs $25)。如果任務不需要 Opus 級的深度推理,Sonnet 5 能省下可觀的費用,尤其是大量跑 agent 時。

與 OpenAI、Google 對照

模型InputOutputContext長 context 加價
Claude Sonnet 5(優惠價)$2$101M無,全段同費率
Claude Sonnet 5(正式價)$3$151M無,全段同費率
Claude Opus 4.8$5$251M無,全段同費率
OpenAI GPT-5.5$5$301M> 272K 全段 2× input / 1.5× output
Google Gemini 3.1 Pro$2$121M> 200K 改 $4 / $18

Sonnet 5 優惠價($2/$10)與 Gemini 3.1 Pro 的基礎價幾乎打平,而且 Anthropic 全段同費率沒有長 context 跳階。正式價 $3/$15 則比 GPT-5.5 的 $5/$30 便宜不少。如果 Sonnet 5 的能力夠用,在成本上已經沒有太多理由去選 GPT-5.5 了,除非工作流綁定 OpenAI 生態系。長 context 的計費差異在之前的 Opus 4.8 整理 裡有圖解比較。

核心改進:Agent 能力大幅提升

Anthropic 在公告中把 Sonnet 5 定位為「the most agentic Sonnet model yet」。核心訴求是:幾個月前需要 Opus 等級才跑得起來的 agent 任務,Sonnet 5 也能處理了。

具體改進包括:

  • 自主規劃與工具使用:能自己擬定計畫、操作瀏覽器和終端機,並且自主執行多步驟任務到完成。過去 Sonnet 4.6 常在複雜任務中途「做到一半就停下來」的狀況,Sonnet 5 明顯改善
  • 自我檢查:不需要額外提示就會主動檢查自己的產出,這點跟 Opus 4.8 強調的「誠實度」改進方向一致
  • coding 與推理能力:在程式碼生成、工具呼叫、知識工作等項目上都比 Sonnet 4.6 有明顯進步,部分項目已經接近 Opus 4.8 的水準

Zapier 的 Daniel Shepard 在 Anthropic 公告中的回饋是:「That used to stall halfway. For day-to-day automation, it’s a no-brainer.」——過去跑到一半會卡住的自動化任務,現在能完整跑完了。

Benchmark 表現

把 Sonnet 5 跟前一代 Sonnet 4.6、旗艦 Opus 4.8 的官方 benchmark 放在一起看。SWE-bench Pro 是 agentic coding、HLE 是跨學科推理、OSWorld-Verified 是電腦桌面操作。百分比越高越好:

Sonnet 5 Benchmark 對照長條圖:SWE-bench Pro 63.2% 介於兩者之間、HLE 含工具 57.4% 接近 Opus 4.8 的 57.9%、OSWorld-Verified 88.3% 超過 Opus 4.8 的 83.4%
Sonnet 5(藍色)多數項目介於 Sonnet 4.6 和 Opus 4.8 之間,但 OSWorld-Verified 已超過 Opus 4.8。
BenchmarkSonnet 5Sonnet 4.6Opus 4.8評測說明
Agentic coding(SWE-bench Pro)63.2%58.1%69.2%解真實 GitHub 專案任務,改完要通過測試
HLE(無工具)43.2%34.6%49.8%跨學科高難度學術題,純推理
HLE(含工具)57.4%46.8%57.9%同上,但可用搜尋與程式執行
OSWorld-Verified88.3%78.5%83.4%操作真實電腦桌面完成任務

Sonnet 5 在多數項目上介於 Sonnet 4.6 和 Opus 4.8 之間,但 OSWorld-Verified 的 88.3% 直接超過了 Opus 4.8 的 83.4%,代表 Sonnet 5 在電腦桌面操作這個維度上已經領先旗艦。SWE-bench Pro 從 Sonnet 4.6 的 58.1% 拉到 63.2%,進步了 5 個百分點,但離 Opus 4.8 的 69.2% 還有一段距離。

HLE 含工具的 57.4% 跟 Opus 4.8 的 57.9% 幾乎打平(差距不到 1 個百分點),代表 Sonnet 5 的跨學科推理能力已經逼近旗艦水準。不過 HLE 無工具的差距還有 6.6 個百分點(43.2% vs 49.8%),對純推理場景 Opus 4.8 仍有優勢。

換個角度看:Sonnet 5 的 SWE-bench Pro 63.2% 已經接近 Opus 4.7 時代的 64.3%,等於開發者用 Sonnet 的價格就能拿到接近一兩個月前 Opus 等級的 coding 能力。這對預算有限但需要跑 agent 的團隊來說是好消息。

安全性改進

Anthropic 在安全性上做了幾個明確的改善:

  • 幻覺與附和率降低:比 Sonnet 4.6 更少捏造事實,也更少無條件同意使用者的說法
  • 惡意請求拒絕:對明顯有害的指令拒絕率提升
  • Prompt injection 防禦:在 agent 場景中對 prompt 注入攻擊的抵抗力更強,這對把模型接進自動化工作流的開發者來說很重要
  • 網路安全限制:Sonnet 5 在漏洞利用測試中的成功率為 0%(Firefox 漏洞測試),代表它在危險的網路攻擊能力上被刻意限制,比 Opus 4.8 的限制更嚴格

Lovable 的 Fabian Hedin 在公告中的評語是:「A model that knows when to say no is just as important as one that knows how to build.」——對產品導向的團隊來說,模型會拒絕危險操作跟模型會寫 code 一樣重要。

優惠價格的時間窗口

Sonnet 5 的定價有兩個階段:

時期InputOutput與 Sonnet 4.6 比較
2026/06/30 – 2026/08/31(優惠價)$2 / 1M tokens$10 / 1M tokens便宜 33%
2026/09/01 起(正式價)$3 / 1M tokens$15 / 1M tokens相同

Prompt caching 命中省 90%、Batch API 非即時省 50% 在 Sonnet 5 上繼續支援。優惠價期間疊 cache 的實際成本會非常低——input $2 打一折只要 $0.2/1M tokens,對需要大量反覆讀取 system prompt 或長文件的工作流來說,成本可以壓得很低。Prompt caching 的運作方式可以參考之前寫的 Token 省錢與 Cache 指南

Tokenizer 變更的影響

Sonnet 5 使用的是 Opus 4.7 開始導入的新版 tokenizer,同一段文字大約會產出比舊版多 30% 的 tokens。這意味著從 Sonnet 4.6 切換過來時,即使 prompt 內容完全沒變,token 數也會增加。

在正式價 $3/$15 下,多出的 30% tokens 會讓實際帳單比 Sonnet 4.6 貴一些。但在優惠價 $2/$10 期間,即使 token 數多 30%,$2 × 1.3 = $2.6 仍低於 Sonnet 4.6 的 $3。所以優惠期間不管怎麼算都是划算的。

9 月之後就要看使用場景了。如果 prompt 以英文為主,tokenizer 的影響大約在 15–25% 之間;中文或多語言混合的情境可能接近或超過 30%。估算成本時建議先用 Anthropic 的 pricing 頁面 實際跑一次 token 計數。

各平台使用方式

claude.ai 與手機 App

Sonnet 5 已經是 Free 和 Pro 方案的預設模型,打開 claude.ai 或手機 App 就會直接用到,不需要手動切換。模型選單裡也可以看到 Sonnet 5 的選項。

Claude iOS App 模型選單,Sonnet 5 標示為 Most efficient for everyday tasks,Fable 5 顯示 Currently unavailable
Sonnet 5 已成為 Claude iOS App 的預設模型。

Claude Code

Claude Code 更新到最新版本後即可使用 Sonnet 5:

# 更新 Claude Code
claude update

# 確認版本
claude --version

# 切換模型(如果不是預設)
# 在 Claude Code 裡輸入
/model claude-sonnet-5

Sonnet 5 在 Claude Code 裡的 effort 預設值是 high,跟 Opus 4.8 一樣。如果需要調整,用 /effort 指令即可。想了解 Claude Code 更多用法,可以參考之前寫的 Claude Code 入門使用教學Claude Code 切換模型指南

API 與雲端平台

  • Claude APImodel 欄位設成 claude-sonnet-5。Effort 預設 high
  • Amazon Bedrock:透過 Claude in Amazon Bedrock 使用 anthropic.claude-sonnet-5
  • Google Vertex AI:model ID 為 claude-sonnet-5

Sonnet 4.6 目前仍可使用 claude-sonnet-4-6,沒有立刻下架。但如果沒有特殊理由繼續用 Sonnet 4.6,切到 Sonnet 5 在能力和成本上都是嚴格升級——特別是優惠價期間。

該選 Sonnet 5 還是 Opus 4.8

Sonnet 5 的出現讓 Claude 產品線的選擇變得更微妙。簡單的判斷方式:

  • 大量跑 agent、對成本敏感:Sonnet 5 是更合理的選擇,特別是 8 月底前的優惠價期間。日常自動化、CI 內的 code review、客服機器人這類場景,Sonnet 5 的能力夠用,省下來的錢可以跑更多次
  • 複雜推理、長時間 agent、codebase 級遷移:Opus 4.8 仍是更穩的選擇。HLE 含工具的差距(46.8% vs 57.9%)代表 Opus 4.8 在最難的推理任務上仍有明確優勢,加上 Dynamic Workflows 能平行跑數百個 subagent,大型遷移任務目前還是適合 Opus
  • 需要頂級能力且預算不是問題:Fable 5($10/$50)在 benchmark 上進一步領先 Opus 4.8,在 benchmark 上進一步領先 Opus 4.8,適合對品質有極高要求的場景
  • 速度優先、token 用量極大:Haiku 4.5($1/$5)仍是成本控制的終極選項,但 context 只有 200K、max output 只有 64K

一個實用的策略是把 Sonnet 5 當作預設、需要深度推理時再切 Opus 4.8。Claude Code 裡可以用 /model 隨時切換,API 端也可以根據任務複雜度動態選模型。以前 Sonnet 和 Opus 之間的能力鴻溝比較大,很多任務只有 Opus 跑得起來;現在 Sonnet 5 把這個差距縮小了,更多任務可以用比較便宜的模型完成。

參考資料


Sponsored Links

發佈留言