Anthropic 在 2026 年 4 月 17 日推出 Claude Design,由 Claude Opus 4.7 驅動的實驗性產品,用自然語言就能產出 prototype、slides、pitch deck、mockup 等交付檔案,支援匯出 Canva、PDF、PPTX 與 standalone HTML。這篇整理核心功能、訂閱方案、與 Figma、Canva、Google Stitch 等工具的定位差別,以及實際使用時的限制與不適合導入的情境。
Claude Design 介紹|自然語言生成 pitch deck 與 mockup 的 Anthropic 新品
Claude Opus 4.7 全面解析|程式能力、價格、上下文升級重點,與 Mythos 背後故事
Anthropic 在 2026 年 4 月 16 日推出 Claude Opus 4.7,作為新一代旗艦模型。這篇文章整理 Opus 4.7 的程式與視覺能力升級(CursorBench 從 58% 跳到 70%、Rakuten-SWE-Bench 解題量為 4.6 的 3 倍)、與 Opus 4.6 的價格、上下文、新功能對照,以及 Anthropic 罕見公開承認的「故意降能」設計——Opus 4.7 是同期 Mythos Preview 模型刻意抑制資安攻擊能力後的釋出版本,背後的考量值得一起了解。
Claude Code /passes 指令|贈送 Claude Pro 7 天試用券與回饋機制
Claude Code 在 2025 年 12 月加入了 /passes 指令,讓 Claude Pro Max 訂閱者可以送出 3 張 7 天免費試用券給朋友,受邀者完成付費轉換後,贈送者每張還能獲得 $10 Claude 額度回饋加上額外使用量。這篇文章整理 /passes 的使用方式、贈送者與受邀者各自需要注意的條件、跟 claude.ai 禮物訂閱的差異,以及幾個官方目前沒有完整公開的細節。
Harness Engineering|AI Agent 從提示詞工程、上下文工程演進的新顯學
Harness Engineering(駕馭工程)是 AI Agent 開發的最新顯學,承接了 Prompt Engineering(提示詞工程)與 Context Engineering(上下文工程)兩個世代留下的成果。這篇用三個時期的脈絡,講清楚 Harness Engineering 為什麼出現、解決哪些 Prompt 跟 Context 處理不了的問題,並說明舊名詞淡出不是退流行,而是成熟地融入產品,過去學的知識從來不會浪費。
Anthropic 免費送禮!Claude 額外用量額度教學|Pro、Max、Team 方案免費 Credit 一次搞懂
Anthropic 在 2026 年 4 月針對 Claude 付費方案推出限時 Extra Usage Credit 額外用量額度促銷,Pro 方案可領 20 美元、Max 5x 領 100 美元、Max 20x 與 Team 最高可領 200 美元免費額度。這篇文章整理各方案額度金額對照、領取資格條件、啟用 Extra Usage 與 Claim 操作步驟,以及 90 天到期等注意事項,幫助 Claude 使用者在 4 月 17 日截止前順利領取,額度可用於 Claude、Claude Code 等所有產品。
MarkItDown 教學|微軟開源文件轉 Markdown 工具,LLM 與 RAG 必備
MarkItDown 是微軟開源的 Python 工具,能將 PDF、Word、Excel、PowerPoint、圖片、音訊、HTML 等超過 29 種格式轉換成 Markdown。對於需要建立 RAG 知識庫、餵資料給 LLM 分析、或是批次處理大量文件的開發者來說,MarkItDown 提供了簡單的 CLI 與 Python API,幾行程式碼就能完成轉換,還支援 OCR 與語音轉文字等進階功能。
MacBook Pro M2 Pro 跑 Gemma 4 實測|Apple Silicon 本地 LLM
在 MacBook Pro M2 Pro 16GB 上用 Ollama 跑 Gemma 4 到底有多快?跟 RTX 3070 8GB 相比誰贏?這篇把 Apple Silicon 統一記憶體架構放進本地 LLM 的實戰對比,從 TPS、TTFT、長 prompt 塞滿 128K context 一路測到 Ollama 對 e2b 偷偷開 thinking 的 bug 跨平台重現,並給出 num_ctx 跟真實 prompt 長度兩個容易被混淆的觀念說明,幫筆電族開發者找到本地 LLM 的實用上限。
Gemma 4 E2B vs E4B 完整實測|Thinking 模式的祕密與本地小模型最佳實踐
Gemma 4 的 E2B 和 E4B 兩個邊緣模型誰比較強?參數較小的 E2B 反而比 E4B 慢 10 倍是怎麼回事?這篇用 RTX 3070 跑了完整的 TPS、TTFT、品質對比 benchmark,並追到 Ollama renderer 層級找出 thinking 模式預設啟動的真相,順便整理本地小模型最佳實踐與 thinking、temperature、top_k、top_p 等參數說明。
本地跑 Claude Code 實戰|Ollama + Gemma 4 + RTX 3070 使用心得與踩坑筆記
想用本地 LLM 跑 Claude Code 省下雲端 API 費用?這篇分享在 Windows 11 + RTX 3070 8GB VRAM 上用 Ollama 接 Gemma 4 跑 Claude Code 的真實心得,包含安裝流程、Context length 設定、中文輸入只回英文的怪事、settings.json 被覆蓋的踩坑經驗,以及本地小模型真正適合做什麼自動化任務。
Google Gemma 4|多模態開源模型大更新,手機 1.5GB 就能跑、電腦端效能翻倍再翻倍
Google DeepMind 發佈 Gemma 4 開源模型家族,採用 Apache 2.0 授權,提供 31B Dense、26B MoE、E4B、E2B 四種尺寸。31B 在 Arena AI 排名開源模型第三,26B MoE 只用 3.8B 參數就達到接近表現。支援圖片、影片、語音多模態輸入,原生 function calling 與 agent 工作流,E2B 僅需 1.5GB 記憶體就能在手機和 Raspberry Pi 上跑。