LLM 大語言模型再強大,也無法回答訓練資料以外的內容,像是公司內部文件、最新新聞、個人筆記等。RAG(Retrieval-Augmented Generation,檢索增強生成)讓 LLM 在回答之前先從外部資料庫撈出相關段落當作參考,補上模型缺少的知識。這篇文章介紹什麼是 RAG、能做什麼、運作原理(含 Embedding 與高維度向量空間)、什麼情境適合或不適合使用 RAG,以及目前常見的 RAG 框架、向量資料庫與整合平台。
RAG 入門教學|LLM 知識、Embedding 原理與常見問答
Claude Code透過 Codex CLI 生成圖片|免 API Key 使用 GPT-image-2
Claude Code 本身沒有生圖能力,遇到需要插畫類圖片時可以呼叫本機的 Codex CLI 來處理。一行 codex exec 加上一句描述,就能在 ~/.codex/generated_images/{session_id}/ 取得 PNG,適合做文章插圖、概念示意圖、ICON 等場景。本文整理在 Claude Code 工作流裡接 Codex 生圖的最短流程,包含指令、輸出位置、prompt 撰寫建議,以及與結構化圖解工具的選用判準。
Code with Claude 2026 開發者大會|Anthropic 押注工具產品化,Claude Code 全面升級
Anthropic 在 2026 年 5 月舉辦第二屆 Code with Claude 開發者大會,橫跨舊金山、倫敦、東京三城。主軸押在工具產品化,把 Claude 從聊天模型升級成 Coding Agent 平台:API 用量年增 17 倍、Claude Code 上限翻倍、Managed Agents 多代理編排、Outcomes 與 Dreaming,加上 Code Review、CI auto-fix、Remote Agents 等新功能。本文整理大會重點與對開發者的實際影響。
Claude Code 節省 Token 與快取指南|運作原理、ESC 影響與 statusline 監控
Claude Code 用久了會發現 token 燒得特別快,根本原因常常不是模型話多,而是 prompt cache 沒命中。本文整理 Claude Code 的快取運作原理、什麼動作會破壞快取(包含點兩下 ESC rewind 的實際影響)、實用的節省 token 技巧,並分享一份自製 statusline 設定,讓使用者隨時看到 cache hit rate、快取剩餘時間與 context 用量,搭配 refreshInterval 每 10 秒自動更新,把每一塊錢花在刀口上。
Claude Code Skills 入門|SKILL.md 機制、放置位置與實作範例
Claude Code 的 Skills 是一種輕量擴充機制,把要重複用的工作流寫在一個 SKILL.md 檔案,靠 frontmatter 的 description 讓 Claude 自動辨識何時呼叫。比塞進 CLAUDE.md 更省 context、比 MCP server 簡單得多。本文整理 SKILL.md 的格式、三種放置位置、自動與手動觸發方式,並用一個 git commit 助手做範例。
GPT Image 2 介紹|OpenAI 第一個會思考的生圖模型,文字渲染與多語支援大進化
OpenAI 在 2026-04-22 正式發表 GPT Image 2(ChatGPT Images 2.0),是 DALL-E 3 與 GPT Image 1.5 的繼任者。最大特點是把 o 系列的「思考」帶進生圖流程,先計畫再下筆,加上原生 2K 解析度、網路搜尋整合、與多語言文字渲染(中日韓、Hindi、Bengali 等都能寫對)。本文整理發表脈絡、跟前代差在哪、API 模型名稱與價格、ChatGPT 端可用方案,並附上幾組可以直接複製使用的提示詞範例。
使用 Google AI Studio 免費跑 Gemma 4|免信用卡 26B/31B LLM 教學
Google 在 2026 年 4 月推出的 Gemma 4 開放權重模型,26B 與 31B 兩個版本可以透過 Google AI Studio 免費呼叫,不用綁信用卡就能用 API 跑。這篇文章實測兩個模型的速度與品質差異,整理 RTX 與 Mac 本地部署需要的 VRAM 與大致價格,示範 Python 呼叫的完整程式碼與實際輸出,並且說明怎麼把 Gemma 4 接到 OpenClaw、opencode、Claude Code 等 Agent CLI。適合想用開放權重模型但不想自己買高階顯卡的開發者參考。
Claude Code 降智/變笨事件|Anthropic 公布三個 Bug 的 post-mortem 與額度重置
2026-04-23 Anthropic 公開 Claude Code 品質下降的 post-mortem,承認過去兩個月使用者抱怨變笨、額度消耗飆升的真正原因是三個獨立 bug:reasoning effort 被降級、caching 優化錯誤把 thinking 清掉、verbosity 系統提示詞讓 coding 評測分數掉 3%。公司同日把所有訂閱者的使用額度重置、Opus 4.7 預設拉回 xhigh reasoning。這篇整理三個 bug 來龍去脈、Anthropic 為什麼這次願意承認、以及使用者實際拿到什麼補償。
OpenAI GPT-5.5 發表|Benchmark 提升、三種入口與 API 價格解析
OpenAI 在 2026-04-23 發表 GPT-5.5,距前代 GPT-5.4 只有六週,代號 Spud。這代主打 agentic coding、computer use 與長上下文理解,Terminal-Bench 2.0 達 82.7%、MRCR v2 長上下文從 36.6% 跳到 74.0%。本文整理發表脈絡、NVIDIA 硬體合作、各項 benchmark 提升幅度、ChatGPT/Codex/API 三種入口差異,以及 API 翻倍定價對開發者的影響,並對比 Opus 4.7 隱性 tokenizer 漲價事件。
Claude Design 介紹|自然語言生成 pitch deck 與 mockup 的 Anthropic 新品
Anthropic 在 2026 年 4 月 17 日推出 Claude Design,由 Claude Opus 4.7 驅動的實驗性產品,用自然語言就能產出 prototype、slides、pitch deck、mockup 等交付檔案,支援匯出 Canva、PDF、PPTX 與 standalone HTML。這篇整理核心功能、訂閱方案、與 Figma、Canva、Google Stitch 等工具的定位差別,以及實際使用時的限制與不適合導入的情境。