LLM 大語言模型再強大,也無法回答訓練資料以外的內容,像是公司內部文件、最新新聞、個人筆記等。RAG(Retrieval-Augmented Generation,檢索增強生成)讓 LLM 在回答之前先從外部資料庫撈出相關段落當作參考,補上模型缺少的知識。這篇文章介紹什麼是 RAG、能做什麼、運作原理(含 Embedding 與高維度向量空間)、什麼情境適合或不適合使用 RAG,以及目前常見的 RAG 框架、向量資料庫與整合平台。
RAG 入門教學|LLM 知識、Embedding 原理與常見問答
Claude Code 透過 Codex CLI 生成圖片|免 API Key 預設 GPT-image-2
Claude Code 本身沒有生圖能力,遇到需要插畫類圖片時可以呼叫本機的 Codex CLI 來處理。一行 codex exec 加上一句描述,就能在 ~/.codex/generated_images/{session_id}/ 取得 PNG,適合做文章插圖、概念示意圖、ICON 等場景。本文整理在 Claude Code 工作流裡接 Codex 生圖的最短流程,包含指令、輸出位置、prompt 撰寫建議,以及與結構化圖解工具的選用判準。
Code with Claude 2026 開發者大會|Anthropic 押注工具產品化,Claude Code 全面升級
Anthropic 在 2026 年 5 月舉辦第二屆 Code with Claude 開發者大會,橫跨舊金山、倫敦、東京三城。主軸押在工具產品化,把 Claude 從聊天模型升級成 Coding Agent 平台:API 用量年增 17 倍、Claude Code 上限翻倍、Managed Agents 多代理編排、Outcomes 與 Dreaming,加上 Code Review、CI auto-fix、Remote Agents 等新功能。本文整理大會重點與對開發者的實際影響。
Claude Code 節省 Token 與快取指南|運作原理、ESC 影響與 statusline 監控
Claude Code 用久了會發現 token 燒得特別快,根本原因常常不是模型話多,而是 prompt cache 沒命中。本文整理 Claude Code 的快取運作原理、什麼動作會破壞快取(包含點兩下 ESC rewind 的實際影響)、實用的節省 token 技巧,並分享一份自製 statusline 設定,讓使用者隨時看到 cache hit rate、快取剩餘時間與 context 用量,搭配 refreshInterval 每 10 秒自動更新,把每一塊錢花在刀口上。