RAG 入門教學|LLM 知識、Embedding 原理與常見問答

LLM 大語言模型再強大,也無法回答訓練資料以外的內容,像是公司內部文件、最新新聞、個人筆記等。RAG(Retrieval-Augmented Generation,檢索增強生成)讓 LLM 在回答之前先從外部資料庫撈出相關段落當作參考,補上模型缺少的知識。這篇文章介紹什麼是 RAG、能做什麼、運作原理(含 Embedding 與高維度向量空間)、什麼情境適合或不適合使用 RAG,以及目前常見的 RAG 框架、向量資料庫與整合平台。

Claude Code透過 Codex CLI 生成圖片|免 API Key 使用 GPT-image-2

Claude Code 本身沒有生圖能力,遇到需要插畫類圖片時可以呼叫本機的 Codex CLI 來處理。一行 codex exec 加上一句描述,就能在 ~/.codex/generated_images/{session_id}/ 取得 PNG,適合做文章插圖、概念示意圖、ICON 等場景。本文整理在 Claude Code 工作流裡接 Codex 生圖的最短流程,包含指令、輸出位置、prompt 撰寫建議,以及與結構化圖解工具的選用判準。

Code with Claude 2026 開發者大會|Anthropic 押注工具產品化,Claude Code 全面升級

Anthropic 在 2026 年 5 月舉辦第二屆 Code with Claude 開發者大會,橫跨舊金山、倫敦、東京三城。主軸押在工具產品化,把 Claude 從聊天模型升級成 Coding Agent 平台:API 用量年增 17 倍、Claude Code 上限翻倍、Managed Agents 多代理編排、Outcomes 與 Dreaming,加上 Code Review、CI auto-fix、Remote Agents 等新功能。本文整理大會重點與對開發者的實際影響。

Claude Code 節省 Token 與快取指南|運作原理、ESC 影響與 statusline 監控

Claude Code 用久了會發現 token 燒得特別快,根本原因常常不是模型話多,而是 prompt cache 沒命中。本文整理 Claude Code 的快取運作原理、什麼動作會破壞快取(包含點兩下 ESC rewind 的實際影響)、實用的節省 token 技巧,並分享一份自製 statusline 設定,讓使用者隨時看到 cache hit rate、快取剩餘時間與 context 用量,搭配 refreshInterval 每 10 秒自動更新,把每一塊錢花在刀口上。

Markdown 教學完整指南|原生語法與 GitHub Flavored Markdown

Markdown 是現在最常見的輕量文件格式,從 GitHub README、技術部落格到 Notion、Slack 都看得到它的身影。這篇文章整理 Markdown 的來歷與設計哲學,分清楚哪些語法是 2004 年 John Gruber 提出的原生 Markdown 與後來的 CommonMark 規範,哪些是 GitHub 額外擴充出來的 GFM(GitHub Flavored Markdown),包含表格、任務清單、刪除線、Alerts、Mermaid 圖表等,並附上實際範例與相容性注意事項。

macOS 停止支援 x86|Intel Mac、Apple Silicon、Rosetta 2 完整退場時間表

Apple 已在 WWDC 2025 宣布 macOS 26 Tahoe 是最後一版支援 Intel Mac 的系統,2026 年秋季的 macOS 27 起 Apple Silicon 限定,Rosetta 2 也會在 2027 年的 macOS 28 大幅縮減為僅支援少數舊遊戲。本文整理 Intel Mac、Apple Silicon、Rosetta 2 三者的關係與退場時間表,說明 Intel Mac 用戶該擔心什麼、Apple Silicon 用戶其實不用太恐慌,以及過渡期該做哪些準備來避免 app 突然壞掉。

Claude Code Skills 入門|SKILL.md 機制、放置位置與實作範例

Claude Code 的 Skills 是一種輕量擴充機制,把要重複用的工作流寫在一個 SKILL.md 檔案,靠 frontmatter 的 description 讓 Claude 自動辨識何時呼叫。比塞進 CLAUDE.md 更省 context、比 MCP server 簡單得多。本文整理 SKILL.md 的格式、三種放置位置、自動與手動觸發方式,並用一個 git commit 助手做範例。

GPT Image 2 介紹|OpenAI 第一個會思考的生圖模型,文字渲染與多語支援大進化

OpenAI 在 2026-04-22 正式發表 GPT Image 2(ChatGPT Images 2.0),是 DALL-E 3 與 GPT Image 1.5 的繼任者。最大特點是把 o 系列的「思考」帶進生圖流程,先計畫再下筆,加上原生 2K 解析度、網路搜尋整合、與多語言文字渲染(中日韓、Hindi、Bengali 等都能寫對)。本文整理發表脈絡、跟前代差在哪、API 模型名稱與價格、ChatGPT 端可用方案,並附上幾組可以直接複製使用的提示詞範例。

Claude Code 降智/變笨事件|Anthropic 公布三個 Bug 的 post-mortem 與額度重置

2026-04-23 Anthropic 公開 Claude Code 品質下降的 post-mortem,承認過去兩個月使用者抱怨變笨、額度消耗飆升的真正原因是三個獨立 bug:reasoning effort 被降級、caching 優化錯誤把 thinking 清掉、verbosity 系統提示詞讓 coding 評測分數掉 3%。公司同日把所有訂閱者的使用額度重置、Opus 4.7 預設拉回 xhigh reasoning。這篇整理三個 bug 來龍去脈、Anthropic 為什麼這次願意承認、以及使用者實際拿到什麼補償。

使用 Google AI Studio 免費跑 Gemma 4|免信用卡 26B/31B LLM 教學

Google 在 2026 年 4 月推出的 Gemma 4 開放權重模型,26B 與 31B 兩個版本可以透過 Google AI Studio 免費呼叫,不用綁信用卡就能用 API 跑。這篇文章實測兩個模型的速度與品質差異,整理 RTX 與 Mac 本地部署需要的 VRAM 與大致價格,示範 Python 呼叫的完整程式碼與實際輸出,並且說明怎麼把 Gemma 4 接到 OpenClaw、opencode、Claude Code 等 Agent CLI。適合想用開放權重模型但不想自己買高階顯卡的開發者參考。