LLM 彙整 - KodeLab

AI應用

Anthropic 與 Claude 模型入門指南｜公司歷程、模型等級與版本演進時間線

Anthropic 是 2021 年從 OpenAI 獨立出來的 AI 安全公司，核心團隊包含 GPT-3 第一作者與 Scaling Laws 論文作者。這篇整理 Anthropic 的成立背景與 Constitutional AI 研發方法，以及 Claude 模型從 1.0 到 Fable 5 的版本演進、Haiku／Sonnet／Opus 的等級制度與各版本定價，給想了解這家公司與產品線全貌的開發者一份快速參考。

2026 年 6 月 20 日2026 年 6 月 20 日

AI應用

Claude Fable 5 下架！首個上線三天後遭美國政府禁用的大語言模型

Anthropic 旗艦模型 Claude Fable 5 與 Claude Mythos 5 在 2026 年 6 月 9 日推出，上線僅三天就因美國商務部的出口管制指令在 6 月 12 日全面停用。本文整理事件時間線、兩款模型的定位與定價、下架的導火線、Anthropic 為何選擇全面關閉與它的回應立場，並說明對使用者與 AI 產業的影響——Opus 4.8、Sonnet、Haiku 等其他模型不受影響，仍可正常使用。

2026 年 6 月 13 日2026 年 6 月 15 日

RAG 入門教學｜LLM 知識、Embedding 原理與常見問答

LLM 大語言模型再強大，也無法回答訓練資料以外的內容，像是公司內部文件、最新新聞、個人筆記等。RAG（Retrieval-Augmented Generation，檢索增強生成）讓 LLM 在回答之前先從外部資料庫撈出相關段落當作參考，補上模型缺少的知識。這篇文章介紹什麼是 RAG、能做什麼、運作原理（含 Embedding 與高維度向量空間）、什麼情境適合或不適合使用 RAG，以及目前常見的 RAG 框架、向量資料庫與整合平台。

2026 年 5 月 13 日2026 年 5 月 15 日

使用 Google AI Studio 免費跑 Gemma 4｜免信用卡 26B／31B LLM 教學

Google 在 2026 年 4 月推出的 Gemma 4 開放權重模型，26B 與 31B 兩個版本可以透過 Google AI Studio 免費呼叫，不用綁信用卡就能用 API 跑。這篇文章實測兩個模型的速度與品質差異，整理 RTX 與 Mac 本地部署需要的 VRAM 與大致價格，示範 Python 呼叫的完整程式碼與實際輸出，並且說明怎麼把 Gemma 4 接到 OpenClaw、opencode、Claude Code 等 Agent CLI。適合想用開放權重模型但不想自己買高階顯卡的開發者參考。

2026 年 4 月 25 日2026 年 5 月 1 日

OpenAI GPT-5.5 發表｜Benchmark 提升、三種入口與 API 價格解析

OpenAI 在 2026-04-23 發表 GPT-5.5，距前代 GPT-5.4 只有六週，代號 Spud。這代主打 agentic coding、computer use 與長上下文理解，Terminal-Bench 2.0 達 82.7%、MRCR v2 長上下文從 36.6% 跳到 74.0%。本文整理發表脈絡、NVIDIA 硬體合作、各項 benchmark 提升幅度、ChatGPT／Codex／API 三種入口差異，以及 API 翻倍定價對開發者的影響，並對比 Opus 4.7 隱性 tokenizer 漲價事件。

2026 年 4 月 24 日2026 年 4 月 24 日

AI應用

Harness Engineering｜AI Agent 從提示詞工程、上下文工程演進的新顯學

Harness Engineering（駕馭工程）是 AI Agent 開發的最新顯學，承接了 Prompt Engineering（提示詞工程）與 Context Engineering（上下文工程）兩個世代留下的成果。這篇用三個時期的脈絡，講清楚 Harness Engineering 為什麼出現、解決哪些 Prompt 跟 Context 處理不了的問題，並說明舊名詞淡出不是退流行，而是成熟地融入產品，過去學的知識從來不會浪費。

2026 年 4 月 13 日2026 年 4 月 13 日

應用教學

MarkItDown 教學｜微軟開源文件轉 Markdown 工具，LLM 與 RAG 必備

MarkItDown 是微軟開源的 Python 工具，能將 PDF、Word、Excel、PowerPoint、圖片、音訊、HTML 等超過 29 種格式轉換成 Markdown。對於需要建立 RAG 知識庫、餵資料給 LLM 分析、或是批次處理大量文件的開發者來說，MarkItDown 提供了簡單的 CLI 與 Python API，幾行程式碼就能完成轉換，還支援 OCR 與語音轉文字等進階功能。

2026 年 4 月 12 日2026 年 4 月 17 日

Ollama 入門教學｜本地大語言模型新手指南（Windows／Linux／macOS）

近年 AI 大語言模型（LLM）百花齊放，大多數人接觸到的方式仍是透過雲端 API，例如 ChatGP、Gemini、 Claude、Grok、Deepseek等，雖然方便，但可能會受限於費用、額度、網路延遲，資料隱私等問題，希望可以在自己的電腦上執行。Ollama 讓我們能在自己的電腦上直接執行 LLM，不需要依賴雲端輕鬆體驗離線大模型，之後還能結合 AI Agent、MCP 或是 AnythingLLM 整合介面。這篇文章會教學在 Windows / Linux / macOS 安裝 Ollama、下載模型，選適合自己電腦的模型大小。

2025 年 9 月 12 日2026 年 6 月 6 日