Google AI Studio 免費跑 Gemma 4 教學|實測 26B/31B 大語言模型

Google 在 2026 年 4 月推出的 Gemma 4 開放權重模型,26B 與 31B 兩個版本可以透過 Google AI Studio 免費呼叫,不用綁信用卡就能用 API 跑。這篇文章實測兩個模型的速度與品質差異,整理 RTX 與 Mac 本地部署需要的 VRAM 與大致價格,示範 Python 呼叫的完整程式碼與實際輸出,並且說明怎麼把 Gemma 4 接到 OpenClaw、opencode、Claude Code 等 Agent CLI。適合想用開放權重模型但不想自己買高階顯卡的開發者參考。

OpenAI GPT-5.5 發表|Benchmark 提升、三種入口與 API 價格解析

OpenAI 在 2026-04-23 發表 GPT-5.5,距前代 GPT-5.4 只有六週,代號 Spud。這代主打 agentic coding、computer use 與長上下文理解,Terminal-Bench 2.0 達 82.7%、MRCR v2 長上下文從 36.6% 跳到 74.0%。本文整理發表脈絡、NVIDIA 硬體合作、各項 benchmark 提升幅度、ChatGPT/Codex/API 三種入口差異,以及 API 翻倍定價對開發者的影響,並對比 Opus 4.7 隱性 tokenizer 漲價事件。

Harness Engineering|AI Agent 從提示詞工程、上下文工程演進的新顯學

Harness Engineering(駕馭工程)是 AI Agent 開發的最新顯學,承接了 Prompt Engineering(提示詞工程)與 Context Engineering(上下文工程)兩個世代留下的成果。這篇用三個時期的脈絡,講清楚 Harness Engineering 為什麼出現、解決哪些 Prompt 跟 Context 處理不了的問題,並說明舊名詞淡出不是退流行,而是成熟地融入產品,過去學的知識從來不會浪費。

MarkItDown 教學|微軟開源文件轉 Markdown 工具,LLM 與 RAG 必備

MarkItDown 是微軟開源的 Python 工具,能將 PDF、Word、Excel、PowerPoint、圖片、音訊、HTML 等超過 29 種格式轉換成 Markdown。對於需要建立 RAG 知識庫、餵資料給 LLM 分析、或是批次處理大量文件的開發者來說,MarkItDown 提供了簡單的 CLI 與 Python API,幾行程式碼就能完成轉換,還支援 OCR 與語音轉文字等進階功能。

Ollama 入門教學|本地大語言模型新手指南(Windows/Linux/macOS)

近年 AI 大語言模型(LLM)百花齊放,大多數人接觸到的方式仍是透過雲端 API,例如 ChatGP、Gemini、 Claude、Grok、Deepseek等,雖然方便,但可能會受限於費用、額度、網路延遲,資料隱私等問題,希望可以在自己的電腦上執行。Ollama 讓我們能在自己的電腦上直接執行 LLM,不需要依賴雲端輕鬆體驗離線大模型,之後還能結合 AI Agent、MCP 或是 AnythingLLM 整合介面。這篇文章會教學在 Windows / Linux / macOS 安裝 Ollama、下載模型,選適合自己電腦的模型大小。