投影片專區

AI Agent 開發關鍵概念,以投影片形式呈現,適合學習與分享。

什麼是 AI Agent?

AI Agent 是能夠感知環境、推理決策、執行動作的自動化程式。

  • 感知(Perceive):接收使用者輸入、工具回傳、環境狀態
  • 推理(Reason):由 LLM 判斷下一步該做什麼
  • 行動(Act):呼叫工具、搜尋、執行程式碼
Agent = LLM + Tools + Memory + Planning Loop

Agentic Loop 運作循環

① 接收目標 — 使用者提供高層次任務
② 規劃步驟 — LLM 推理所需工具和步驟
③ 呼叫工具 — 執行 API、資料庫、程式碼
④ 觀察結果 — 將結果注入 context
⑤ 判斷是否完成 — 完成輸出;未完成回到 ②

LangChain 核心架構

  • LCEL(| 運算子):串接 Prompt → LLM → Parser
  • RAG:文件載入 → 切分 → 向量化 → 儲存 → 檢索 → 生成
  • Tool Use:@tool 裝飾器定義工具,由 Agent 自動選擇
  • Memory:BufferMemory、SummaryMemory、VectorStoreMemory
chain = prompt | llm | output_parser

AutoGen 多 Agent 角色

  • AssistantAgent:AI 驅動,生成程式碼、分析、規劃
  • UserProxyAgent:執行程式碼,將結果回傳給 AI
  • GroupChatManager:管理多角色輪流發言的順序
核心優勢:自動執行 → 觀察結果 → 自我修正的閉環

適合場景:程式碼生成與驗證、複雜任務分工、研究報告撰寫

MCP Protocol 架構

  • Host:Claude Desktop、Cursor(發起請求)
  • Client:內嵌於 Host 的通訊層
  • Server:你開發的工具服務(提供 Tools / Resources)

三大元件:

  • Tools — AI 可執行的函數
  • Resources — AI 可讀取的資料
  • Prompts — 可重用的提示詞模板

框架選擇指南

需求 推薦框架
RAG 知識問答 LangChain
程式碼自動生成與執行 AutoGen
多 AI 工具整合 MCP Server
複雜工作流管理 LangGraph

生產環境最佳實務

  • 設定 API 費用上限,避免意外超支
  • 使用 LangSmith / Langfuse 監控 Agent 行為
  • 為每個 Tool 加入清晰的 description
  • 設定最大迴圈次數防止無限執行
  • 使用 Docker 沙箱執行不受信任的程式碼
  • 記錄完整 trace 方便事後除錯
1 / 7