什麼是 AI Agent?
AI Agent 是能夠感知環境、推理決策、執行動作的自動化程式。
- 感知(Perceive):接收使用者輸入、工具回傳、環境狀態
- 推理(Reason):由 LLM 判斷下一步該做什麼
- 行動(Act):呼叫工具、搜尋、執行程式碼
Agent = LLM + Tools + Memory + Planning Loop
Agentic Loop 運作循環
① 接收目標 — 使用者提供高層次任務
② 規劃步驟 — LLM 推理所需工具和步驟
③ 呼叫工具 — 執行 API、資料庫、程式碼
④ 觀察結果 — 將結果注入 context
⑤ 判斷是否完成 — 完成輸出;未完成回到 ②
LangChain 核心架構
- LCEL(| 運算子):串接 Prompt → LLM → Parser
- RAG:文件載入 → 切分 → 向量化 → 儲存 → 檢索 → 生成
- Tool Use:用
@tool裝飾器定義工具,由 Agent 自動選擇 - Memory:BufferMemory、SummaryMemory、VectorStoreMemory
chain = prompt | llm | output_parserAutoGen 多 Agent 角色
- AssistantAgent:AI 驅動,生成程式碼、分析、規劃
- UserProxyAgent:執行程式碼,將結果回傳給 AI
- GroupChatManager:管理多角色輪流發言的順序
核心優勢:自動執行 → 觀察結果 → 自我修正的閉環
適合場景:程式碼生成與驗證、複雜任務分工、研究報告撰寫
MCP Protocol 架構
- Host:Claude Desktop、Cursor(發起請求)
- Client:內嵌於 Host 的通訊層
- Server:你開發的工具服務(提供 Tools / Resources)
三大元件:
- Tools — AI 可執行的函數
- Resources — AI 可讀取的資料
- Prompts — 可重用的提示詞模板
框架選擇指南
| 需求 | 推薦框架 |
|---|---|
| RAG 知識問答 | LangChain |
| 程式碼自動生成與執行 | AutoGen |
| 多 AI 工具整合 | MCP Server |
| 複雜工作流管理 | LangGraph |
生產環境最佳實務
- 設定 API 費用上限,避免意外超支
- 使用 LangSmith / Langfuse 監控 Agent 行為
- 為每個 Tool 加入清晰的 description
- 設定最大迴圈次數防止無限執行
- 使用 Docker 沙箱執行不受信任的程式碼
- 記錄完整 trace 方便事後除錯
1 / 7