是 Ray 不是 Array

整理這些技術筆記真的很花時間,如果你願意 關閉 Adblock 支持我,我會把這份感謝轉換成更多「踩坑轉避坑」的內容給你!ヽ(・∀・)ノ

Advertisement
AI

AI Agent 不再是統稱了?認識 Coding Agent 與各類 AI Agent 的差異

AI Agent 不再是統稱了?認識 Coding Agent 與各類 AI Agent 的差異
AI Agent 不再是統稱了?認識 Coding Agent 與各類 AI Agent 的差異

前言

之前我有寫過一篇 你聽過 LLM、RAG、Prompt 嗎?一文帶你看懂生成式 AI 常見技術詞彙,裡面有提到 AI Agent 這個概念,當時是把它當作一個統稱來介紹,也就是可以自己理解任務、拆解步驟、操作工具來完成事情的 AI 系統。

可是到了 2026 年的現在,越來越多地方開始出現 Coding Agent、Research Agent、Browser Agent 這些更具體的名詞,AI Agent 已經不再只是一個模糊的統稱了,所以這篇就來聊一下這些分類到底是什麼意思,以及它們之間的差異。

先回顧一下 AI Agent

在聊分類之前,先快速回顧一下 AI Agent 的定義。

根據目前業界比較有共識的說法,AI Agent 簡單來講就是…

一個 LLM 在迴圈中使用工具來達成目標的系統。

這句話有幾個重點:

  • LLM 做決策: 不是你寫死一個流程讓它跑,而是 LLM 自己決定下一步要做什麼
  • 工具使用: 它可以存取檔案、呼叫 API、瀏覽網頁、執行指令等等
  • 迴圈運作: 做一個動作、觀察結果、決定下一步、再做一個動作,不斷循環直到任務完成
  • 目標導向: 有一個明確的任務要完成,而不是漫無目的地閒聊

這邊有一個滿重要的觀念,Anthropic 在他們的 Building Effective Agents 文章中有區分了 WorkflowAgent 兩個概念。Workflow 是 LLM 跟工具依照預先寫好的流程在跑,每一步做什麼都是你定義好的;而 Agent 則是 LLM 自己動態地決定要用什麼工具、怎麼做,整個過程由 LLM 自己掌控。

如果用比較生活面的例子來講,Workflow 就像是你請一個工讀生按照 SOP 來做事,每一步都寫得清清楚楚;而 Agent 比較像是你請一個有經驗的員工,你只要告訴他目標是什麼,他自己會判斷該怎麼做。

AI Agent 的主要分類

到了 2025、2026 年,各種專門化的 AI Agent 工具大量冒出來,業界也開始區分出不同的子類型。目前業界沒有一個統一的分類標準,但為了方便溝通跟理解,根據各種工具的應用方向,大致可以歸納出以下幾種常見類型:

分類 說明 代表工具
Coding Agent 專門做軟體開發的 Agent Claude Code、Cursor、GitHub Copilot、Devin
Research Agent 蒐集資料、交叉比對、產出報告 Google Deep Research、Perplexity
Browser Agent 自動操作網頁、填表單、完成網路任務 OpenAI Operator、Google Project Mariner

這些分類之間不是完全獨立的,很多工具會跨多個類型。以 Claude Code 來講,雖然它主要是一個 Coding Agent,可是如果你叫它去上網搜尋資料也做得到,分類的目的比較像是讓你知道這個工具的主場在哪裡。

另外還有一個趨勢是 Multi-Agent(多 Agent 協作),就是把不同類型的 Agent 組合在一起,像是一個 Research Agent 負責蒐集資料、一個 Coding Agent 負責實作、一個分析 Agent 負責驗證結果,概念有點像微服務架構,每個 Agent 專注做一件事,然後透過協調機制讓它們合作。

Coding Agent 是什麼?

Coding Agent 就是專門做軟體開發的 AI Agent,它的工具集和工作流程都是針對軟體開發設計的。

MIT 的 Missing Semester 課程在 2026 年新增了一堂 Agentic Coding 的課,裡面把 Coding Agent 定義為:

具備讀寫檔案、搜尋網頁、執行終端機指令等工具的對話式 AI 模型。

乍看之下好像跟一般的 AI Agent 差不多?差別在於 Coding Agent 的整個設計都是圍繞著軟體開發的流程來打造的,這邊整理一下兩者的差異:

面向 一般 AI Agent Coding Agent
應用領域 通用任務 軟體開發
工具集 通用工具(搜尋、API 等) 開發工具(檔案系統、Git、終端機、測試框架、Linter)
回饋迴圈 看任務而定 寫程式 → 跑測試 → 看錯誤 → 修正 → 再跑測試
輸出結果 文字、決策、動作 程式碼變更、Commit、Pull Request
上下文理解 看任務而定 需要理解整個 Codebase 的結構、依賴關係、型別系統
驗證方式 看領域而定 可以透過測試、編譯、Lint 來自動驗證

最後一點其實是 Coding Agent 相比其他類型 Agent 的一個很大的優勢。軟體開發這個領域天生就有一套客觀的驗證機制,程式碼能不能跑、測試過不過、有沒有語法錯誤,這些都是非黑即白的,不需要人類來判斷。這讓 Coding Agent 可以在不需要人類介入的情況下自己不斷嘗試和修正,其他領域的 Agent 往往就沒有這麼明確的自動驗證方式。

Coding Agent 跟 Code Assistant 的差異

這邊還要釐清一個容易搞混的東西:Coding Agent 跟 Code Assistant 是不同的。

以前我們用的 AI 程式碼工具大多是 Code Assistant 等級的,像是最早的 GitHub Copilot 就是典型的例子。Code Assistant 做的事情就是你在打程式碼的時候,它在旁邊幫你補完下一行或下一個 function,你還是主要的操作者,它只是在輔助你。

而 Coding Agent 則是你告訴它一個目標,它自己去規劃要改哪些檔案、自己改、自己跑測試、自己修正錯誤,整個過程你基本上只需要在最後 Review 結果就好。

如果用比較生活面來講的話,Code Assistant 就像是你在開車時旁邊坐了一個副駕駛幫你看路,可是方向盤還是在你手上。而 Coding Agent 比較像是自動駕駛,你告訴它目的地,它自己開過去,你只需要在旁邊盯著確認沒問題就好。

不過現在很多工具同時具備這兩種能力。以 GitHub Copilot 來講,它原本就是一個 Code Assistant,但後來加了 Agent Mode 跟 Coding Agent 之後就變成兩者兼具了。Cursor 也是類似的情況,它的 Tab 補全是 Assistant 等級,但 Agent Mode 就是 Coding Agent 等級了。

目前有哪些 Coding Agent?

目前市面上主要的 Coding Agent 大概有這些:

Claude Code

Anthropic 推出的 CLI 開發工具,直接在終端機裡面運作。它可以理解整個 Codebase 的結構,自己讀檔案、改檔案、跑指令、跑測試,還支援 Hooks、Skills、MCP Server 等進階功能。以我自己來講,Claude Code 是我目前最常用的 Coding Agent。

Note
如果你想了解 Claude Code 的詳細介紹,可以參考 想用 Claude Code 開發?這篇帶你從入門到進階

GitHub Copilot Coding Agent

GitHub 推出的雲端 Coding Agent,跑在 GitHub Actions 的環境裡面。你可以在 Issue 上指派給它,它就會在背景自己建立分支、寫程式、跑測試,完成之後自動開 PR。它跟 Copilot 的 Agent Mode 是不同的東西,Agent Mode 是在 VSCode 裡面跑的,Coding Agent 是在雲端跑的。

Cursor Agent Mode

Cursor 的 Agent Mode 可以自動搜尋整個 Codebase、跨檔案修改、執行終端機指令。2026 年 Cursor 也推出了 Background Agents,會把 Repo Clone 到雲端在獨立分支上工作,可以同時開多個平行處理。

Devin

Cognition 推出的全自主 Coding Agent,走的是最極端的自動化路線。你給它一個任務,它會自己在一個雲端環境裡面從頭到尾完成,包含寫程式、Debug、部署等等,適合那種定義清楚、不需要太多來回討論的任務。

OpenAI Codex

OpenAI 推出的雲端 Coding Agent,可以非同步地在背景執行開發任務。你給它一個指令,它會在沙盒環境中自己完成,結束後把結果交給你 Review。

其他

還有一些開源或比較小眾的工具,像是 Aider(終端機工具)、Cline(VSCode 外掛)、OpenHands(可自架的平台)等等。

Note
如果你想看這些工具的完整比較,可以參考我之前寫的 2026 年 AI Coding 工具怎麼選?GitHub Copilot、Cursor、Claude Code、Kiro 與 Antigravity 完整比較

Coding Agent 的核心工作流程

不管是哪一個 Coding Agent,它們的核心工作流程其實都差不多:

  1. 理解任務: 你告訴它你要做什麼,它先去讀相關的程式碼理解目前的狀態
  2. 規劃方案: 決定要改哪些檔案、怎麼改、順序是什麼
  3. 執行修改: 開始動手改程式碼,可能是改一個檔案也可能是改十幾個
  4. 驗證結果: 跑測試、跑 Lint、跑編譯,看有沒有出錯
  5. 自我修正: 如果測試失敗就看錯誤訊息,自己修正後再跑一次
  6. 交付成果: 改完之後 Commit、開 PR、或者就直接在你的工作目錄中完成

Coding Agent 之所以有效,就是因為軟體開發這個領域有明確的驗證方式(測試、編譯),讓 Agent 可以在這個迴圈中不斷嘗試和修正直到得到正確的結果。

總結

最後整理一下這篇的重點:

名詞 說明
AI Agent 統稱,泛指 LLM 在迴圈中使用工具來達成目標的系統
Coding Agent AI Agent 的子類型,專門針對軟體開發,具備讀寫檔案、操作 Git、跑測試等能力
Code Assistant 輔助你寫程式(補全、建議),你還是主要操作者
Research Agent 蒐集資料、交叉比對、產出研究報告
Browser Agent 自動操作網頁、完成網路上的任務
Multi-Agent 多個 Agent 協作完成更複雜的任務

簡單來講,AI Agent 還是那個統稱,可是隨著工具越來越多、應用越來越廣,業界已經開始根據不同領域細分出更具體的名詞了。對我們工程師來講,最常接觸到的就是 Coding Agent,也就是那些可以自己讀 Code、改 Code、跑測試、開 PR 的 AI 開發工具。

希望這篇有讓你對這些名詞的差異有更清楚的認識哩~

你的支持會直接轉換成更多技術筆記

如果我的筆記讓你少踩一個坑、節省 Debug 的時間,
也許你可以請我喝杯咖啡,讓我繼續當個不是 Array 的 Ray ☕

buymeacoffee | line | portaly
Terminal

整理這些技術筆記真的很花時間,如果你願意 關閉 Adblock 支持我,我會把這份感謝轉換成更多「踩坑轉避坑」的內容給你!ヽ(・∀・)ノ

Advertisement

分享這篇文章

留言

© 2026 Ray. All rights reserved.

Powered by Ray Theme