10 min read

從 ChatGPT 到 Agentic

在過去的一年中,ChatGPT 已經徹底改變我們對 AI 的想像。隨著我們進入2025 年,焦點漸漸不再只是單一的 LLM,而是轉向更模組化的系統,最終走向能夠做更多事情的 AI agents

這是一篇我的學習。結合了網路上一些參考,涵蓋了從 AI 模型、複合系統,到「ReAct」方法,以及何時應該選寫簡單的程式,或是更具 Agentic 的做法,希望對你學習上有所助益。


前言

在過去的一年中,ChatGPT 已經徹底改變我們對 AI 的想像。隨著我們進入2025 年,焦點漸漸不再只是單一的 LLM,而是轉向更模組化的系統,最終走向能夠做更多事情的 AI agents。本文將探討以下議題:

  • 為何複合系統如此重要
  • 什麼叫做讓 AI 不只「推理」,還能進一步「行動」
  • ReAct(Reason + Act)方法如何成為 AI 代理的核心
  • 何時該使用簡單的程式化方法,何時該使用更代理式的方法來應對複雜任務

早期階段:ChatGPT 的使用

在最初的階段,LLM 的使用方式相當直接,(把它理解成 ChatGPT 即可):

  1. 輸入問題 → LLM → 輸出答案

或是在需要整合外部知識時,可能會採用

  1. 輸入問題 → 搜尋 → LLM → 輸出答案

這樣的方式對於一般的問答任務或基礎需求已經足夠,但它也有明顯的侷限:

  • 難以適應:單一模型無法輕易轉換到新任務或動態需求
  • 知識有限:如果不頻繁重新訓練,模型知識會過時

串接而成的系統

為了克服上述限制,AI 社群跟產品開始打造複合系統,也常被稱為 RAG(Retrieval-Augmented Generation)。在這種架構下,你會將整個 AI 流程分成專門的元件:

  1. 檢索(Retrieval):查詢知識庫或資料庫
  2. 推理(Reasoning):利用(通常是 LLM)解讀檢索到的資料
  3. 執行(Acting):根據推理結果執行相應的動作,或產生最終答案

透過將問題拆解到不同的元件中,團隊就能在不重新訓練整個系統的情況下,升級或替換任何一個元件。這不僅更容易適應,也能確保知識不斷更新


進入 AI Agent:ReasonActMemory

什麼是 AI 代理?

AI 代理 更進一步,帶來了自主性(autonomy)——它不只是輸出答案,還能:

  1. 推理(Reason):用大型語言模型多步驟思考與規劃。
  2. 行動(Act):呼叫外部工具,如搜尋引擎、計算器,甚至執行程式碼。
  3. 存取記憶(Access Memory):從資料庫或其他資源中讀取專門或情境化資訊。

換句話說,AI 代理能觀察自己行動的結果,反覆微調自己的計畫,並持續優化,直到得到完善的解決方案。

ReAct 方法

描述 AI 代理運作邏輯時,常用的縮寫就是 「ReAct」。實際流程是:

  • Re(Reason):AI 決定要如何規劃任務、需要哪些工具或資料來源。
  • Act:代理執行這些動作(查詢資料、計算、程式碼執行等),然後根據結果進行觀察、調整,並決定下一步。

這個循環可以在複雜任務中重複多次,不同於一次性向 LLM 提問就產生答案的作法。


快思與慢思的自主性

在此結合了人類與 AI 的決策模式:

  • 務實(人類)- 快思(Think FAST):人類擅長快速的直覺判斷。
  • 代理(LLMs)- 慢思(Think SLOW):基於 LLM 的代理可以較系統、逐步地搜尋大量資料,並全面評估潛在解答。

這種雙重機制能在面對簡單任務時維持高效率(人類的快速判斷),同時在複雜任務上藉由 AI 的「慢思」來進行深入而全面的分析。系統因而擁有更高的自主性,可依需求將不同類型的任務交給最適合的決策者。

💡
引用了心理學中「System 1 / System 2」的概念,讓讀者更容易理解「人類擅長直覺判斷,AI 擅長大規模檢索與多步驟推理」。人類在面對關鍵決策時也會啟動「慢思」,而 AI 在特定情境下可以執行快速推理。

簡單任務 vs. 複雜任務

程式化(Programmatic):面對簡單任務

對於簡單、規格明確的任務——例如定期生成報表、單純計算、或一次性的網頁爬蟲——只需使用條件式(if-then)或固定指令的程式化方法就可以:

  • 低度不確定性。
  • 解法步驟大致固定。
  • 不太需要反覆迭代或多次決策。

此時,「程式化」方法往往更直接並節省資源。

代理式(Agentic):面對複雜任務

當一個任務包含多步驟、動態資訊或不確定需求時,就需要引入代理式 AI:

  1. 計畫 / 思考(Plan / Think):代理提出假設或解決路徑。
  2. 行動(Act):代理呼叫各種外部工具或 API。
  3. 觀察(Observe):評估執行成果是否符合期望。
  4. 迭代(Iterate):若結果不理想,就重新調整計畫,再次行動,直到取得理想結果。

對於這類動態需求,Agentic AI 能進行探索並在過程中修正,而不是一個指令就把事情做死。


代理式方法的優勢

單純的「一次性回答」模式往往力有未逮。這時候,就需要能不斷「思考、行動、觀察、再思考」的代理式(Agentic)方法。舉例來說,你想整合機票、天氣預報、活動資訊,替自己與朋友規劃一趟完美的跨國旅行。

  1. 複雜需求:例如整合機票、天氣、活動資訊來規劃完整行程,或大規模的資料分析、偵錯。代理式 AI 則能同時連動多個資訊來源:查詢航班、即時氣象、旅遊景點評價、甚至自動篩選符合預算的行程。這種多來源、多步驟的整合能力,也適用於大規模的資料分析與除錯(debug)。代理式 AI 能在龐大的資料裡不斷迭代搜尋、比對或模擬演算,最終給出更全面、精準的結果。
  2. 適應力:能在發現新訊息或情況變動時迅速轉向或修正策略。在企業流程自動化、資料分析等領域,若中途出現異常資料或市場風向改變,代理式 AI 也能隨時修正策略,避免整個計畫「卡死」在某個錯誤上。
  3. 迭代能力:代理可以在每個階段都重新推理,比一次性作答更能避免錯誤。每個階段,AI 代理都可以重新評估當前情況,如果發現前一步的決策失誤,能迅速校正,以降低錯誤帶來的連鎖反應。比起傳統一次性回答模式,這種逐步迭代的特性更能幫助我們在複雜情境中找出最佳解決方案,也避免了「一不小心就全部推翻」的浪費。
  4. 結合人類:人類的「快思」判斷與 AI 的「慢思」分析聯合運作,可產生更全面的決策品質。「1+1 大於 2」的模式,讓決策更全面、更客觀,也更能處理高複雜度的挑戰。

如何設計你的 AI Agnet

  1. 從簡單開始:如果任務相對明確,先用程式化方法。
  2. 模組化:在複雜度漸增時,引入檢索、推理、與行動的模組。
  3. 啟用 ReAct:讓 AI 能夠計畫、行動並反覆調整,而非一次性產生答案。
  4. 保有人類參與:人類用直覺快速決策,AI 代理則做系統性推理,協力完成任務。

除了 ReAct 還有哪些進階方法?

  1. Chain-of-Thought(CoT):簡單來說,就是在回答之前,讓模型先把它的思考步驟一條一條寫出來。好處是不只幫助我們了解 AI 怎麼想,也能讓我們在需要時修正或調整它的推理過程。
💡
開發者與企業需根據應用場景、安全等級、用戶需求,決定是「全部公開」「全部隱藏」,還是採取「部分公開」的折衷做法。目前這三種作法都在研究與實踐中,各有優勢與風險。
  1. Tree-of-Thoughts(ToT):這種做法就像在同時走好幾條路,看看哪條路能走到好結果。它會不斷比較不同的解法,像樹狀結構一樣,有些路不好就「剪掉」,最後留下一條最可行,或者是說效果最好的路徑。特別適合面對高度不確定或多步驟的複雜任務。

這兩種方法都能與 ReAct 結合,或單獨運用在需要更強推理能力的場景。

Agentic AI 的安全

AI 如果能呼叫外部工具或執行程式碼,這種高自主能力勢必帶來更大風險。因此最好需要設計一個 Sandbox(沙箱),即一種受控且隔離的運行環境,可限制 AI 在該環境中只能進行安全範圍內的操作。即使 AI 出現誤判或嘗試執行危險操作,也不會直接影響主系統或造成大規模損害。

或是做人工審核 (Human-in-the-Loop),記錄 AI 代理所有行動、建議,並保持一定的「回溯與審計」能力。透過上述機制,能在提升 AI 效率的同時,儘量降低風險。

AI 的治理與責任

AI Agent 要真正落地有自主權,需要的不僅是技術,也包含治理與監管。比如說合規方面,針對個資、金融、醫療等高敏感度領域,必須符合各地不同的合規要求(如 GDPR)。

另外,倫理與責任歸屬:AI 代理若做出錯誤決策,該由誰負責?AI 若能自我學習並更新行動策略,就必須對其行為進行定期審視、審計,確保不偏離原本目標或干犯法規、倫理底線。

結論

2025 年之後,正式進入 AI 代理 時代——「ReAct」成為常態,自主性成為關鍵,系統透過不斷的推理與行動循環來進行最佳化。

從單一 LLM 到 Agentic 的演進,產品已經對 AI 能力逐漸加深的理解:AI 不只是回答問題,還能夠計畫、觀察、並動態調整。對於較不變的重複性任務,簡單的程式化方法依舊有效;但面對複雜、多層次的挑戰,AI Agents 則將帶來更具創造力、迭代性與適應性的解方。

無論你是開發者、PM、或純粹對科技充滿好奇的人,辨別何時該用簡單方法、何時該採取代理路線,都是打造靈活產品的關鍵。將人類「快思」與 AI「慢思」結合,AI 就不再只是被動回答,而能成為一個能夠「思考」並且「行動」的夥伴,為各種應用場景開啟無限可能。