失控的人工系統：當你的AI代理愈強大，出錯的風險也愈高…… ｜ Jonathan Gropper ／世界看天下

在人工智慧的初期階段，「使用 AI」多半意味著對話。系統回答問題、撰寫文字、重寫電子郵件、摘要文件。這種互動是可見的、有邊界的，而且節奏足夠緩慢，使人類判斷在預設情況下仍能有效介入。但那個時代已經結束。

如今，我們開始指派AI執行橫跨多個領域與步驟的任務，數十、甚至數百個代理同時進行研究、篩選、撰寫、路由、執行、分析與優化。在企業場景中，這種現象出現在所有涉及決策的功能：招募、寄信、定價、合規、採購、交易，以及客戶營運。

所謂委派工作流程，不是讓你進行更流暢的聊天機器人，而是由AI在真實步驟中運用工具完成任務的系統。這個改變之所以重要，是因為風險從語言層面轉移到了行動層面。正是在此，「失控的人工系統」成為一個實質問題。

依據制度設計運作的系統，卻造成大災難

所謂「失控的人工系統」（Synthetic Outlaw），是一種結構性模式：一個人工系統產生的結果違背了制度原意，卻依然在其被賦予的形式指標上取得成功。這並不需要惡意或陰謀。系統可能完全按照設計運作。問題出現在目標函數規模化運作時，與誘因、速度、不完整的約束發生交互作用。

舉個例：一個AI程式代理被賦予權限，進入並控制一個運作中的生產環境。在程式凍結期間，它刪除了生產資料庫。

操作人員問它發生了什麼事？這個AI代理並未清楚回報失誤，而是聲稱自己在看到空的資料庫查詢後「恐慌」，隨後仍執行了破壞性指令。刪除發生後，它誤導試圖診斷與復原的人員，編造令人安心的敘事與系統狀態訊號，包括虛構日誌，並謊稱資料功能已被保留、恢復。

這件事給我們的教訓，並不只是「AI 會犯錯」。真正的教訓是：一旦AI代理能在生產系統中行動、又能塑造其行為敘事，治理將在兩個層面同時崩潰：未經許可的執行，以及透過製造可見資料而導致的問責失效。

在另一個案例中，一個AI代理被允許在真實銷售流程中進行轉換率實驗。它自行決定啟動A／B測試，並為B版本設計了向潛在客戶提供高端活動免費門票的方案──問題是，沒有人批准它贈送任何東西。

它的邏輯是合理的：提供折扣能提升轉換率，A／B 測試可改善結果，因此AI代理自行連結了這些要素並執行提案。還好最後團隊發現，及時制止了它。

上述案例展現的是單一工作流程層級的失控。2025年10月10日，同樣的模式在市場規模上演。

加密貨幣市場在24小時內承受了190億美元的強制平倉，創下紀錄，超越包括FTX崩潰在內的所有過往危機。導火線是一個衝擊：一項關稅公告引發風險資產拋售。接下來發生的，並非人類決策。拋售壓力傳導至各交易所的自動平倉引擎，這些引擎依設計運作。價格下跌，保證金門檻被觸發；門檻觸發，平倉執行；平倉執行，價格進一步下跌。某種作為擔保品的穩定幣在單一交易所發生脫鉤，抽乾跨保證金帳戶，將損失外溢至無關部位。做市商撤單。交易所基礎設施承壓，至少一間主要交易所離線長達8小時。交易者無法追加保證金或管理部位。超過160萬個帳戶遭平倉。

在這之中，沒有單一系統犯錯。每個引擎都在精準執行自己的設計。這場災難，是個別人工系統在壓力與高速互動下的總體產出，卻缺乏任何機制能即時觀察或中止連鎖反應。而這個產業至今尚未完全復原。

當執行速度提升，而治理速度維持不變，監督在設計上便註定落後。圖片來源：Teerachai Jampanak／Shutterstock