關於生成式人工智慧的常識：它擅長表達，但缺乏常識｜黃俊堯／場邊

斯斯有兩種，AI則有很多種──不同年代在市場裡走紅者，各不相同。

久遠些的就不去提了。近一點，12、13年前開始，演算技術還沒流行套上AI名號之際，曾有那麼一陣子，到處都嚷著「大數據」。

6、7年前，多數人已用上指紋乃至臉部辨識去解鎖手機的時候，市場上開始高舉AI。彼時的AI任務，對焦於有標準答案（譬如「你的指紋是你的指紋」）或有明確遊戲規則（還記得下棋的AlphaGo？）的各種應用。

自從2022年底OpenAI將ChatGPT推向世界舞台起，過去一年多在產業界、投資界乃至學界都掀起巨浪的，則是大語言模型（Large Language Models，LLM）構造下的「生成式人工智慧」（Generative Artificial Intelligence，GAI）。全球中大型企業內，早些年陸續引入的不少AI人才，這會兒紛紛從原本要幹的活兒被轉派去「發展GAI」──十之八九是趕集似地去兜攏以LLM為技術基底的聊天機器人。連在地老傳產企業，近期也見開始徵募「GAI工程師」。大夥兒都生怕沒搭上這班似乎很厲害的車，因而落了隊。

文字、圖像的生成外，長於影音生成的SORA也於最近面世。一波波GAI狂潮，明顯拉抬了它要生成內容所需的「人」、「事」與「物」的需求。需求的兇猛，表現在媒體鋪天蓋地的報導，表現在各行各業的敲鑼打鼓，也表現在從華爾街到台股各相關企業的股價勁揚。

生成式AI能做什麼？寫程式、摘要、翻譯，文字表達是強項

一年多下來，消化了海量數據、兜攏了龐大運算力的文字生成式人工智慧，實際擅長之處已經慢慢清晰。

首先，對於寫程式的人，GAI是個夢寐以求的好助手。需要自己動手寫程式的人，過去這段時間裡，應該都已體驗過GAI提點之妙。

其次，GAI一方面能助人將語言陳述流暢化（譬如能將書寫英文修得通順些），另一方面也能在不同語言（包括電腦語言和自然語言）間執行還過得去的「翻譯」工作。

再來，GAI非常合適用來讓大量文字「由繁化簡」，從巨量文件中生成摘要，提供濃縮後的資訊。這對律師事務所、對研究生，都能產生甜蜜的貢獻。

更重要地，GAI擅長表達。試試在ChatGPT上輸入「怎樣能變有錢」、「如何與伴侶相處」這類問句，或者將自己的一些條件輸入以生成履歷，都不難從其條理分明的生成文字中，見證其流暢表達的功力。待SORA之類的影音GAI應用普及，這種表達能力會對社會造成更深遠的影響。

GAI本身適合作為「程式撰寫機器」、「簡易翻譯機器」和「概念表達機器」，但它遠非理想的「事實陳述機器」或「推理機器」。圖片來源：Dean Drobot／Shutterstock

生成式AI的侷限：拙於事實、不善推理

數位科技發展和新藥發明的相同點，在於問世前都非常耗時費錢。而這兩者天壤之別處，則在於任何新藥上市，都必須述明適用範圍、使用時機、限制與副作用；相對地，各種被吹捧炒熱的數位科技，當紅之際每每被視為可治百病的神丹妙藥。當下的GAI便是如此。一如任何其他數位科技，GAI本身在其適用範圍之外，其實有偌大的限制。底下先舉三個淺顯的例子，然後再進一步說明。

首先，試著在ChatGPT或Google Gemini上試試「政治大學的校友」。

你會隨機地得到陳水扁、馬英九、蔡英文、賴清德、連戰、蘇貞昌、柯文哲……全台知名政治人物排列的結果。這類有趣的生成式「幻覺」（hallucination），是最常被提及的GAI限制。

再來，同樣的介面，提問：「小明家住台北。今年1月她去京都10天，高雄10天，沒去別的地方。小明今年1月在台灣總共幾天?」

只要知道台北和高雄在台灣，京都在日本的小朋友，都能很快答出正確答案：21天。但不管是ChatGPT還是Gemini，多試幾回，從中得到的多種答案卻不常見到「21天」這正解。究其因，雖然若另外詢問「京都在哪裡」，它能「生成」出「京都在日本」，但GAI並不在一般我們所理解的意義上「知道」京都在日本。

最後，再問問：「為什麼車市裡可以同時見到200萬元的豐田和100萬元的瑪莎拉蒂？」

GAI會頭頭是道地條列出「品牌價值」、「產品定位」、「市場需求」、「成本結構」等狀似井井有條的回答。但無論如何，它卻無法給出一般人不難想到的答案：200萬元一台的豐田，可能是某些款式的新車；而100萬元一台的瑪莎拉蒂，肯定是狀況多多的舊車。

綜言之，GAI本身適合作為「程式撰寫機器」、「簡易翻譯機器」和「概念表達機器」，但它遠非理想的「事實陳述機器」或「推理機器」。一般的GAI應用並不「知道」政大的校友名單、京都在日本、市場上有新車二手車的分野等等事實，也不「理解」自己所生成文字的「意思」。就資訊技術而言，LLM構作下的GAI應用，並未涵蓋廣泛而詳盡的ontology（可粗略理解為「現實世界的概念模型」），因此無法確保它流暢生成的內容是「事實」。

當下大張旗鼓搞GAI，但真能產生具體實益的流程節點，恐未必如想像中的多。圖片來源：Geber86／Shutterstock

生成式AI很火熱，但要讓它在組織裡發揮實益並不容易

簡單的說，目前的GAI擅長表達，但並不具備這世間做成各種計算與判斷所需的「常識」。

從技術的角度看組織端的GAI應用，它「沒常識」的問題並非完全無解。或靠餵養更多攸關數據的調校（fine-tuning），或靠倚賴額外檢索加以支援的RAG（Retrieval-Augmented Generation，檢索增強生成），或靠與非LLM體系的其它種類AI建構串聯，理論上可在特定情境中，局部緩解GAI這方面的缺陷。

但這局部解要在特定情境中有效，有三個前提：1.針對該情境已具備量大質精的攸關數據可支持模型訓練；2.已建構攸關而完整的現實世界概念模型可串聯GAI；3.組織願意長期投注調校優化所需的龐大資源。對實體原生的組織而言，要讓數據到位所需投注的清整治理工夫，做得越深才越知其費工費時的龐雜。而由於「技術」與「業務」彼此間普遍存在著巨大的隔閡，加以所需投資的人力物力龐大，要建構攸關且完整的現實世界概念模型更是說來容易、實踐上艱鉅。至於長期投資所需的耐心，更是多數組織久久看不見到位成果時難以具備的修為。即便上述三個前提條件都落實了，GAI實際應用上對組織有益的範圍能有多大，仍是個問號。

如果較切實地理解GAI的用處與限制，並且對組織各種活動流程進行過完整的系統分析，那麼多數組織評估成本效益後，應不難發現：當下大張旗鼓搞GAI，但真能產生具體實益的流程節點，恐未必如想像中的多，也未必正好是射了箭後才去設定的那些靶心。

雖然如此，擅長流暢表達的GAI，迄今仍讓市場相信它的法力至高無上、無遠弗屆。潮湧之際，少數討論其根本性限制，乃至如圖靈獎得主Yann LeCun直指GAI是AI發展大局中死胡同的聲音，都還會有段時間在市場上繼續被漠視。GAI的各式「軍火商」們仍將持續造浪。既然是熱潮、是風口，相關的人事物，都還會再飛一陣子；直到市場上下波炒作指向別類新技術為止。

分享圖文請註明出處，未經本站同意不得轉載

瀏覽次數：3289

關於生成式人工智慧的常識：它擅長表達，但缺乏常識

生成式AI能做什麼？寫程式、摘要、翻譯，文字表達是強項

生成式AI的侷限：拙於事實、不善推理

生成式AI很火熱，但要讓它在組織裡發揮實益並不容易

獨立評論

黃俊堯

場邊

「獨立評論＠天下」提醒您：

1.本欄位提供網路意見交流平台，專欄反映作者意見，不代表本社立場
2.發言時彼此尊重，若涉及個人隱私、人身攻擊、族群歧視等狀況，本站將移除留言。
3.本留言板所有言論不代表天下雜誌立場。

黃俊堯

場邊

熱門文章

1

2

3

4

5

關於生成式人工智慧的常識：它擅長表達，但缺乏常識

生成式AI能做什麼？寫程式、摘要、翻譯，文字表達是強項

生成式AI的侷限：拙於事實、不善推理

生成式AI很火熱，但要讓它在組織裡發揮實益並不容易

獨立評論

編輯推薦

延伸閱讀

黃俊堯

場邊

「獨立評論＠天下」提醒您：

1.本欄位提供網路意見交流平台，專欄反映作者意見，不代表本社立場 2.發言時彼此尊重，若涉及個人隱私、人身攻擊、族群歧視等狀況，本站將移除留言。 3.本留言板所有言論不代表天下雜誌立場。

黃俊堯

場邊

熱門文章

1

2

3

4

5

1.本欄位提供網路意見交流平台，專欄反映作者意見，不代表本社立場
2.發言時彼此尊重，若涉及個人隱私、人身攻擊、族群歧視等狀況，本站將移除留言。
3.本留言板所有言論不代表天下雜誌立場。