社群網路

關於生成式人工智慧的常識:它擅長表達,但缺乏常識

擅長流暢表達的生成式人工智慧(GAI),迄今仍讓市場相信它的法力至高無上、無遠弗屆。但它有什麼限制? 擅長流暢表達的生成式人工智慧(GAI),迄今仍讓市場相信它的法力至高無上、無遠弗屆。但它有什麼限制? 圖片來源:NMStudio789/Shutterstock

斯斯有兩種,AI則有很多種──不同年代在市場裡走紅者,各不相同。

久遠些的就不去提了。近一點,12、13年前開始,演算技術還沒流行套上AI名號之際,曾有那麼一陣子,到處都嚷著「大數據」。

6、7年前,多數人已用上指紋乃至臉部辨識去解鎖手機的時候,市場上開始高舉AI。彼時的AI任務,對焦於有標準答案(譬如「你的指紋是你的指紋」)或有明確遊戲規則(還記得下棋的AlphaGo?)的各種應用。

自從2022年底OpenAI將ChatGPT推向世界舞台起,過去一年多在產業界、投資界乃至學界都掀起巨浪的,則是大語言模型(Large Language Models,LLM)構造下的「生成式人工智慧」(Generative Artificial Intelligence,GAI)。全球中大型企業內,早些年陸續引入的不少AI人才,這會兒紛紛從原本要幹的活兒被轉派去「發展GAI」──十之八九是趕集似地去兜攏以LLM為技術基底的聊天機器人。連在地老傳產企業,近期也見開始徵募「GAI工程師」。大夥兒都生怕沒搭上這班似乎很厲害的車,因而落了隊。

文字、圖像的生成外,長於影音生成的SORA也於最近面世。一波波GAI狂潮,明顯拉抬了它要生成內容所需的「人」、「事」與「物」的需求。需求的兇猛,表現在媒體鋪天蓋地的報導,表現在各行各業的敲鑼打鼓,也表現在從華爾街到台股各相關企業的股價勁揚。

生成式AI能做什麼?寫程式、摘要、翻譯,文字表達是強項

一年多下來,消化了海量數據、兜攏了龐大運算力的文字生成式人工智慧,實際擅長之處已經慢慢清晰。

首先,對於寫程式的人,GAI是個夢寐以求的好助手。需要自己動手寫程式的人,過去這段時間裡,應該都已體驗過GAI提點之妙。

其次,GAI一方面能助人將語言陳述流暢化(譬如能將書寫英文修得通順些),另一方面也能在不同語言(包括電腦語言和自然語言)間執行還過得去的「翻譯」工作。

再來,GAI非常合適用來讓大量文字「由繁化簡」,從巨量文件中生成摘要,提供濃縮後的資訊。這對律師事務所、對研究生,都能產生甜蜜的貢獻。

更重要地,GAI擅長表達。試試在ChatGPT上輸入「怎樣能變有錢」、「如何與伴侶相處」這類問句,或者將自己的一些條件輸入以生成履歷,都不難從其條理分明的生成文字中,見證其流暢表達的功力。待SORA之類的影音GAI應用普及,這種表達能力會對社會造成更深遠的影響。

GAI本身適合作為「程式撰寫機器」、「簡易翻譯機器」和「概念表達機器」,但它遠非理想的「事實陳述機器」或「推理機器」。圖片來源:Dean Drobot/Shutterstock

生成式AI的侷限:拙於事實、不善推理

數位科技發展和新藥發明的相同點,在於問世前都非常耗時費錢。而這兩者天壤之別處,則在於任何新藥上市,都必須述明適用範圍、使用時機、限制與副作用;相對地,各種被吹捧炒熱的數位科技,當紅之際每每被視為可治百病的神丹妙藥。當下的GAI便是如此。一如任何其他數位科技,GAI本身在其適用範圍之外,其實有偌大的限制。底下先舉三個淺顯的例子,然後再進一步說明。

首先,試著在ChatGPT或Google Gemini上試試「政治大學的校友」。

你會隨機地得到陳水扁、馬英九、蔡英文、賴清德、連戰、蘇貞昌、柯文哲……全台知名政治人物排列的結果。這類有趣的生成式「幻覺」(hallucination),是最常被提及的GAI限制。

再來,同樣的介面,提問:「小明家住台北。今年1月她去京都10天,高雄10天,沒去別的地方。小明今年1月在台灣總共幾天?」

只要知道台北和高雄在台灣,京都在日本的小朋友,都能很快答出正確答案:21天。但不管是ChatGPT還是Gemini,多試幾回,從中得到的多種答案卻不常見到「21天」這正解。究其因,雖然若另外詢問「京都在哪裡」,它能「生成」出「京都在日本」,但GAI並不在一般我們所理解的意義上「知道」京都在日本。

最後,再問問:「為什麼車市裡可以同時見到200萬元的豐田和100萬元的瑪莎拉蒂?」

GAI會頭頭是道地條列出「品牌價值」、「產品定位」、「市場需求」、「成本結構」等狀似井井有條的回答。但無論如何,它卻無法給出一般人不難想到的答案:200萬元一台的豐田,可能是某些款式的新車;而100萬元一台的瑪莎拉蒂,肯定是狀況多多的舊車。

綜言之,GAI本身適合作為「程式撰寫機器」、「簡易翻譯機器」和「概念表達機器」,但它遠非理想的「事實陳述機器」或「推理機器」。一般的GAI應用並不「知道」政大的校友名單、京都在日本、市場上有新車二手車的分野等等事實,也不「理解」自己所生成文字的「意思」。就資訊技術而言,LLM構作下的GAI應用,並未涵蓋廣泛而詳盡的ontology(可粗略理解為「現實世界的概念模型」),因此無法確保它流暢生成的內容是「事實」。

當下大張旗鼓搞GAI,但真能產生具體實益的流程節點,恐未必如想像中的多。圖片來源:Geber86/Shutterstock

生成式AI很火熱,但要讓它在組織裡發揮實益並不容易

簡單的說,目前的GAI擅長表達,但並不具備這世間做成各種計算與判斷所需的「常識」。

從技術的角度看組織端的GAI應用,它「沒常識」的問題並非完全無解。或靠餵養更多攸關數據的調校(fine-tuning),或靠倚賴額外檢索加以支援的RAG(Retrieval-Augmented Generation,檢索增強生成),或靠與非LLM體系的其它種類AI建構串聯,理論上可在特定情境中,局部緩解GAI這方面的缺陷。

但這局部解要在特定情境中有效,有三個前提:1.針對該情境已具備量大質精的攸關數據可支持模型訓練;2.已建構攸關而完整的現實世界概念模型可串聯GAI;3.組織願意長期投注調校優化所需的龐大資源。對實體原生的組織而言,要讓數據到位所需投注的清整治理工夫,做得越深才越知其費工費時的龐雜。而由於「技術」與「業務」彼此間普遍存在著巨大的隔閡,加以所需投資的人力物力龐大,要建構攸關且完整的現實世界概念模型更是說來容易、實踐上艱鉅。至於長期投資所需的耐心,更是多數組織久久看不見到位成果時難以具備的修為。即便上述三個前提條件都落實了,GAI實際應用上對組織有益的範圍能有多大,仍是個問號。

如果較切實地理解GAI的用處與限制,並且對組織各種活動流程進行過完整的系統分析,那麼多數組織評估成本效益後,應不難發現:當下大張旗鼓搞GAI,但真能產生具體實益的流程節點,恐未必如想像中的多,也未必正好是射了箭後才去設定的那些靶心。

雖然如此,擅長流暢表達的GAI,迄今仍讓市場相信它的法力至高無上、無遠弗屆。潮湧之際,少數討論其根本性限制,乃至如圖靈獎得主Yann LeCun直指GAI是AI發展大局中死胡同的聲音,都還會有段時間在市場上繼續被漠視。GAI的各式「軍火商」們仍將持續造浪。既然是熱潮、是風口,相關的人事物,都還會再飛一陣子;直到市場上下波炒作指向別類新技術為止。

分享圖文請註明出處,未經本站同意不得轉載

瀏覽次數:3279

獨立評論

每週四,精選觀點直送信箱!現在就訂閱獨立評論電子報

編輯推薦

延伸閱讀

數位科技競技場,商場,球場,各類戰場。在這些場子的邊上,看場中的人與事。前台灣大學工商管理學系暨商學研究所教授。
「獨立評論@天下」提醒您:
1.本欄位提供網路意見交流平台,專欄反映作者意見,不代表本社立場
2.發言時彼此尊重,若涉及個人隱私、人身攻擊、族群歧視等狀況,本站將移除留言。
3.本留言板所有言論不代表天下雜誌立場。
數位科技競技場,商場,球場,各類戰場。在這些場子的邊上,看場中的人與事。前台灣大學工商管理學系暨商學研究所教授。

分享圖文請註明出處,未經本站同意不得轉載