OpenAI是一家2015年成立,位於美國的人工智慧公司。他們的目標,是確保這項技術能推動經濟發展,並且提升科學新知以造福人類。
在微軟Microsoft的支持之下,OpenAI發展出許多產品,例如將文字情境轉換為影像的DALL-E,輸入語音轉換為文字的Whisper,還有在最近大大熱門、已經眾所周知的語言模型GPT(Generative pre-trained transformer)。
GPT系列最早可追溯至2019年2月推出的GPT-2,它是一種語言模型,主要的功能簡單的說是「文字接龍」──它可以猜到人類對電腦輸入的下一個字是什麼。猜測之所以會準,是因為當年OpenAI讓電腦閱讀了大量的文章,主要來源來自美國的線上論壇Reddit,使電腦理解人類文字的特性,特別是文字出現在文章中的前後順序。
以技術的觀點,可以想像OpenAI是發展出一種文字處理的技術,將人類文章中的文字排列順序壓縮成許多參數,參數的數量代表模型閱讀過的文章數量。2019年的GPT-2具備1.24億個參數,但到了2020年6月推出的GPT-3,具備的參數就暴增到1,750~2,000億個。
普通人光從這些數字可能還無法理解GPT-3模型的複雜程度。根據史丹福大學今年公布的AI報告The AI Index 2023 Annual Report以及微軟的部落格文章指出,為了使電腦能閱讀完這麼大量的文章,微軟在訓練模型開發過程中,優化了由旗下組織Azure所管理的運算硬體架構,以支持大規模的平行運算。從參數數量推估,GPT-3的訓練成本是1,800萬美元。如此高額的成本除了再次說明其複雜且難以重製外,更顯示了參與這場軍備競賽所需跨越的高門檻。
當ChatGPT開始走進校園與職場
現在大家熱議的ChatGPT,其實是GPT系列的一個分支版本,其功能是盡量在GPT模型上提供聊天功能。因為GPT模型閱讀過大量文章,貌似具備知識模型的問答能力,因此讓人類想出許多有趣的應用方式,例如英語學習、履歷改寫等。但另一方面,這種「標準答案」式的機器人對答,也開始在傳統以問答形式傳授知識的課堂中出現影響。
筆者在2022年開設的程式語言課程中,就發現許多學生開始採用ChatGPT,在作業與期末考時「人機協作」。之所以如此判定,是因為突然發現學生們提交的程式碼開始出現註解,而這也絕對不是單一案例。
為此,一些學校開始有了針對ChatGPT的特別對策,例如香港大學明文禁止在課堂、作業等方面使用ChatGPT、台灣大學則提出「台大針對生成式 AI 工具之教學因應措施」,企圖將ChatGPT轉化為教學精進與有效學習的策略。
筆者認為,與其在校園中禁止使用ChatGPT,更應該加強的是如何善用這種工具。最主要的原因是:已經開始有企業提出要求,希望求職者具備使用ChatGPT的能力。第一個相關職缺是在專業社群網路Linkedin上,由一家法律相關的顧問公司Mishcon de Reya LLP所招募的GPT Legal Prompt Engineer,其工作內容是探索ChatGPT可以應用的相關案例,並且與資料科學家一同設計對ChatGPT的操作指令,以求達到更高的工作效率。在台灣常使用的求職網站中,若以ChatGPT為關鍵字搜尋,已經可以找到近百個與其相關的全職工作,多數與行銷與客戶服務有關。因此,筆者乾脆在本學期的部分課程中講授「如何使用ChatGPT」,並且設計新的作業,部分題目甚至需與ChatGPT協作才可完成。

ChatGPT引爆的AI熱潮
但除了對校園的影響,我們更需要注意的是:ChatGPT僅是AI模型的範例之一,在Google、Facebook等多家公司紛紛投入的趨勢下,AI模型將日益增加,未來針對特定任務挑選合適AI模型的專業人士將更為重要。這件事也可以從今年史丹佛大學的報告中看出來。
報告第一點即說明,產業界的AI發展已經領先了學術界。這顯示為了讓AI成為服務,產業勢必想辦法將高額的模型訓練成本變現。就以微軟支持的ChatGPT為例,這個模型就被應用在微軟旗下的搜尋引擎Bing、文書編輯Office 365 Copilot與更先期的Github Copilot上。
其次,報告中條列了多個先進的AI模型,但並非每個模型都可以精準地解決所有問題。例如以文字生成影像的DALL-E、Stable Diffusion與Midjourney,三者生成的影像風格就差距甚遠。

最後,ChatGPT橫空出世,這股熱潮會持續多久仍是未知,但可以確信的是:隨著資料量提升、運算成本降低、人才的培育,有一些已知的問題,在不久的將來會逐步得到解決。例如:訓練ChatGPT用的資料雖然量體足夠但不夠與時俱進、僅能在網路上使用造成機敏資料外洩的潛在風險、仍有一些言論或訊息內容不正確甚至違法、造成事實查核的困難以及如何使模型遺忘過去誤學的資訊等。相信這些是未來AI模型改良時會繼續深化的主題。
(作者為國立政治大學創新國際學院助理教授,中央大學資訊工程系博士,研究專長為AI應用於教育、ESG與製造業。)
分享圖文請註明出處,未經本站同意不得轉載
瀏覽次數:6204