AI新時代》台灣應自主開發ChatGPT中文模型

我們想讓你知道…中國必會開發自己的中文ChatGPT模型,且品質應會優於OpenAI的中文模型。屆時,許多台灣ChatGPT的應用恐被迫建構在此中國的中文ChatGPT模型上,將引發國安疑慮。

▲美國人工智能公司「OpenAI」開發的「ChatGPT」掀起熱議。(圖/路透)

● 闕志克/清大資工系合聘教授暨台達研究院院長

自從OpenAI於2022年11月底發表ChatGPT讓用戶試用以來,在短短不到3個月內已累積超過1億個試用帳戶。雖然連OpenAI的CEO都公開承認這一版ChatGPT在功能上非常有限,尚未成熟到可以運用到關鍵企業應用上,但它所展示的驚人功能、商業潛力與未來產品的想像空間,讓業內許多權威人士相信,ChatGPT對未來10年IT產業的影響力可以與1990年代的網絡瀏覽器和2000年代的iPhone相媲美。

聊天不是主要功能 ChatGPT強在生成流暢文字

嚴格來講,ChatGPT最令人驚豔的功能不是聊天,而是針對結構複雜的用戶提示(prompt),能答出文法正確、語意切題、內容豐富詳細的回覆,且回覆的語法與風格可以任由用戶指定。所謂的提示可以是一個具體的問題或要求,如「請用七言絕句的形式描述台積電在小晶片的業務」或「請列出兩個在中美科技競爭中較少被大眾媒體報導的角度」、一篇尚待完成文章的破題或摘要、一篇需要潤飾簡化或總結的文件、甚至是一組需要被轉成文字描述的結構性資料檔案集。

瞎掰幹話、不擅推理 當前ChatGPT的最大毛病

▲ChatGPT既不擅長需要多層次邏輯推論才能得出的複雜推理,也常犯簡單的算術錯誤,更時有前後文並不一致的毛病。(圖/翻攝自微博)

一般而言,用戶提示語意越簡單清楚、範圍越明確,ChatGPT的回應就越具體、精準、到位。雖然這一版ChatGPT的表現已足以讓它名符其實地成為有史以來最強大的問答機器人,但它仍然有不少缺點,尚待OpenAI或其終端應用開發者進一步解決。首先,含有事實錯誤和編造內容(所謂的「幻覺」)的ChatGPT回覆並不罕見,再者,ChatGPT既不擅長需要多層次邏輯推論才能得出的複雜推理,也常犯簡單的算術錯誤,更時有前後文並不一致的毛病。儘管有這些問題,考量ChatGPT背後巨大的商業動力,它們在未來幾年終將會一一解決。

以「文字接龍」為設計原理 再以神經網路建立關聯模型

ChatGPT的技術基礎是大規模語言模型(Large Language Model),其設計原理是「文字接龍」:給定一個先行文字序列,預測下一個字、下一個詞、下一個句子、下一個段落甚至下幾個段落等。這種大規模語言模型的訓練,通常是基於所有網路和實體世界可以收集得到的文件,包括網頁、書籍、刊物、非出版品、電郵、即時信息等。訓練時,針對每一篇文件,從頭掃描到尾,過程中某一文字片段當成先行文字序列,接在其後的字、詞、句、段落則作為預測標的,再以神經網路的方式建立起先行文字序列與預測標的間的數學關聯模型。有了這個基線模型,ChatGPT 團隊接著利用人類用戶產生的問答集,將此模型特化為能有效回應用戶提示的語句預測引擎,然後再依靠人類用戶對其針對給定提示的可能響應所作的排序,進一步增強此引擎語句輸出的相關性和準確度。

將ChatGPT技術做商業運用 台灣須開發自己的類ChatGPT

理論上,台灣產業可以以下四種方式將ChatGPT這個技術作商業運用:(1) 單純以終端用戶的身分使用ChatGPT;(2)利用ChatGPT的API來開發加值型應用服務,如特定領域搜索引擎或企業知識發掘工具;(3)藉助特定應用的資料加強訓練ChatGPT的基線模型,以客製應用所需的功能; (4)模仿ChatGPT基線模型的訓練手法,運用在台灣地區爬梳的語料為主,與時俱進持續訓練其底層的語言模型,以增進其精確性與即時性。

▲中國必然會開發自己的中文ChatGPT模型,屆時,許多台灣ChatGPT的應用可能被迫建構在這個中國的中文ChatGPT模型上,恐引發國安疑慮。(圖/CFP)

OpenAI現有的商業模式其實並不支援以上第三與第四種ChatGPT的運用方式,要打破這個限制,台灣必需自主開發以台灣地區中文語料訓練出來的「類ChatGPT」語文預測模型。此外,還有三個理由支持此倡議。第一,OpenAI的ChatGPT模型雖然支援中文,但並非其主要重點,所以就其模擬台灣地區中文使用的能力而言,應尚有不少進步空間。其次,中國毫無懸念必然會開發它自己的中文ChatGPT模型,且其品質應會優於OpenAI的中文模型。屆時,許多台灣ChatGPT的應用可能被迫建構在這個中國的中文ChatGPT模型上,但這將引發國安疑慮。最後,即便使用外來中文ChatGPT模型沒有國安問題,每次API呼叫對ChatGPT應用開發商都是成本。如果政府可以成功開發出台灣自己的中文ChatGPT模型供在地廠商使用,這項基礎設施投資對台灣未來幾十年的AI與數位產業發展將產生巨大的貢獻。

以上言論不代表本網立場,歡迎投書《雲論》讓優質好文被更多人看見,請寄editor88@ettoday.net,本網保有文字刪修權。

分享給朋友:

讀者迴響

關注我們

回到最上面