台版ChatGPT雛型曝光 國科會用4個月秀TAIDE初階成果
〔記者吳柏軒/台北報導〕美國Open AI去年秀ChatGPT引發人工智慧(AI)浪潮,我國國科會今年2月宣布要推台版的生成式AI模型,耗時4個月今(14日)宣布第一階段成果,目前已投入70億個參數量,針對繁體中文訓練,實測已達自動摘要、翻譯文本、寫信與寫文章,都有不錯表現,並首度透露相關計畫經費約2到3億元,年底前希望釋出更大模型,推向商業應用。
國科會主委吳政忠表示,今年2月宣布要推動「可信任AI對話引擎」(簡稱TAIDE),集結產官學研、公私協力下,眾人力量紛紛無私奉獻,不少義工加入,加上國網中心超級電腦算力一半拿出來支持,4個月後今公布第一階段成果,相關經費編列2到3億元,雖跟國外相比「小小小小小」,但確是台灣目前重要成果。
協助開發的陽明交通大學應用數學系教授李育杰表示,當國科會宣布台灣要有自己的生成式AI,避免過度依賴外國技術,眾人便開始用跑的,打造TAIDE引擎,目前利用臉書公開學界使用的LLaMA模型,投入70億個參數量(7B,AI訓練所需參數),達中模型規模。
李育杰指出,TAIDE 7B模型有大量繁體中文資料,如中央社、其他授權內容,等於是幫LLaMA「上中文課」,初階成果實測下,在自動摘要、翻譯文本、寫信及寫文章等4個面向,均有不錯表現,尤其對繁中處理及回答更穩定準確。未來最快10月國網中心更新更強大的GPU,年底前釋出13B的大模型供合作夥伴(如政府機構、業者)測試。
吳政忠說,生成式AI是機會也是危機,對人類社會影響恐比工業革命更甚,AI是要取代我們的腦,工具強大使先進國尤其民主國家都很小心因應,如金融或政府資料,即使是輸入美國ChatGPT,無形中資料就會外流,開發台灣的TAIDE就是為了讓國人可信賴,將來也可在中文世界的AI發展佔有一席之地。
吳政忠說,TAIDE將以台灣文化為基底,融入在地特有的語言、價值觀、風俗習慣等元素,使其理解和回應在地需求,未來將導入不同主題的繁中文本,建立特定領域的應用範例;李育杰說,將來會照顧台語、客語等語言。
台智雲總經理吳漢章表示,台灣有抓到AI趨勢,過去半年已累積15個不同行業提出相關應用需,如基因檢測也需要生成式AI,未來將組聯盟,配合學界討論合作;聯發科創新基地總監許大山認為,我國4個月就有第一階段成果非常難得;玉山金控數位長張智星說,曾估算自家開發生成式AI要花1.22年,還沒算訓練錯誤重來,很高興看到TAIDE模型,未來可不用擔心錯誤跟不實資料,小而美的模型也可對企業運營造成很大提升。