陳鵬仁與台大學弟妹分享Meta AI研究團隊選擇台語原因
〔記者林曉雲/台北報導〕Meta語音翻譯系統幕後推手之一是台大資工系校友陳鵬仁,他近日與台大學弟妹分享,Meta AI研究團隊會選擇以台語為開發對象的原因,是因為在翻譯上的困境與無文字語言類似,台語有標準書寫語言但並沒有被廣泛使用,大多數台語使用者常因個人習慣不同,而使用不同文字來表達相同句子,使得訓練台語文字翻譯系統變得非常困難。
陳鵬仁也表示,Meta AI研究團隊研發這套從台語語音直接翻譯到其他語言、不透過台語文字的技術,成功打造出台英語音翻譯系統,研發過程採用了3萬小時的台灣鄉土劇中的台語資料,以及8萬小時的英文電子書籍作為學習資料基礎,蒐集到100小時的英語台語的語音翻譯資料做訓練。
Meta創辦人馬克・祖克伯2022年在個人Facebook帳號上發布影片,與來自台灣出生的工程師陳鵬仁,二人分別以英文與台語對話,透過語音翻譯系統一來一往、沒有障礙,宣告全世界第一個無標準書寫語言語音翻譯系統的誕生。
陳鵬仁是語音翻譯系統的幕後推手,也是台大資訊工程學系的校友,近日與台大學弟妹們分享一路在機器學習與語音翻譯的研發過程,表示他從大學期間對AI與機器學習非常感興趣,一直朝這方面學習,也加入系上老師的實驗室。
他說明,「Meta Universal Speech Translator (UST,通用語音翻譯工具)」,是 Meta AI開發的英文與多種語言間的語音翻譯系統 ,口語表達是人類溝通的主要方式之一,發展語音系統的初衷,是希望解決人與人之間的溝通障礙,以及使語言翻譯變得更即時。
傳統技術上,語音到語音的翻譯系統可透過結合語音辨識、文字翻譯和語音合成系統,將A語音翻譯為B語音。但如果A語音沒有對應的文字,這套中間經過文字的翻譯系統就無法運作,Meta AI嘗試開發支持無標準書寫語言的「語音到語音」(speech-to-speech) 翻譯系統,希望讓沒有文字的語言使用者,也能受惠於最新的機器翻譯技術。
陳鵬仁在最新一期台大校訊中表示,除了專業知識外,在校園裡與充滿熱情的人嘗試不同事物的經驗是他一輩子的養分,影響他最深的是台大資訊系教授林智仁,在其帶領下接觸機器學習領域,引發興趣;更重要的是老師的熱情、價值觀及對學生的照顧,也在他的心裡設下標竿,成為他為人處世的準則,而教授林軒田扎實的機器學習課程則為他日後工作打下厚實基礎。
陳鵬仁鼓勵學弟妹,大學是面臨人生各種重要選擇的時間點,在學校有不同的專業課程及研究的機會,也可多把握業界實習機會,了解公司文化、分工、商業模型等,擁有這些經驗在未來職涯的選擇時會更有概念,更能了解自己追求的目標,在學校的學習也能提供更多動機。