保存原住民語 AI好幫手
國研院國網中心開發AI工具保存原住民語,並為此多次到花蓮縣向太魯閣族部落召開座談會,說服族人提供文史語料與專業,開發團隊順利運作。(蕭一豪提供)
太魯閣語料庫完成 鄒語進行中
〔記者吳柏軒/台北報導〕科技力量大力協助文化傳承。國研院國網中心效仿加拿大作法,耗時一年多開發AI工具協助台灣原住民語保存,包含與中文的雙向翻譯、語音合成與辨識等功能,還能掃描現有的族語圖文,製作數位有聲書,已建置台灣首套完整族語語料庫,目前完成太魯閣語,正進行鄒語,今年五月起擬收集更複雜、有四種方言的卑南語。
族語收集靠人工 研究員跑部落「搏感情」
國研院國網中心研究員蕭一豪指出,長官赴加拿大拜訪,發現該國用AI保存原住民族語,回國後即推動相關計畫。計畫一開始碰上瓶頸,蕭一豪說,因為要讓AI運作,必須先收集原住民文字,以及族語專家錄音等,邀請族人加入計畫時卻被質疑「做假的?」為此,當時每兩到三週就跑一趟花蓮,跟部落族人「搏感情」表達誠意。
蕭一豪表示,發展AI工具模型包含:中文跟原住民語的文本雙向翻譯、可輸入族語文字來讓AI發聲的語音合成,以及讓AI聽族語再自動轉成文字。也可掃描實體圖書文字,轉成有聲書,同時幫原住民族電視台產生族語新聞逐字稿,計畫於前年五月啟動,首年完成太魯閣語,第二年轉向鄒語,也與原住民族語言研究發展基金會簽合作意向書,保存更多原住民語言。