即時 熱門 政治 軍武 社會 生活 健康 國際 地方 蒐奇 影音 財經 娛樂 藝文 汽車 時尚 體育 3C 評論 玩咖 食譜 地產 專區 求職

科研團隊創AI除噪與語音增強 助口語障礙一線「聲」機

2022/11/23 11:57

國科會補助中研院計畫,由中研院資訊科技創新研究中心副主任曹昱(右1)與團隊花9年時間,打造AI深度學習輔助語音系統,可消除溝通時的背景雜訊,也能改善電子喉或口腔癌等產生的語音異常問題,讓溝通更有「愛」。(記者吳柏軒攝)

〔記者吳柏軒/台北報導〕國科會推動人工智慧(AI)前瞻技術,補助中研院資訊科技創新研究中心副主任曹昱團隊,開發出「基於深度類神經網路的語音增強系統」,改善溝通理解度,聽力部分可排除背景噪音,口語部分可強化口腔癌患者口齒不清問題,已有APP以及業界開發人工電子耳等輔具,目前鎖定中文,未來不排除應用到各式語言。

開發技術的曹昱表示,團隊9年多前開始投入,利用AI深度學習來增強語音系統,針對「理解度」特別優化,分為「聽AI」與「說AI」,聽AI會將失真語音用深度類神經網路增強,訓練AI達到乾淨語音效果,並完全排除交通、音樂等背景雜訊。

說AI部分,則考量說話機能障礙,採異常語音偵測、異常語音增強等,如口腔癌患者或電子喉使用者,把原先受損的聲音變得比較清楚,再用手機或儀器播放出來。

另,聽AI將背景雜訊完全除噪,曹昱說,經業界合作,也針對特殊事件如燒開水、警報音等特別處理,讓未來輔聽系統除了增強語音,也會有不同警告偵測。

曹昱說,團隊是全球首項應用深度學習語音增強人工電子耳的研究,成果獲國家創新獎與未來科技獎,目前為公開研究成果,業界可來學習後再自行開發相關產品,另也有相關技轉案執行中,目前技術開發的語言以中文為主,未來稍微調整便可延伸到各種語言。

國科會主任秘書林廣宏表示,中研院特別將AI技術投入開發新穎的構音輔具,針對相關需求人士,如口腔癌患者、電子喉等,當發音沒有那麼清楚,可透過科技強化說話品質跟辨識力,提高跟他人溝通能力,帶來一線「聲」機。

中研院資訊科技創新研究中心副主任曹昱與團隊開發AI技術,用深度學習增強語音模型,幫助聽、說改善,如失真與音的背景噪音消除,或讓電子喉使用者的發音更容易被理解。(記者吳柏軒攝)

不用抽 不用搶 現在用APP看新聞 保證天天中獎  點我下載APP  按我看活動辦法

看更多!請加入自由時報粉絲團
TOP