科研團隊創AI除噪與語音增強 助口語障礙一線「聲」機
國科會補助中研院計畫,由中研院資訊科技創新研究中心副主任曹昱(右1)與團隊花9年時間,打造AI深度學習輔助語音系統,可消除溝通時的背景雜訊,也能改善電子喉或口腔癌等產生的語音異常問題,讓溝通更有「愛」。(記者吳柏軒攝)
〔記者吳柏軒/台北報導〕國科會推動人工智慧(AI)前瞻技術,補助中研院資訊科技創新研究中心副主任曹昱團隊,開發出「基於深度類神經網路的語音增強系統」,改善溝通理解度,聽力部分可排除背景噪音,口語部分可強化口腔癌患者口齒不清問題,已有APP以及業界開發人工電子耳等輔具,目前鎖定中文,未來不排除應用到各式語言。
開發技術的曹昱表示,團隊9年多前開始投入,利用AI深度學習來增強語音系統,針對「理解度」特別優化,分為「聽AI」與「說AI」,聽AI會將失真語音用深度類神經網路增強,訓練AI達到乾淨語音效果,並完全排除交通、音樂等背景雜訊。
說AI部分,則考量說話機能障礙,採異常語音偵測、異常語音增強等,如口腔癌患者或電子喉使用者,把原先受損的聲音變得比較清楚,再用手機或儀器播放出來。
另,聽AI將背景雜訊完全除噪,曹昱說,經業界合作,也針對特殊事件如燒開水、警報音等特別處理,讓未來輔聽系統除了增強語音,也會有不同警告偵測。
曹昱說,團隊是全球首項應用深度學習語音增強人工電子耳的研究,成果獲國家創新獎與未來科技獎,目前為公開研究成果,業界可來學習後再自行開發相關產品,另也有相關技轉案執行中,目前技術開發的語言以中文為主,未來稍微調整便可延伸到各種語言。
國科會主任秘書林廣宏表示,中研院特別將AI技術投入開發新穎的構音輔具,針對相關需求人士,如口腔癌患者、電子喉等,當發音沒有那麼清楚,可透過科技強化說話品質跟辨識力,提高跟他人溝通能力,帶來一線「聲」機。
中研院資訊科技創新研究中心副主任曹昱與團隊開發AI技術,用深度學習增強語音模型,幫助聽、說改善,如失真與音的背景噪音消除,或讓電子喉使用者的發音更容易被理解。(記者吳柏軒攝)
-
世界最快速電動鞋! 開發團隊︰步行速度提升250%
-
遠傳friDay購物結合AI 推出再轉轉、網紅看盤服務
-
燕巢交通、商圈推動 市心特色透天買氣正夯
-
看走姿就能認人!日本富士通研發AI新技術
-
Google擬砸64億投資AI 輝達也搶攻商機
-
中華電信「數位創新應用系列賽」開跑
-
施振榮:AI結合醫療 為台打造下一個護國神山產業
-
送瓜給警、消消暑 關西國、高中2校校友會也送暖災區
-
備戰2025全國運動會 雲縣打造全台第3座國際標準溜冰場
-
中捷吊臂意外 運安會促重新檢視捷運兩側禁建限建相關法規
-
新北原民集會專屬空間不足 議員馬見促比照桃園爭取中央補助興建
-
江啟臣爭取500萬 改善豐原北坑步道
-
國際急診醫學會議在台開幕 賴清德:打造健康台灣造福世界
-
台大生應徵陪讀 國中家長開「3小時500元」遭網轟:太扯
-
新住民之女黎昱君錄取台大及陽明交大 獲總統教育獎肯定
生活今日熱門