晴時多雲

民視首位台灣AI主播 微軟揭自然發音幕後關鍵

2023/10/16 14:08

民視氣象AI主播「敏熙」6月底正式亮相。(微軟提供)

〔記者徐子苓/台北報導〕生成式AI成為今年熱門科技話題,民視最近就推出播報國際氣象的主播「敏熙」,由專攻影像技術的「光禾感知」以AIGC(AI Generated Content,人工智慧生成內容)技術,結合微軟Azure AI語音服務,為民視新聞打造台灣首位AI生成的虛擬電視新聞主播,於6月底正式亮相以來受到關注。

這次合作集結影像、聲音與新聞製播等3方專業技術,由光禾感知生成AI虛擬主播影像後,搭配微軟Azure AI的語音合成技術,產出發音自然、流暢的播報人聲,再借助民視新聞多年新聞製播經驗,以及豐富的新聞播報、訪談節目等高畫質新聞影像資料庫進行形象優化,打造專屬民視的AI主播模型。

光禾感知科技執行長王友光指出,團隊在2022年底開始投入AI主播製作,透過大量蒐集照片作為訓練原料,以擴散模型(Diffusion model)為技術基底,訓練出能夠生成動態圖像的模型,完成主播臉孔塑造。

除了外貌,聲音在新聞播報中也扮演重要角色,微軟Azure AI語音服務的 TTS(文字轉語音)及Viseme技術實現了「敏熙」自然且順暢人聲的關鍵。這2個技術相輔相成,不僅能生成嘴型與聲音吻合的AI臉部影像,也能進一步實現多國語系主播的可能,「敏熙」現在已可以進行綜合中文及英文的播報內容。

微軟指出,不同於傳統如機械音般的文字轉語音服務,Azure AI語音服務擁有豐富模型,提供140種語系以上、超過400個近似真人發音的預建神經語音模型供選擇;除了預建模型,Azure AI語音服務還支援自訂模型,可根據需求調整語音的風格、速度、音調等參數,進而生成貼近真人主播具備情緒及抑揚頓挫的語音。

此外,透過Viseme技術還能提升虛擬主播嘴型與播報文字精準度,該技術能夠在說話過程定義臉部及嘴唇、下顎及舌頭等位置,使虛擬主播臉部嘴型與語音的結合呈現更為自然。

民視新聞傳播群副總經理胡婉玲分享,民視不只看到生成式AI技術為新聞產業帶來的嶄新機會,也充分評估相關風險並恪守相關法規與新聞倫理,禁止採用AI生成的新聞內容,確保所有AI虛擬主播的播出內容皆由編輯撰寫並依循既有審核流程,在發展新聞多樣性的同時,也維持高度正確性。

一手掌握經濟脈動 點我訂閱自由財經Youtube頻道

不用抽 不用搶 現在用APP看新聞 保證天天中獎  點我下載APP  按我看活動辦法

已經加好友了,謝謝
歡迎加入【自由財經】
按個讚 心情好
已經按讚了,謝謝。

相關新聞

今日熱門新聞
看更多!請加入自由財經粉絲團
網友回應
載入中