為達最佳瀏覽效果,建議使用 Chrome、Firefox 或 Microsoft Edge 的瀏覽器。

關閉此視窗 請至Edge官網下載 請至FireFox官網下載 請至Google官網下載
晴時多雲

    限制級
    您即將進入之新聞內容 需滿18歲 方可瀏覽。
    根據「電腦網路內容分級處理辦法」修正條文第六條第三款規定,已於網站首頁或各該限制級網頁,依台灣網站分級推廣基金會規定作標示。 台灣網站分級推廣基金會(TICRF)網站:http://www.ticrf.org.tw

    台語語料資料庫上線 助本土語發展與AI應用

    教育部委託國家教育研究院建置「台灣台語語料庫應用檢索系統」上線。(資料照)

    教育部委託國家教育研究院建置「台灣台語語料庫應用檢索系統」上線。(資料照)

    2024/08/26 14:39

    〔記者楊綿傑/台北報導〕教育部委託國家教育研究院建置「台灣台語語料庫應用檢索系統」,可查詢超過5.6萬筆台灣台語語料、收錄約1400條教科書詞彙,除可供國民中小學課程設計、教學與評量需求外,供下載的語料庫也可作為語音處理或輔助教學的AI開發基礎。

    教育部表示,為了全力支持本土語言研究,於去年委託國家教育研究院建置及維護台灣台語語音語料庫相關計畫,將語料庫的成果加以保存、維護,並增錄教育部辭典及盧廣誠先生編《華台對照詞典》的例句,延伸建立「台灣台語語料庫應用檢索系統」

    教育部指出,「台灣台語語料庫應用檢索系統」包含3大子系統,在語料檢索系統的部分,使用者可查詢超過5萬6000筆台灣台語語料內容,並取得檢索詞彙的搭配詞、關聯詞及部分語音檔。

    而在教科書詞彙檢索系統部分,收錄約1400條教科書詞彙,使用者可查詢各版本台灣台語教科書中出現的詞彙及相關資訊,可供教師利用,豐富教學內容。

    另在語法點檢索系統部分,使用者可查詢台灣台語語法點及其說明與例句,有助於深入學習,並供語言研究者參考。

    此外,教育部提到,也開放各界申請下載108年教育部辦理台灣台語語音語料庫計畫成果,包括語料庫、音檔及AI工具模型等。內容包含2萬6千餘句的文字,每句有4至6位發音人共6種聲音來源的音檔總計208小時,另有語音處理的AI工具模型。

    教育部說明,為大規模保存台灣台語語料,精進既有成果,自前年11月起委請陽明交通大學辦理新一階段的台灣台語語料庫建置計畫,預計至後年10月完成,將擴大建置約文字語料2000萬字及口語語料3000小時的語料庫,並持續提高語音處理AI工具的實用效能,期望為本土語言研究、教學資源建置以及語言AI系統的開發貢獻更多力量。

    不用抽 不用搶 現在用APP看新聞 保證天天中獎  點我下載APP  按我看活動辦法

    圖
    生活今日熱門
    看更多!請加入自由時報粉絲團

    網友回應

    載入中
    此網頁已閒置超過5分鐘,請點擊透明黑底或右下角 X 鈕。