科技部今(25)日於台灣科技大學舉辦「AI語音數據資料集」上線發表會。首批開放400小時「科技大擂台 AI對話」競賽所使用的語音試題資料中,除了自行錄製的資料外,更結合內政部的警政署警察廣播電臺及教育部的國立教育廣播電臺提供相關語音資料,並由科技部指導、國家實驗研究院科技政策研究與資訊中心(STPI)拓建加值,成為高品質的數據集(Dataset)。此數據集公開釋出後,我國企業、學研界可免費取得授權,用於AI相關技術研發。

AI語音數據資料集是科技部結合內政部警政署警察廣播電台與國立教育廣播電台的相關資料,由科技部指導、國家實驗研究院的科技政策研究與資訊中心拓建加值,成為高品質數據集,

科技部政務次長許有進表示,這次挑戰AI在語意理解與語音對話上,能夠開發中文語音對話之核心技術。

科技部為此建立AI語音資料庫,並邀請台北科技大學副教授廖元甫協助資料標註。

IMAG6224.jpg

這次的資料集有400小時,可縮短開發者在發展語音過程中需要的標註人力與時間,降低相關技術發展門檻。

同日,結合2019年語音訊號處理研討會(SPEECH PROCESSING WORKSHOP 2019),共同舉辦「科技大擂台 AI對話」第二場賽後技術交流會,邀請Google臺灣董事總經理簡立峰分享自然語言處理與AI未來趨勢的看法、Taiwan AI Labs創辦人杜奕瑾、臺灣大學資訊工程學系教授,同時也是臺灣AI獨角獸沛星互動科技(Appier)首席科學家林軒田博士等,發表目前在AI與語音訊號處理的前瞻研究成果。另外,第一屆「與AI對話」的獲獎團隊:臺灣大學電資學院、華碩電腦、中央研究院等代表也應邀出席,和大家分享參賽經歷及比賽中使用的秘技。

arrow
arrow
    全站熱搜

    神探狐耳毛失 發表在 痞客邦 留言(0) 人氣()