廈門日報訊(記者 林露虹)近日,在世界級聲紋識別競賽中,廈門火炬高新區(qū)企業(yè)快商通拔得頭籌。根據(jù)VoxSRC國際說話人識別競賽(聲紋識別競賽)最新公布的榜單顯示,快商通Kriston AI團隊以4.9%的說話人日志錯誤率,位列榜單第一,展現(xiàn)了中國人工智能技術(shù)的硬核實力。
VoxSRC比賽由英國牛津大學(xué)、韓國NAVER公司、美國斯坦福國際研究院語音技術(shù)與研究實驗室和麻省理工學(xué)院林肯實驗室組織發(fā)起,是聲紋識別領(lǐng)域有影響力和權(quán)威性的國際賽事,每年都吸引大批業(yè)界精英參與。
據(jù)快商通聯(lián)合創(chuàng)始人李稀敏介紹,VoxSRC比賽采用隨機抽題、提交回答后系統(tǒng)自動打分的形式進行,榜單類似體育運動員的積分排名榜,定期更新。“簡單理解,比賽題目是多個人說話的語音數(shù)據(jù)包,參賽團隊開發(fā)的AI系統(tǒng)需根據(jù)語音數(shù)據(jù)來判斷‘誰在什么時候說話’。題目設(shè)置了不少干擾項,語音長短不一,數(shù)據(jù)來源也五花八門,這對參賽者來說是不小的挑戰(zhàn)。”
快商通的機器人是如何精準“揪”出說話人的?李稀敏說,團隊訓(xùn)練機器人主要有兩類技術(shù)路線:一是從“你一言我一語”的多人對話中找出說話人的“轉(zhuǎn)折點”;二是基于神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí),給機器人“喂食”大量的語音數(shù)據(jù),以數(shù)據(jù)驅(qū)動來提升機器人識別水平。
快商通是我市自主培育的人工智能企業(yè)。經(jīng)過十多年的積累,快商通Kriston AI團隊在聲紋識別、語音識別等人工智能領(lǐng)域創(chuàng)造了多項行業(yè)領(lǐng)先的技術(shù)創(chuàng)新,擁有發(fā)明專利超過500項。