為了解決身份認證問題,生物特征識別技術被認為是解決方案的未來之星。但是,近期有關指紋、人臉和虹膜等分別被假冒攻擊的報道讓人有些擔憂。2016年,西班牙巴塞羅那舉辦了MWC2016世界移動通信大會,在會上《華爾街日報》記者利用軟膠模輕松解鎖iPhone指紋密碼;2016年,美國斯坦福大學研發(fā)的人臉跟蹤軟件Face2Face攻破“人臉”識別;2015年,著名的混沌計算機俱樂部的安全研究員Jan Starbug接受采訪時稱僅需用通過谷歌搜索找到的高清晰度圖像,就可以使用一些虹膜掃描工具進行攻擊……科研工作人員投入大量精力研究活體檢測技術以對抗這些攻擊,并且取得一些可喜的進步,但是往往因活體檢測成本太高而無法在近期達到實用化程度。
生物特征分為兩類,一類是生理特征,諸如指紋、人臉、虹膜等;一類是行為特征,諸如聲紋、簽名、姿勢等。在防假冒攻擊方面,屬于行為特征的聲紋具有天然的優(yōu)勢。
聲音信號具有“形簡意豐”的特點。它簡單得僅是一維信號,但豐富得包含口音、語種、語義、情感、性別、說話人等各種信息。
綜合利用對這些信息的識別技術,可以有效地提供防錄音、防錄音拼接、防脅迫等的解決方案。
語音假冒被認為是聲紋識別的一大挑戰(zhàn)。語音假冒的種類包括人類模仿語音、機器合成語音、機器模擬語音、錄音重放等,其中公認最難檢測的是錄音重放,因為重放語音本來就是那個人的語音。
近期,清華大學-得意音通聲紋處理聯(lián)合實驗室經過攻關,綜合利用信號處理、聽覺模型、模式識別等一系列人工智能技術,成功研制出最先進的錄音檢測技術。在一個含有65人,涉及當今大部分主流手機型號,共計3萬多次的錄音攻擊及檢測實驗中,錄音檢測的等錯誤率低至3.95%。該錄音檢測技術是基于動態(tài)碼的“得意聲密保”方案的一次升級,更加安全和可靠,真正做到“別人即使竊取了密碼也無法闖入”。
清華大學-得意音通聲紋處理聯(lián)合實驗室未來的計劃是充分利用語音“形簡意豐”的先天優(yōu)勢,充分利用清華大學語音和語言技術中心30多年積累的先進的語音和語言處理技術及人工智能技術,實現(xiàn)“統(tǒng)一語音平臺”,以一句話解決所有問題,包括:理解用戶指令(利用語音識別技術知道用戶要做什么)、識別用戶身份(利用聲紋識別技術確認用戶身份)、確認用戶是否受到脅迫(利用情感檢測技術判斷用戶是否受到脅迫)、判斷用戶是否被錄音假冒(利用錄音檢測技術阻止錄音假冒闖入)等,以在提高系統(tǒng)安全度的同時提升用戶體驗。