為此,UNIT帶來了全新的語音語義一體化解決方案,幫助企業(yè)解決語音交互過程中的難題。
【電話客服場景下語音語義一體化解決方案】
語音語義一體化是針對電話客服對話場景的技術(shù)方案,可用于呼叫中心智能客服等業(yè)務(wù)。整個方案包含以下內(nèi)容:
(1)降低集成開發(fā)成本
提供語音識別、語義理解、對話流程控制、知識庫、語音合成的打通方案,全雙工對話能力,一體化的部署方案,省去開發(fā)者對各環(huán)節(jié)自行調(diào)用、拼裝的學(xué)習(xí)成本以及二次開發(fā)成本。
。2)標(biāo)準(zhǔn)協(xié)議快速接入
提供基于unimrcp框架開發(fā)的mrcpserver服務(wù)接入包,通過標(biāo)準(zhǔn)協(xié)議適配不同呼叫中心設(shè)備(主流的freeswitch、avaya、及基于mrcp標(biāo)準(zhǔn)協(xié)議自主研發(fā)的呼叫中心設(shè)備)。
。3)場景定制服務(wù)提升效果
方案中自帶基于百度大腦呼叫中心下的通用ASR、語義糾錯,打斷策略,TTS模型,也可以基于開發(fā)者的業(yè)務(wù)場景,提供模型定制訓(xùn)練服務(wù),定向提升業(yè)務(wù)準(zhǔn)確率。
(4)極少量開發(fā),輕松實現(xiàn)對話流程
提供Taskflow配置管理能力,開發(fā)者可在梳理業(yè)務(wù)流程后,通過少量代碼快速配置對應(yīng)的對話流程,后續(xù)可直接零代碼在UNIT平臺上進(jìn)行拖拽式配置。
【語音語義一體化方案解讀】
。1)語音識別ASR
采用領(lǐng)先的百度語音技術(shù),實時將音頻流轉(zhuǎn)識別出文本,并自動識別斷句。
。2)全雙工對話能力
建立通用機(jī)制,組織多模塊協(xié)同工作,實現(xiàn)雙通道數(shù)據(jù)(文本、事件信號)實時分發(fā)及處理。
。3)糾錯
根據(jù)場景相關(guān)詞匯生成糾錯候選,利用GBDT模型對獲選打分排序,最后通過beamsearch解碼出最優(yōu)糾錯結(jié)果。
(4)打斷
采用分類模型實現(xiàn),判斷是否滿足打斷條件,并下發(fā)打斷信號,可支持用戶自定義語料的模型訓(xùn)練。
。5)靜默及反問
在設(shè)定時間內(nèi)用戶未回復(fù)情況下,機(jī)器人可自動反問?芍С钟脩魧r間條件、機(jī)器人反問話術(shù)進(jìn)行配置。
。6)掛機(jī)、轉(zhuǎn)人工
定義標(biāo)準(zhǔn)事件信號:掛機(jī)、轉(zhuǎn)人工。用戶可通過配置、或簡單二次開發(fā)完成判斷條件的設(shè)定。
。7)對話理解
基于UNIT強(qiáng)大的語義理解能力,從實時文本中,解析用戶意圖。
。8)對話邏輯引擎
以可編程的方式構(gòu)業(yè)務(wù)建對話邏輯。
。9)語音合成TTS
基于深度神經(jīng)網(wǎng)絡(luò)技術(shù),提供高度擬人,流暢自然的語音合成服務(wù),便于應(yīng)用、設(shè)備開口說話,更具個性。
【如何獲取語音語義一體化能力】
開發(fā)者可以進(jìn)入UNIT官網(wǎng)——解決方案——語音語義一體化方案頁面,了解技術(shù)詳情并體驗真實對話樣例。https://ai.baidu.com/unit/v2/static/voice
1、方案了解
2、真實對話樣例的體驗