9月9日,以“共驅AI,賦能未來”為主題的第一屆中國—東盟人工智能峰會在南寧成功舉辦。捷通華聲作為人工智能技術產業(yè)化的開拓者和領先者,受邀出席中國-東盟(華為)人工智能及軟件開發(fā)技術交流會。
捷通華聲副總經理于智彬發(fā)表“5G+AI:共建智能化產業(yè)互聯網”主旨演講,以下為演講內容:
現在AI已成為家喻戶曉的名詞,大家都知道人工智能,就是模仿人的各種能力的技術。讓機器“能說會聽、能看會認,能思考、會判斷,能行動”是AI追求的目標,也是我們捷通華聲2000年建立時的初衷和愿望。
在2010年前,人工智能已經過幾起幾落。1950年,AT&T推出Audry,實現首個可以識別10個英文數字的系統(tǒng);1997年IBM推出VIAVOICE——首個語音識別產品。當時大家很興奮,大呼語音識別時代到來了,但當試用之后發(fā)現識別效果不好,又大失所望。此后,直至2010年前,因為計算力有限、數據量不足、算法演進緩慢等原因,導致語音識別、圖像識別等AI技術一直未能產業(yè)化。
2000年成立之初,我們主要是做TTS和手寫識別技術。當時的TTS有些機械音,但它能代替人日日夜夜的辛苦重復工作。例如,全國各地高鐵站廣播、汽車站廣播、醫(yī)院叫號廣播等,都用了捷通華聲的TTS產品。手寫識別技術效果比較好,用在很多手機輸入法上,還賣給了日本的手寫板生產廠商,歐美的各種高端轎車車機。
2008年,個人電腦開始大規(guī)模應用,2010年,互聯網快速發(fā)展,隨之產生了大量的數據。此時,高性能計算、機器學習也發(fā)展到了新的水平,開始可以支撐語音識別、圖像識別等人工智能技術的發(fā)展了。
第一次轉型:抓住機遇,發(fā)展全方位AI技術
當發(fā)覺到這個機遇時,捷通華聲下定決心,果斷轉型,準備發(fā)展全方位AI技術。
2011年,捷通華聲推出國內外首個全方位AI開放平臺—靈云,致力于讓機器“能說會聽、能寫會看、能辨音會認人、能思考會判斷”。
在發(fā)展AI技術的路上,很多前沿計算理論,需要與學術界共同研究。2012年,我們開始與清華大學聯合研發(fā)AI算法。我們應用AI技術,對接市場需求,開發(fā)產品,并用產業(yè)應用中產生的數據,去訓練提升AI水平,形成產學研用的良性循環(huán)。
隨著與清華大學AI技術聯合研究的深入,2013年,清華大學產業(yè)基金入資捷通華聲,成為捷通華聲第二大股東,并共同確立“靈云科技源自清華”的戰(zhàn)略合作。2014年,捷通華聲與清華大學共同創(chuàng)建清華靈云人工智能研究中心,中國科學院院士、清華大學人工智能研究院院長,張鈸院士擔任研究中心首席科學家。2015年,捷通華聲與清華大學海峽研究院在廈門共同創(chuàng)建清華靈云人工智能研究中心。通過與清華大學的科研合作,靈云AI技術學術研究保持全球領先,各項技術快速進步。
靈云AI技術,快速產業(yè)化應用
隨著AI技術的不斷提升,各種產業(yè)需求爆發(fā)式增加,AI技術開始快速產業(yè)化。
最經典的一個應用場景,就是客服中心。銀行、保險、航空等大型企業(yè),有海量的客戶,需要建立大型客服中心來提供業(yè)務咨詢、業(yè)務辦理等服務。為了控制客服中心人力成本,減少客戶咨詢長時間排隊等情況,農行、中信銀行、郵儲銀行、太平洋保險、國航、深航等,紛紛引進捷通華聲的智能客服。
以中信銀行為例,在微信公號、和官網接入智能客服,可以為用戶提供借記卡、信用卡、養(yǎng)老金等全業(yè)務的智能咨詢、辦理服務。智能客服問答準確率超90%,從2014年上線至今,日均訪問量50萬+,人工坐席節(jié)省125人/年。
此外,客服中心的電話服務熱線,承載著大量用戶咨詢,人工服務壓力和成本巨大,客戶打電話經常打不進來、或長時間等待。
北京國稅當時找到我們,看如何在不增加坐席人數的情況下,提供通暢的稅務咨詢服務。捷通華聲給稅務局開發(fā)了電話客服機器人、微信智能客服,和營業(yè)廳實體服務機器人。稅收政策、稅務登記、一證通、優(yōu)惠政策、營改增問題、三證合一等問題都可以向機器人咨詢,為納稅人提供永不占線、方便快捷的稅務咨詢服務。
銀行、電信公司的服務熱線,剛打進去是IVR按鍵導航,層級深,選項多,很多人進去直接按0轉人工,導致人工服務壓力巨大,而85%的客戶咨詢,都是常見問題。我們給光大銀行95595熱線做的智能語音導航,客戶打電話進去后,常見的業(yè)務問題,機器人可以直接回答;需要轉人工的咨詢,機器人會反問補全,確認好業(yè)務種類后,精準轉接給對應的坐席組。目前光大銀行智能語音導航,日接聽量20萬通,回答準確率91%,轉人工比例下降至20%,轉人工等待時長下降30%,轉人工坐席接起率提升至99.78%,取得了良好的業(yè)務效果。
類似地,手機銀行APP,也有很多功能項,菜單層級深。為了方便用戶使用,招商銀行引進捷通華聲智能語音技術,為招商銀行掌上生活APP打造智能語音助手,查賬單、轉賬、買理財,說出來即可,還可以咨詢金融知識。這在提升用戶使用體驗和粘度的同時,大幅降低了中老年人等群體使用APP難度。
除了承接用戶咨詢,客服中心還有大量的外呼工作。例如銀行的信用卡逾期催繳、貸款業(yè)務推廣等。2016年,我們做了國內第一個智能語音外呼機器人產品,某大型股份制銀行信用卡催收智能外呼機器人:2016年上線,成都分公司率先使用機器人,催收回款率提高30%,排名全國第一。月均節(jié)約人力成本120萬,截止2018年12月底,累計節(jié)約人力成本4500萬,節(jié)省了巨大的人力成本。
在近期給某知名互金公司上線的催收機器人,上線30天后,外呼回款率與純人工催收效果一致,即機器人催收達到真人水平。
隨著AI的深入應用,客服中心想用AI技術來督促坐席提升服務質量。某大型國企,引進捷通華聲智能語音分析系統(tǒng),將通話全量轉寫為文字并用規(guī)則進行自動打分,質檢覆蓋率從3%提升至100%,全面督促坐席提升服務質量,有效提升客戶服務滿意度。與此同時,對客服大數據進行挖掘與分析:業(yè)務熱點、業(yè)務發(fā)展趨勢,可視化展現;通過重復來電分析、關聯分析、異常分析等,挖掘客戶投訴、多次來電原因。
在質檢客服的同時,靈云智能語音分析系統(tǒng)還可以輔助坐席的實時通話。2016年,捷通華聲為某大型保險公司做了國內首款實時智能語音分析系統(tǒng)。近萬名坐席,通話實時語音轉寫,坐席側語音識別率超90%;如果坐席出現未按流程對話、保單免責條款未說明、詆毀同業(yè)、假冒促銷等情況,系統(tǒng)會實時發(fā)出違規(guī)提醒;系統(tǒng)也會實時分析客戶說話內容,給予坐席產品類型建議、險種內容、挽回話術、常見業(yè)務知識等話術輔助。
系統(tǒng)上線后,有效規(guī)范了保險電銷服務,降低了新人成單難度,提升了整體電銷成單率。
除了客服中心,物聯網場景也對智能語音交互技術有巨大的需求,如大家熟知的智能音箱、兒童智能陪伴機器人等。我們給機頂盒廠商做智能語音助手,換頻道、搜電影,可以直接說出來,為用戶創(chuàng)造體驗更友好、更高效的人機交互方式。
在提供方案產品的同時,我們給眾多合作伙伴、政企客戶提供基礎人工智能能力平臺,助力其打造智能化的業(yè)務應用。靈云全智能能力平臺-AICP,提供語音識別、語音合成、聲紋識別、OCR、人臉識別、視頻分析、語義理解、機器翻譯、數據挖掘等全方位AI技術能力,是靈云AI技術賦能百業(yè)的關鍵。
AI技術產業(yè)應用,給企業(yè)減少了巨大的人力成本,實現了業(yè)務的跨越式升級。AI已成為推動產業(yè)智能化升級的關鍵動力。
AI技術產業(yè)化的思考
下面分享一些我們捷通華聲在AI技術產業(yè)化中的思考:
第一,AI技術的發(fā)展,計算理論的演進,算法的升級是關鍵;體量大、分布合理、干凈的數據模型是基礎;給客戶提供學習訓練,例如NLU、ASR等的數據訓練,能有效提升AI技術在產業(yè)內的應用效果。另外,AI技術的發(fā)展,離不開產業(yè)界的包容,即客戶對技術發(fā)展階段性水平的理解,這為AI公司的成長進步提供了土壤。
第二,AI技術融合應用趨勢已非常明顯。例如我們推出的車載輸入法,用戶可以用語音、手寫、鍵盤輸入,讓車載輸入更安全快捷;我們的靈云手機輸入法,支持語音、手寫、鍵盤輸入,中英、中維翻譯,OCR拍照輸入、跨屏輸入、語音速記等功能,滿足用戶多種場景的輸入需求。
語音互譯軟件,除了綜合應用語音識別、機器翻譯、語音合成、OCR技術,各項技術還要求是支持多種語言的。銀行大廳服務機器人,要求功能更廣泛,智能語音交互,人臉識別、指紋識別驗證,OCR拍照錄入材料等,各項技術融合應用,為用戶提供更便捷的服務。
同樣的,我們在做的辦案智能化筆錄(中維雙語)場景,需要語音識別(普通話、維吾爾語)、機器翻譯(中翻維、維翻中)、語音合成(普通話、維吾爾語)、OCR拍照識別(中文、維吾爾文)融合應用,才能提供完整的服務。
AI技術融合應用的背后,就是人工智能的本質——模仿人的能力。從感知、認知、到行動,越多AI技術融合應用,發(fā)揮威力越強大。
第三,AI產品也趨于融合服務。例如,我們在客服中心推的靈云全智能客服解決方案(AICC),基于靈云全智能能力平臺(AICP),運用行業(yè)領先的語音識別、語音合成、語義理解以及大數據分析等AI技術,為客服中心提供一站式的智能客服、智能語音導航、智能語音外呼、語音質檢分析等智能解決方案。
- 智能客戶服務:智能客服、智能語音導航在微信、網頁、APP、電話等多種渠道,為用戶解答咨詢、辦理業(yè)務
- 智能語音外呼:外呼機器人,快速完成海量電話的外呼,高效完成客戶回訪、金融催收、營銷推廣等工作
- 智能語音分析:實現100%全覆蓋的智能語音質檢,督促坐席提升服務質量;對坐席通話進行實時話術輔助,助力提升電銷成單率;對客服大數據進行挖掘分析,助力業(yè)務決策。
同樣,在公檢法辦案語音筆錄場景,通過共用基礎AI能力平臺,支撐多場景業(yè)務應用:為詢問室提供訊問智錄系統(tǒng),實現雙人對話轉寫;為會場提供智會系統(tǒng),實現多人會議轉寫,和講話實時上屏;在辦公室,提供PC語音輸入法,用語音快速錄入文字信息;在外出執(zhí)勤現場,用便攜式訊問筆錄一體機,快速生成訊問筆錄,多項AI產品融合應用。
下一次轉型:AI云服務
展望未來,下一次轉型是什么?5G、云計算快速發(fā)展,政企單位接受公有云服務的意愿度漸漸提升。下一次轉型,AI云服務,將是巨大的機遇。
之前做項目有很多難點。對供應商來說,大量POC、交付項目,在全國各地大量部署,部署、對接調試時間長,人力、差旅成本巨大,散點運維,無法統(tǒng)一;對需求方來說,需要準備硬件環(huán)境(如ASR用的大內存服務器,機器翻譯用的GPU),需要投入人力配合部署、調試,部署拖長了項目周期,也間接性增加了采購成本。
2018年,靈云AI入駐華為云,為產業(yè)界提供AI技術能力與產品方案云服務。
我們開始了一個轉變,從部署各種能力、系統(tǒng)產品,轉為向客戶提供AI能力與產品服務的快速調用,讓每一家企業(yè)都能快速接入人工智能。
5G+云計算,天生助力AI云服務發(fā)展。5G傳輸,滿足音頻、圖像、視頻等傳輸量大,實時語音識別、OCR、視頻識別等要求低時延的要求;云計算,更能好的運行深度學習算法,滿足語音識別等模型庫巨大,圖像識別、機器翻譯等需要GPU計算的需求。
例如,某大型保險公司項目,之前由于網絡傳輸速率、延時,不能滿足通話實時語音識別需求,超百臺服務器,進行異地多活部署。有了5G后,可以轉變?yōu)榧薪y(tǒng)一部署,這可以減少硬件計算資源空置,減少運維管理投入,降低整體建設成本。
某警務外出辦案語音轉寫項目,以前都是需要大內存筆記本電腦,或便攜式服務器部署ASR,成本高。換5G后,可以用5G調用公安云語音識別能力,普通筆記本聯網即可應用。
某政府大規(guī)模翻譯項目,5G,帶寬大、低延時,滿足辦公實時傳輸大量語音、圖像等數據需求;機器翻譯、圖像識別等需要的GPU計算資源,由云平臺統(tǒng)一提供,提高硬件資源利用率。相較多點部署GPU服務器,大幅降低成本。
整體來說,用5G+云平臺方式提供AI服務,具備諸多優(yōu)勢:客戶接入快、成本低,計算資源利用率高、運維統(tǒng)一,供應商成本低,AI更易推廣。
AI應用+云計算+5G,將構建一個更智能、更高速、算力更強大的智能化產業(yè)互聯網,服務各行各業(yè)。
感謝大家的聆聽,歡迎學習交流!