“基于語音的解決方案結(jié)合了自然語言處理(NLP)以實現(xiàn)語言理解和情感認知,已被用于解決大流行期間出現(xiàn)的心理健康問題。”ETS人工智能實驗室執(zhí)行主任Narmeen Makhani說:“對客戶服務解決方案的需求不斷增加,加上勞動力短缺和供應鏈問題,也加速了企業(yè)采用和依賴基于人工智能的會話座席。這些座席幫助增強了客戶體驗,提高了客戶支持和語音識別工具的效率和定制化。”
事實上,對話式AI座席已成為大多數(shù)公司的主流。Makhani說,基于人工智能的語音技術(shù)的進步,例如設備上自動語音識別(ASR)、無文本模型和大型語言模型,為銀行、醫(yī)療保健和教育領域開辟了新的可能用例。
Read Speaker北美總裁Matt Muldoon對此表示贊同。“隨著酒店、汽車和客戶服務等垂直行業(yè)更廣泛地采用語音技術(shù),智能家居控制、體驗營銷和游戲等,其他垂直行業(yè)正在認識到在向用戶提供的產(chǎn)品中利用人工智能支持的語音技術(shù)的好處,”他指出。
Five9產(chǎn)品管理執(zhí)行副總裁Callan Schebella表示,過去幾年人工智能的進步“是爆炸性的”,F(xiàn)在你可以用語音識別來做一些幾年前只能在實驗室里才能做到的事情。“
“人工智能正在加速[Alexa和Siri等語音助手]的功能,因此,隨著時間的推移,Alexa和其他語音助手只會變得更聰明,”Netomi的創(chuàng)始人兼首席執(zhí)行官Puneet Mehta認為。“與此同時,對于公司而言,保護性人工智能正被廣泛采用,以通過自動化日常任務來降低業(yè)務成本、提升客戶服務并節(jié)省員工時間,使他們能夠承擔更多創(chuàng)造性任務。”
Gridspace的首席執(zhí)行官Evan Macmillan對此表示贊同。“商業(yè)客戶越來越了解對話式人工智能的可能性,并從全棧人工智能優(yōu)先產(chǎn)品公司尋求最佳解決方案,”他說。“企業(yè)也在以創(chuàng)紀錄的速度將語音工作負載轉(zhuǎn)移到云端,這為對話式人工智能和新流程自動化打開了大門。”
年度回顧
去年是人工智能和語音技術(shù)的關(guān)鍵一年,幾項突出的發(fā)展證明了這一點。一方面,Meta(Facebook)、谷歌和NVIDIA都加入了虛擬世界的潮流,推動了語音AI、計算機視覺、自然語言理解(NLU)和虛擬現(xiàn)實(VR)方面的創(chuàng)新,以創(chuàng)建能夠識別語音和與用戶交流。
麥肯錫發(fā)現(xiàn),如今56%的企業(yè)至少在一項業(yè)務功能中使用人工智能,高于2020年的50%。近三分之二的企業(yè)計劃在未來三年內(nèi)增加對人工智能的投資。
Gartner的一項調(diào)查發(fā)現(xiàn),36.3%的客戶服務領導者計劃到2023年部署人工智能。
市場增長--由對語音激活系統(tǒng)、語音虛擬助手和語音設備的需求增加推動--繼續(xù)飆升。
“隨著智能電器變得越來越普遍,企業(yè)利用人工智能來提高語音技術(shù)的準確性,更多的消費者將傾向于在日常生活中使用它。該研究還表明,由于語音和語音設備成本的下降、軟件開發(fā)的增加以及對具有語音功能的虛擬助理智能揚聲器的持續(xù)需求,市場將得到顯著采用,”Muldoon說。
然而,對于一些人來說,采用人工智能語音技術(shù)一直很困難,主要是由于缺乏基礎設施、技術(shù)限制和缺乏教育。
“許多人并沒有完全掌握人工智能的全部好處及其在工作場所的使用。像大多數(shù)新興技術(shù)一樣......人工智能對許多人來說似乎很復雜,而且它仍處于起步階段,”Mehta說。
Makhani認為,語音技術(shù)的準確性仍然是最大的挑戰(zhàn),尤其是對于非母語人士和兒童以及在有背景噪音的情況下。
“此外,許多主流的、基于人工智能的語音設備繼續(xù)傾聽用戶的聲音。需要繼續(xù)解決在保護用戶隱私的同時始終保持響應的挑戰(zhàn),以確保在人工智能的廣泛使用中滿足道德標準,”Makhani說。“隨著人工智能技術(shù)變得越來越人性化,虛假內(nèi)容將會激增。由于現(xiàn)在在某些地區(qū)可以大規(guī)模創(chuàng)建虛假內(nèi)容,這可能會產(chǎn)生可怕的結(jié)果。從積極的方面來說,這項技術(shù)也可以用來識別虛假內(nèi)容。”
數(shù)據(jù)隱私問題也繼續(xù)成為2021年的頭條新聞。
“在利用人工智能時,網(wǎng)絡安全和數(shù)據(jù)隱私仍然是公司面臨的最大風險,”Muldoon警告說。“公司需要明確傳達他們?nèi)绾伪Wo客戶的隱私和數(shù)據(jù),以幫助消費者更放心地使用這些解決方案,這有助于提高采用率,并幫助公司將AI擴展到其他業(yè)務功能以簡化運營。”
企業(yè)仍在適應由COVID引起的變化,語音技術(shù)可以幫助也可以阻礙。
“隨著遠程工作和虛擬活動被認為是新常態(tài),公司仍在努力解決如何更好地與消費者和客戶建立聯(lián)系和互動。語音到文本的用例--從交互式筆記到市政廳字幕--通過使信息可搜索、可訪問和可操作,使組織能夠最大限度地發(fā)揮其音頻和視頻文件的潛力。但是需要持續(xù)的教育來最大限度地發(fā)揮這種潛力,”Verbit首席營收官兼總經(jīng)理ArielUtnik說。
另一個持續(xù)的難題?在人工智能方面,企業(yè)往往會迷失方向。
“為了新技術(shù)而采用人工智能等閃亮的新技術(shù)可能很誘人,但提出一個有凝聚力的戰(zhàn)略對許多公司來說是一個問題,”Mehta說。“從小處著手,衡量,看看是否能在六個月內(nèi)開始看到影響。”
展望未來
大多數(shù)專家預測人工智能和語音未來會發(fā)生令人興奮的事情。
“在未來五年內(nèi),每個主要品牌都將擁有一個用于客戶服務的人工智能語音渠道,就像每個品牌都有一個網(wǎng)站一樣,”Schebella預測道。“就像在1990年代和2000年代初,當組織急于建立在線業(yè)務時,企業(yè)將有望擁有一個智能的對話界面,以滿足客戶對參與的期望。”
Mehta看到越來越多的公司轉(zhuǎn)向人工智能來提高客戶旅程的效率。“今天的人們需要真正輕松的支持和互動,雖然這主要通過聊天和消息傳遞,但正如我們所期待的那樣,支持、銷售和營銷方面的免提語音互動將會有巨大的增長,”他說。
Makhani認為,大型類語言模型以及多語言模型將變得更加普遍、易于訪問并與常規(guī)技術(shù)集成。
“它們將從大型科技公司手中的主要研究用途轉(zhuǎn)向工業(yè)用途。初創(chuàng)公司和去中心化倡導者將積極加速大型模型的廣泛可用性和使用。ASR和NLU將繼續(xù)模糊人類和虛擬化身之間的界限,從而促進沉浸式娛樂并加速現(xiàn)實世界的應用,例如虛擬世界中的教育和健康診斷。”
Makhani繼續(xù)說,語音助手將在課堂內(nèi)外的教育中發(fā)揮更大的作用。
“此外,世界各國政府的隱私法規(guī)將收緊人工智能,包括捕獲和存儲語音,尤其是關(guān)于未成年人的語音,從而加速設備上ASR、設備上模型部署和無文本模型的使用,”Makhani補充道。
Interactions的首席營銷官Jim Freeze對人工智能如何在2021年成為圍繞醫(yī)療創(chuàng)新的對話中不可或缺的一部分感到興奮--他預計這一運動會滾雪球。
“隨著大流行的后果越來越使醫(yī)院系統(tǒng)不堪重負,管理人員正在轉(zhuǎn)向?qū)υ捠饺斯ぶ悄茏鳛榻鉀Q方案,”Freeze說。“我預計這種對話式人工智能在醫(yī)療保健領域的趨勢將持續(xù)到2022年。”
期望人工智能變得更聰明,更能感知周圍環(huán)境,以檢測當?shù)丨h(huán)境。
“這將具有許多功能--抑制耳機中的噪音、警告我們周圍的事件、在沒有云幫助的情況下在本地執(zhí)行自然語言控制等等。語音AI最終將使用多個傳感器,根據(jù)聲音檢測和處理做出與上下文相關(guān)的復雜決策,”Knowles的AISonic邊緣處理器高級總監(jiān)Vikram Shrivastava預測。
最后,依靠語音在游戲和虛擬世界中傳播。
“全球估計有32.4億游戲玩家,游戲開發(fā)者可以利用語音技術(shù)在不依賴配音演員的情況下創(chuàng)建更好的角色聲音,并通過使用該技術(shù)增強可訪問性功能,確保各級玩家都能獲得最佳體驗,”Muldoon說。“此外,隨著虛擬世界的新采用,人機交互將變得更加無縫,并模糊現(xiàn)實與虛擬之間的界限。在這個空間中,作為個人,我們可以與我們喜歡的人和物品進行動態(tài)交互。在虛擬世界中,人工智能和語音技術(shù)對于確保人們擁有積極的體驗至關(guān)重要。”
聲明:版權(quán)所有 非合作媒體謝絕轉(zhuǎn)載
作者:Erik J.Martin
原文網(wǎng)址:
https://www.speechtechmag。com/Articles/Editorial/Features/The-2022-State-of-Artificial-Intelligence-151338.aspx