欧美,精品,综合,亚洲,好吊妞视频免新费观看,免费观看三级吃奶,一级a片女人自慰免费看

 首頁(yè) > 新聞 > 專家觀點(diǎn) >

2016語(yǔ)音技術(shù)產(chǎn)業(yè)一覽之語(yǔ)音引擎

2016-05-31 10:53:09   作者:   來(lái)源:CTI論壇   評(píng)論:0  點(diǎn)擊:


  CTI論壇(ctiforum.com)(編譯/老秦): 去年,我們報(bào)告了語(yǔ)音作為一種消費(fèi)現(xiàn)象終于做回了它自己。自從2011年大多數(shù)行業(yè)引入了蘋果的智能助手Siri以來(lái),這個(gè)行業(yè)被一致認(rèn)為將出現(xiàn),分析人士認(rèn)為,衡量經(jīng)濟(jì)增長(zhǎng)的指標(biāo)可能會(huì)發(fā)生變化。寄希望于明年引入語(yǔ)音引擎到移動(dòng)設(shè)備上的重大影響,語(yǔ)音引擎的復(fù)合年增長(zhǎng)率(CAGR)達(dá)到了22.07%。
\
  “只有少數(shù)公司收取許可費(fèi)用,”Opus Research創(chuàng)始人兼首席分析師Dan Miller說(shuō)。“這曾經(jīng)是IVR模式。只有少數(shù)公司仍然這樣做。相比之下,蘋果的語(yǔ)音識(shí)別通過(guò)出售更多的手機(jī)增加了收入。谷歌則通過(guò)非常準(zhǔn)確的語(yǔ)音識(shí)別應(yīng)用這樣一種方式增強(qiáng)了他們的廣告收入。”
  另一方面,全球行業(yè)分析師最近預(yù)測(cè),面容和語(yǔ)音生物識(shí)別市場(chǎng)到2020年將達(dá)到47億美元,這是由于在國(guó)防、跨國(guó)銀行和醫(yī)療行業(yè)日益增長(zhǎng)的需求而導(dǎo)致的。這些預(yù)測(cè)包括專注于語(yǔ)音技術(shù)多年的行業(yè)領(lǐng)導(dǎo)者,像Sensory公司和Nuance。
  隨著主要的消費(fèi)品牌開(kāi)始進(jìn)入市場(chǎng),2016年的建議是,雖然語(yǔ)音識(shí)別技術(shù)的增長(zhǎng)越來(lái)越強(qiáng)勁,但是這種增長(zhǎng)獨(dú)立于其它的產(chǎn)品或服務(wù),這可能導(dǎo)致由于以前并沒(méi)有進(jìn)入這一市場(chǎng)的大公司的進(jìn)入而放緩,例如微軟、谷歌、和亞馬遜等。
  消費(fèi)者語(yǔ)音
  “因?yàn)閬嗰R遜的Echo這款產(chǎn)品,讓我看到了這項(xiàng)技術(shù)在家庭環(huán)境中的滲透,”Conversational Technologies總裁黛博拉·達(dá)爾(Deborah Dahl)說(shuō),他指出語(yǔ)音在消費(fèi)者層面是用戶接口界面(UI)的理想候選人:“語(yǔ)音設(shè)備正變得更聰明。”
  盡管亞馬遜拒絕透露Echo的具體銷售數(shù)字,而嵌入它的語(yǔ)音技術(shù)的無(wú)線揚(yáng)聲器是亞馬遜最暢銷的產(chǎn)品,在Black Friday上售價(jià)超過(guò)100美元。
  Echo揚(yáng)聲器議與亞馬遜專有的IVR助理Alexa一樣,它們?cè)试S客戶參與與亞馬遜相關(guān)的活動(dòng),范圍從可以在亞馬遜Prime上聽(tīng)音樂(lè)到可以在客戶愿望列表中下單。此外,它可以控制各種設(shè)備,包括WeMo、飛利浦Hue、SmartThings、Insteon和Wink等,并提供開(kāi)發(fā)人員可以使用的應(yīng)用程序編程接口(API)。
  Alexa可能是亞馬遜2013年收購(gòu)Ivona技術(shù)后的產(chǎn)品,這種收購(gòu)和實(shí)現(xiàn)模式恰恰反映了當(dāng)前語(yǔ)音市場(chǎng)的復(fù)雜性。
  達(dá)爾(Dahl)和米勒(Miller)都預(yù)測(cè)未來(lái)消費(fèi)者語(yǔ)音市場(chǎng)發(fā)展的中心在解決互操作性的問(wèn)題上。
  “看看那些針對(duì)物聯(lián)網(wǎng)而開(kāi)發(fā)出來(lái)的產(chǎn)品是有趣的,”達(dá)爾(Dahl)說(shuō)。“Echo正在被集成到設(shè)備上用于控制功能,我相信Jibo(由麻省理工學(xué)院私人機(jī)器人研究小組主任辛西婭。布雷西亞牽頭的采用眾籌方式的智能輔助機(jī)器人)也將是一樣。但是這些生態(tài)系統(tǒng)如何與另一個(gè)兼容?例如,蘋果公司有一個(gè)家庭環(huán)境的生態(tài)系統(tǒng)。消費(fèi)者會(huì)得到嗎?他們將集成Echo嗎?”
  米勒(Miller)聲稱,由于專利封鎖將會(huì)有斷點(diǎn)。“一些將關(guān)閉,”他說(shuō)。“蘋果是非常封閉的。但是你會(huì)看到共享。例如,Siri需要跟其他機(jī)器人交談以便預(yù)定晚餐,或?qū)ふ疑唐泛头⻊?wù)。這應(yīng)該是發(fā)展的方向。”
  語(yǔ)音API
  語(yǔ)音識(shí)別現(xiàn)在逐步與自然語(yǔ)言理解相輔相成,2016年這兩方面的發(fā)展將會(huì)遇到大數(shù)據(jù)問(wèn)題。
  “語(yǔ)音識(shí)別的準(zhǔn)確率僅在過(guò)去的16個(gè)月開(kāi)始比以往任何時(shí)候都要好,”米勒(Miller)說(shuō)。
  “在硅谷巨頭們之間將會(huì)朝著共享努力的方向前進(jìn),”他繼續(xù)說(shuō)道,并與達(dá)爾(Dahl)一起舉了Facebook對(duì)Wit。ai的收購(gòu)的例子,Wit。ai是一款允許開(kāi)發(fā)人員構(gòu)建語(yǔ)音接口的API。Facebook與VirtuOz相比一直保持著API的開(kāi)放,VirtuOz是語(yǔ)音控制虛擬助理的先行者,由來(lái)自于Wit。ai的Alexandre Lebrun所創(chuàng)立,并于2013年賣給了Nuance。
  達(dá)爾(Dahl)還提到微軟LUIS(語(yǔ)言理解智能服務(wù)),IBM Watson認(rèn)知計(jì)算套件和Api。ai,作為軟件開(kāi)發(fā)人員工具包,作為獨(dú)立程序員將語(yǔ)音識(shí)別技術(shù)添加到他們的應(yīng)用程序當(dāng)中。
  她指出,離線語(yǔ)音識(shí)別是一個(gè)新興領(lǐng)域。“在這個(gè)領(lǐng)域中Sensory是真正的領(lǐng)袖,”她說(shuō)。“他們驅(qū)動(dòng)市場(chǎng)進(jìn)入大詞匯應(yīng)用。”Sensory和較小的德國(guó)公司Linguwerk專注于低內(nèi)存和低能耗的準(zhǔn)確語(yǔ)音識(shí)別技術(shù)。
  智能化企業(yè)助理
  在語(yǔ)音消費(fèi)者市場(chǎng)找到了自身發(fā)展道路的同時(shí),企業(yè)情報(bào)系統(tǒng)繼續(xù)發(fā)展。在Gartner今年的研討會(huì)上分析師預(yù)測(cè),到2018年,45%增長(zhǎng)最快的企業(yè)將減少員工數(shù)量而用智能機(jī)器代替,致力于IVR和自言語(yǔ)言理解技術(shù)的開(kāi)發(fā)人員為企業(yè)的這一想法鋪平了道路。
  米勒(Miller)稱,約有15%的企業(yè)情報(bào)系統(tǒng)2015年已經(jīng)在某種程度上實(shí)現(xiàn)了自動(dòng)語(yǔ)音,2016年這一比例將持續(xù)增長(zhǎng)。
  “你會(huì)看到像NextIT、Creative Virtual、[24]7和Intelliresponse這樣的供應(yīng)商,出售一些會(huì)話資源可以用來(lái)當(dāng)客戶或潛在客戶致電呼叫中心的時(shí)候回答問(wèn)題,根據(jù)支持自動(dòng)客戶助手做IVR曾經(jīng)做的事情,”他說(shuō),挑出行業(yè)的領(lǐng)導(dǎo)者Nuance作為領(lǐng)跑者。“Nuance使用NinaWeb和NinaMobile作為微分器。這兩款產(chǎn)品都是自然語(yǔ)言的,支持聊天,主要是語(yǔ)音應(yīng)用。”達(dá)爾(Dahl)表示同意,并認(rèn)為Openstream的EVA可以作為一個(gè)候選,在制訂他們的客戶交互策略時(shí)增加智能輔助功能。
  米勒(Miller)也提到了Interactions,一家CRM供應(yīng)商,它收購(gòu)了AT&T Watson,包括全自動(dòng)語(yǔ)音識(shí)別功能,TTS(語(yǔ)音合成)和語(yǔ)音生物識(shí)別引擎。
  其他的發(fā)展和預(yù)測(cè)
  像Echo和Siri之所以如此之快的變得如此之好的部分原因,是因?yàn)橛?jì)算能力已經(jīng)開(kāi)始使深度學(xué)習(xí)成為可能,“達(dá)爾(Dahl)說(shuō)。”在過(guò)去的幾年中計(jì)算機(jī)科學(xué)家除了能夠在輸入和輸出之間分層之外,他們又重新回到了神經(jīng)網(wǎng)絡(luò)的理念上。這使訓(xùn)練系統(tǒng)變得簡(jiǎn)單,而過(guò)去必須非常辛苦地合在一起。在語(yǔ)音情況下,人們不得不數(shù)字化訓(xùn)練數(shù)據(jù)的話語(yǔ)。“
  達(dá)爾(Dahl)還指出來(lái)自于W3C的狀態(tài)圖XML的出現(xiàn)。”應(yīng)用程序很好地基本上控制了對(duì)話。我希望一旦完成,它將能夠提高對(duì)話處理。“
  米勒(Miller)認(rèn)為語(yǔ)音生物識(shí)別技術(shù)應(yīng)用在專有身份驗(yàn)證時(shí)變的更集成化了。”例如,在蘋果的iPhone 6S上,Siri的叫醒是個(gè)性化的。一旦我說(shuō)“嘿,Siri”三次,我可以用這來(lái)叫醒,但我的妻子不能。這就是開(kāi)始使用類似語(yǔ)音生物測(cè)定技術(shù),個(gè)性化應(yīng)用。將你的聲音用來(lái)驗(yàn)證你的公民身份,附帶上你所有的權(quán)利和信用,這還有很長(zhǎng)的路要走。一旦實(shí)現(xiàn),這將創(chuàng)造出一個(gè)非常肥沃的電子商務(wù)領(lǐng)域。“
   聲明:版權(quán)所有 非合作媒體謝絕轉(zhuǎn)載

相關(guān)閱讀:

分享到: 收藏

專題