2016語音技術(shù)產(chǎn)業(yè)一覽之輔助技術(shù)

2016-05-30 09:21:23 作者：來源：CTI論壇評論：0 　點擊：

2016語音技術(shù)產(chǎn)業(yè)一覽之智能虛擬助理（IVAs）

　　CTI論壇(ctiforum.com)（編譯/老秦）: 人類的聽、說、看的能力是上蒼賜予我們的禮物，而聽力受損，語言障礙和部分或全部失明是人類每天都要面臨的挑戰(zhàn)。語音識別技術(shù)正在幫助解決大多數(shù)情況下的這些問題。

　　這些幫助改善“聽、說、看”能力的技術(shù)被人們寄予厚望，尤其在老齡化日益嚴(yán)重的今天。隨著年齡的增長，越來越多的人開始發(fā)生這些類型的障礙。

　　更具體地說，根據(jù)美國疾病控制和預(yù)防中心（CDC）的數(shù)據(jù)，美國每年大約有750000人中風(fēng)，又根據(jù)美國心臟協(xié)會（AHA）的數(shù)據(jù)，由此每年造成的死亡人數(shù)為129000.其他的數(shù)據(jù)則聲稱美國每年中風(fēng)數(shù)高達(dá)100萬。中風(fēng)在AHA的人類死亡原因中位列第五。根據(jù)美國國家失語癥協(xié)會和阿德勒失語癥中心的數(shù)據(jù)，目前美國的失語人數(shù)分別是100萬和200萬。根據(jù)美國國家失語癥協(xié)會的數(shù)據(jù)，每年有超過80000的美國人被診斷為失語癥。根據(jù)疾病防治中心的說法，目前有超過1000萬的美國人患有認(rèn)知障礙。醫(yī)療保健的支出在美國和世界各地都呈上升趨勢，所以有更多的人比以往任何時候都更加需要獲得“聽、說、看”輔助設(shè)備。

　　歷史最悠久、最公開的語音技術(shù)是語音合成技術(shù)，世界著名的物理學(xué)家和作家斯蒂芬·霍金利用這種技術(shù)進(jìn)行交流�？▋�(nèi)基梅隆大學(xué)消費者科學(xué)教授Alan Black說，霍金使用的是某些30年前開發(fā)的基本系統(tǒng)，這些系統(tǒng)是為了那些失去了他們的聲音和那些從來沒有聲音的人們而開發(fā)的。

　　通過使用一個嵌入在他的臉頰中的小傳感器激活，霍金“類型”字符和數(shù)字通過一個語音生成設(shè)備（SGD）產(chǎn)生出經(jīng)過合成過的語言。霍金的設(shè)備是由now-defunct Speech Plus。開發(fā)的。這家公司是目前這類設(shè)備的最大制造商，位于美國的匹茲堡。它是基于DynaVox公司的LLC系統(tǒng)，一家Tobii科技公司。

　　霍金的設(shè)備使用了一個具有美國口音的機(jī)器人聲，而霍金是英國人，DynaVox公司和其他公司提供各種各樣的聲音，以便可以合成個性化的語言。

　　租賃你自己的聲音

　　進(jìn)一步的幾個步驟使輔助語音系統(tǒng)利用你自己的聲音錄音，這樣復(fù)制的演講聽起來就像個人在使用設(shè)備。

　　這樣的設(shè)備在市場上最著名的就是影評人羅杰·艾伯特（Roger Ebert）使用的了，他是第一個使用語音合成器發(fā)出伊利諾伊英國口音的人。艾伯特因為癌癥切除了他的下巴，從而失去了說話的能力。

　　艾伯特最終被CereProc CereVoiceMe的聲音克隆服務(wù)所吸引。起初他不喜歡它，因為他不認(rèn)為這個聲音聽起來像他自己的聲音，盡管它來自于30年代的電視節(jié)目和廣播節(jié)目錄音。艾伯特不認(rèn)為聲音是他自己的原因是因為你錄制的聲音不同于你所聽到的聲音。當(dāng)你說話的時候，是頭骨和鼓膜振動的合成。聽錄音時，只聽到通過鼓膜振動的那部分。

　　那些知道正在失去講話能力的人們往往會利用今天不同公司所提供的語音克隆技術(shù)記錄幾個小時自己的聲音。通常，更多的記錄時間可以使自己的聲音更自然的再現(xiàn)，也會因為更多的詞形變化和其他說話時的細(xì)微差別而原音重現(xiàn)。當(dāng)然，更強(qiáng)大的解決方案所需費用也更高。

　　Lingraphica最近增加了即時消息和電子郵件功能，這給它的7英寸minitalk模型機(jī)和13英寸筆記本電腦模型機(jī)帶來了每日新聞?wù)?/div>

　　“這是一個非常有趣的時代，而我們公司有著獨特的優(yōu)勢，”Lingraphica公司創(chuàng)新、銷售和營銷部門副總裁Michelle Hart-Henry根據(jù)前面提到的健康數(shù)據(jù)評論道。該公司為語言障礙提供設(shè)備和語言治療解決方案，致力于解決那些康復(fù)問題。

　　“中風(fēng)的發(fā)病率增長，而存活率也增加了，”Hart-Henry說。“同時，人們正越來越相信中風(fēng)六個月后恢復(fù)的可能性。”

　　隨著新生代的增長，這樣的認(rèn)知問題也將繼續(xù)增加，Hart-Henry補(bǔ)充道。“他們需要這些設(shè)備。如果他們沒有這樣的需求，他們的孩子們也會有。他們希望處于不斷發(fā)展的技術(shù)之巔。”

　　超出了公司的傳統(tǒng)產(chǎn)品，Hart-Henry期望她的公司和其他公司為語言障礙群體提供技術(shù)和環(huán)境以及其他科技設(shè)備，讓人們在日常生活中得到使用。

　　通過電話幫助聽障群體自由溝通

　　盡管今天的消費者使用智能手機(jī)的時間遠(yuǎn)遠(yuǎn)超過了使用普通電話，但對于許多人來說，電話仍然是重要的，尤其是當(dāng)與朋友和家人交流的時候，RogerVoice的CEO Olivier·Jeannel如是說。這家公司提供了幫助聽力受損群體在電話溝通時的解決方案。

　　利用與谷歌語音的接口，為這些客戶提供了字幕服務(wù)。產(chǎn)品的市場相對較小，根據(jù)Jeannel的說法，有聽力損失的百分之一和有深度或聽力完全損失的千分之一的人群才會用到這項服務(wù)。

　　利用RogerVoice的產(chǎn)品和服務(wù)，耳背的人可以使用電話聯(lián)系親人，在這里電話仍然是主要的通信工具---- 百分之九十的電話都是打給朋友和家人的，Jeannel說。

　　雖然幫助聽力受損人群溝通的技術(shù)是基于提供字幕服務(wù)，一個不同的技術(shù)則來自于MotionSavvy UNI，它結(jié)合了手勢和語音識別技術(shù)，將手語翻譯成語音。該技術(shù)有望在2016年中期實現(xiàn)。

　　Ava，一項使用語音技術(shù)的字幕工具，預(yù)計也將在2016年的某個時期首次亮相。

　　新的、更強(qiáng)大的技術(shù)幫助視力受損群體

　　視障需要朗讀文本的技術(shù)，今天這個功能可在大多數(shù)操作系統(tǒng)上實現(xiàn)，Black說。應(yīng)用程序有能力跳過廣告并提供基于屏幕文本的快速語音交流。

　　Nuance的TALKS軟件應(yīng)用程序?qū)⑽谋巨D(zhuǎn)換為可理解的語音，這個應(yīng)用程序是與Nuance ZOOMS的緊密集成，屏幕放大器應(yīng)用程序使得低視力用戶手機(jī)可以訪問手機(jī)屏幕上的內(nèi)容。

　　還有一些為盲人服務(wù)的先進(jìn)技術(shù)，從簡單的閱讀屏幕上的文字到對于在屏幕上的圖片內(nèi)容進(jìn)行描述。

　　Conversant的創(chuàng)始人兼首席執(zhí)行官ChrisoMaury，四年前逐漸視力減弱，他很不滿意當(dāng)時他在市場上看到的技術(shù)和產(chǎn)品，因為他想要的不僅僅是語音。“我想構(gòu)建我想要的東西。”

　　所以他發(fā)明了SayKit軟件開發(fā)工具包（SDK），一個面向C語言和Swift框架的，增加了與iOS應(yīng)用程序的會話交互。SDK使用會話語音，使應(yīng)用程序用戶可以簡單地說“搜索…”，而不是提供更少的自然語音指令。

　　“這將是未來的客戶互動，”Maury說。

　　Conversant最近與Target聯(lián)合發(fā)布了一個應(yīng)用程序，名為Say Shopping，它使用戶能夠說出他們想要的產(chǎn)品。這款應(yīng)用程序搜索Target的整個產(chǎn)品目錄，使用戶能夠聽到關(guān)于產(chǎn)品的詳細(xì)信息和用戶評論�？蛻艨梢杂嗁彯a(chǎn)品。Conversant正與Target一起研發(fā)如何為購買雜貨的顧客服務(wù)。

　　根據(jù)Maury的說法，此應(yīng)用程序已經(jīng)被下載它的人群中的一半以上的人所使用。

　 聲明:版權(quán)所有非合作媒體謝絕轉(zhuǎn)載

相關(guān)熱詞搜索：語音技術(shù) 輔助技術(shù)

上一篇:全渠道客戶服務(wù)的智能用是關(guān)鍵

下一篇:最后一頁

相關(guān)閱讀：