語(yǔ)音技術(shù)是EC19更有趣的主題之一--而不僅僅是因?yàn)槲艺劦搅怂?-如果你想知道都談到了什么,我有兩個(gè)不同的例子可以分享,那是我為我的演講所做的研究。
像其他任何事情一樣,這個(gè)主題只有在以某種方式思考它時(shí)才有意義。我通過解釋人工智能(AI)和語(yǔ)音是如何在非常不同的軌跡上的兩個(gè)不同主題來開啟我的演講。人工智能是超級(jí)大肆宣傳的,最熱的話題,并且同時(shí)是面向各個(gè)方向的。沒有重心,每個(gè)供應(yīng)商都在嘗試加入人工智能元素或人工智能賦能--無論銷售什么。其中一些努力將取得成果,一些將悄然消失--語(yǔ)音是人工智能軌道的合理應(yīng)用之一。
另一方面,語(yǔ)音技術(shù)非常成熟,迄今為止主要是功能性的,與音頻轉(zhuǎn)錄和語(yǔ)言翻譯有關(guān)的用例。現(xiàn)在,想象一下維恩圖(Venn Diagram)和兩者之間的重疊空間,這就是我看到新價(jià)值具有潛力的地方。AI是語(yǔ)音識(shí)別的新轉(zhuǎn)折,由于各種原因,它將事物提升到一個(gè)全新的水平。
除了在語(yǔ)音準(zhǔn)確性方面做出漸進(jìn)但非常明顯的改進(jìn)之外,AI還將語(yǔ)境,意圖,情感等帶入等式,并提升語(yǔ)音的價(jià)值,實(shí)際上是用于協(xié)作等用例。這是一個(gè)單獨(dú)的主題,對(duì)于這篇文章而言,我只想用我在演講中提到的具體例子來說明發(fā)生了什么。
Otter.ai--Seeing is Believing-實(shí)時(shí)轉(zhuǎn)錄
我之前已經(jīng)引用過這個(gè)例子,但它也適用于這篇文章。Otter.ai是AI Sense的獨(dú)立產(chǎn)品,是實(shí)時(shí)轉(zhuǎn)錄產(chǎn)品的領(lǐng)先示例,我認(rèn)為它很快將成為協(xié)作平臺(tái)的標(biāo)準(zhǔn)功能。經(jīng)常轉(zhuǎn)錄是在事實(shí)發(fā)生之后,但實(shí)時(shí)是在當(dāng)下,并且正在成為使會(huì)議更具包容性的一種方式。
除了不必記筆記--因此在會(huì)議期間有更多的參與--這還有助于聽力受損或無法跟隨英語(yǔ)演講的參與者與其他人保持同步。考慮與多文化參與者會(huì)面,其中英語(yǔ)不是母語(yǔ),但也要考慮具有強(qiáng)烈口音的發(fā)言者,即使是講英語(yǔ)的參與者也很難跟隨。
我很厚顏無恥,但是在這里我想到的是Austin Powers的這個(gè)場(chǎng)景,當(dāng)時(shí)他正在和他的爸爸一起玩耍。不僅是英語(yǔ)口音很大,甚至說英語(yǔ)的人都需要字幕,但是還有一層俚語(yǔ)解碼--而這是另一個(gè)AI問題,我確信Otter的人們都在努力工作加以實(shí)現(xiàn)。
回到協(xié)作環(huán)境,實(shí)時(shí)轉(zhuǎn)錄和實(shí)時(shí)翻譯的結(jié)合創(chuàng)造了另一個(gè)引人注目的用例。這種情況的變化已經(jīng)存在了一段時(shí)間,我們?cè)谖④浀腅C19主題演講中看到了一個(gè)很好的例子。單獨(dú)地,這些功能中的每一個(gè)都令人印象深刻,但是當(dāng)你展示它們一起工作時(shí)--正如微軟所做的將一位中國(guó)演講者的演講翻譯成英語(yǔ)一樣--這是非常神奇的。
然后是AI部分,這是很多新價(jià)值的來源。Otter's Teams應(yīng)用程序允許使用揚(yáng)聲器標(biāo)記,并且所有文本都可搜索,很容易找到一個(gè)人說話的所有地點(diǎn),甚至是兩個(gè)特定人互相交談的地方,或添加搜索詞以便隨時(shí)查找正在討論轉(zhuǎn)錄中出現(xiàn)的這個(gè)詞。搜索的可能性是無窮無盡的,這使得轉(zhuǎn)錄成為會(huì)議的有力增值項(xiàng)。
其他重要功能包括自定義語(yǔ)言參考,以便轉(zhuǎn)錄引擎能夠準(zhǔn)確地跟蹤您的行業(yè)或特定項(xiàng)目的特定術(shù)語(yǔ)或縮略詞。Otter。ai與大多數(shù)主要協(xié)作平臺(tái)集成,因此它是您已經(jīng)使用的增值服務(wù)。還有雙因素身份驗(yàn)證可確保您的工作空間的安全性,特別是對(duì)于那些遠(yuǎn)程加入會(huì)議的人來說,他們的身份難以確定。
這些功能非?幔寝D(zhuǎn)錄準(zhǔn)確性很高,否則它們都不重要--不僅僅是為了閱讀,還有實(shí)際上當(dāng)你真正付出最多的注意力時(shí)。對(duì)于Otter.ai而言,準(zhǔn)確性是一種自豪感--就像我一直在談?wù)摰拿總(gè)語(yǔ)音文本播放器一樣--如果你看看該團(tuán)隊(duì)的背景,那么你一定相信血統(tǒng)論的正確存在。
作者:?jiǎn)潭?阿諾德(Jon Arnold)
聲明:版權(quán)所有 非合作媒體謝絕轉(zhuǎn)載
原文網(wǎng)址:https://www.nojitter.com/ai-speech-technologies/ai-plus-speech-equals-new-value%20