盡管市面上的語音識別系統(tǒng)已經(jīng)非常多了,但是由于人們講話時用詞和口音的問題,幾乎沒有任何一款產(chǎn)品可以完全做到精準識別。雖然這項不完全成熟的技術(shù)以后的運用空間廣泛,但是競爭卻也很激烈。
Tetra聯(lián)合創(chuàng)始人Jon Goldsmith認為,語音識別市場競爭確實非常激烈,Tetra自己本身的技術(shù)也還未達到100%成熟,然而語音識別技術(shù)還是需要通過深度學(xué)習(xí)來解決用詞和口音的識別問題。
手機安裝Tetra后,在接打電話時,其語音識別和深度學(xué)習(xí)系統(tǒng)會在后臺自動運行,做實時的語音記錄和文字翻譯。用戶可以在系統(tǒng)中搜索關(guān)鍵字來查找語音和文字通話記錄。
然而根據(jù)語速、口音和用詞的不同,Tetra的識別并不完美。因此Tetra設(shè)置了24小時的人工付費翻譯服務(wù),來滿足用戶對高精確性的需求。這項服務(wù)既可以滿足用戶的精準化需求,也可以為Tetra的深度學(xué)習(xí)系統(tǒng)提供學(xué)習(xí)數(shù)據(jù)。
Jon Goldsmith表示,目前Tetra的目標(biāo)客戶是那些每天電話很繁忙的人。這些客戶希望自己和行業(yè)專家們的通話記錄永遠被保存。同時傳統(tǒng)的企業(yè)也是Tetra的服務(wù)對象,很多企業(yè)級的服務(wù)比如銷售相關(guān)的電話也可以通過Tetra完成記錄和識別。
在工程方面,Tetra提供現(xiàn)成的API來強化手機上的一些基礎(chǔ)設(shè)施。對于通話識別系統(tǒng)的收費如下圖所示:
通過這種方法,Tetra可以獲得高頻大量的學(xué)習(xí)數(shù)據(jù),從而通過深度學(xué)習(xí)繼續(xù)優(yōu)化語音識別系統(tǒng)。相較于單純的企業(yè)級語音識別服務(wù),這種數(shù)據(jù)獲取方法成本相對更低,獲得的數(shù)據(jù)也相對更加多元。
同時,這項技術(shù)的進展和使用哪個云端API有著緊密的聯(lián)系。比如一些NPL(自然語言處理)服務(wù)運營商對演講的處理能力較強,有些對數(shù)字的處理能力較強等。選擇不同的NPL也許對于通話語音的處理效果會出現(xiàn)很大的不同。
對于語音識別領(lǐng)域,國外的諸如谷歌、亞馬遜,國內(nèi)的諸如百度、阿里和騰訊等巨頭都有涉及。這塊市場的應(yīng)用場景廣泛,技術(shù)還未成熟,蘊藏的投資和創(chuàng)業(yè)空間自然很大。在企業(yè)服務(wù)領(lǐng)域,搜狗、科大訊飛等企業(yè)也都推出了其語音速記系統(tǒng)。
然而目前在語音識別領(lǐng)域還未有公司可以完全解決上文中所述的人類語言多樣化的問題,這個問題如何得到解決,深度學(xué)習(xí)究竟是不是答案,還需要時間來驗證。
這次種子輪融資是Tetra第一輪融資。