由CTI論壇(www.yh9t5.com)主辦的2021中國(guó)呼叫中心及企業(yè)通信大會(huì) (http://www.yh9t5.com/expo/2021/ccec2021spring/index.html)于4月15日在北京遼寧大廈成功召開(kāi)。本次會(huì)議以“5G時(shí)代 共筑企業(yè)通信云生態(tài)”為主題。深圳黃鸝智能科技有限公司CEO劉志受邀接受了CTI論壇的專訪。
深圳黃鸝智能科技有限公司CEO劉志
CTI論壇:各位朋友,各位嘉賓,這里是2021中國(guó)呼叫中心及企業(yè)通信大會(huì)的視頻采訪現(xiàn)場(chǎng)。今天我們有幸請(qǐng)到了深圳黃鸝智能科技有限公司CEO劉志先生,F(xiàn)在先請(qǐng)劉總跟大家打聲招呼。
劉志:hello, 各位CTI論壇的朋友們,大家好,我是深圳黃鸝智能科技有限公司的劉志。在這里很榮幸能夠接受我們這次大會(huì)的專訪。
CTI論壇:劉總,非常高興您接受我們的現(xiàn)場(chǎng)專訪。我現(xiàn)在有幾個(gè)問(wèn)題,請(qǐng)您跟我們的觀眾朋友們交流一下。我的第一個(gè)問(wèn)題是這樣的,黃鸝智聲這個(gè)品牌相信對(duì)于很多人還很陌生,這是一個(gè)新興的品牌,這家成立于2019年的人工智能技術(shù)企業(yè),但是來(lái)頭一點(diǎn)都不小,他們的研發(fā)團(tuán)隊(duì)都是清華大學(xué)的背景。請(qǐng)劉總介紹下成立黃鸝智聲的初衷是什么。
劉志:這個(gè)說(shuō)來(lái)就有點(diǎn)話長(zhǎng),剛才跟秦總聊,咱們CTI論壇是2000年就成立了,那個(gè)時(shí)候呢我剛好步入聲音這個(gè)領(lǐng)域。那剛好是我在讀研究生的階段,就接觸到了和聲音相關(guān)的各種技術(shù)。畢業(yè)之后,我就開(kāi)始了創(chuàng)業(yè)旅程,最早是做語(yǔ)音識(shí)別,在05年左右的時(shí)候的語(yǔ)音識(shí)別還不像現(xiàn)在這么火,那個(gè)時(shí)候連蘋果的siri還沒(méi)出來(lái)。實(shí)際上蘋果手機(jī)上的第一款語(yǔ)音撥號(hào)軟件就是我們團(tuán)隊(duì)做的,我們當(dāng)時(shí)針對(duì)歐美市場(chǎng)做了一款語(yǔ)音撥號(hào)軟件,叫voicedialler,把電話簿導(dǎo)入進(jìn)去之后,就直接說(shuō)一聲,我要call somebody,就把電話給打出去了,當(dāng)時(shí)就做的這樣一個(gè)產(chǎn)品,市場(chǎng)的反應(yīng)非常好。后來(lái)我們又做了口語(yǔ)測(cè)評(píng)類的產(chǎn)品,就是教學(xué)生學(xué)英語(yǔ),我們用機(jī)器來(lái)評(píng)判學(xué)生的口語(yǔ)發(fā)音到底是不是準(zhǔn)確。但是在做這幾件事情的過(guò)程中,我就發(fā)現(xiàn)一個(gè)我們?cè)趺匆怖@不開(kāi)的一個(gè)問(wèn)題,那就是噪聲問(wèn)題。即使到今天,噪聲問(wèn)題也依然是我們聲音通信行業(yè)以及智能交互行業(yè)里面,大家最頭疼的問(wèn)題,也是繞不開(kāi)的一個(gè)問(wèn)題。我的印象非常深刻,我們的識(shí)別系統(tǒng)在安靜環(huán)境下識(shí)別率做的很好,但是在很多實(shí)際應(yīng)用場(chǎng)景,比如說(shuō)開(kāi)車啊,戶外啊,識(shí)別率就直線下降。我還有印象,我們的系統(tǒng)中有一個(gè)識(shí)別詞叫“清華大學(xué)電子工程系”,平時(shí)在安靜環(huán)境下識(shí)別非常準(zhǔn)確,一到車上結(jié)果變成了“清華大型電子對(duì)撞機(jī)”,結(jié)果就完全不對(duì)了,這件事情就促使我們?cè)诼曇羟岸颂幚磉@個(gè)方向開(kāi)始了研究。經(jīng)過(guò)十多年的研發(fā)的積累,我們找到了一條路徑。因?yàn)榻翟脒@件事情說(shuō)起來(lái),大家一聽(tīng)都能理解,但是想做好非常困難。我們也是經(jīng)過(guò)十多年的演化之后才找到了一套獨(dú)有方式,能夠很好的去解決降噪當(dāng)中一個(gè)最主要的矛盾,就是既要降噪降的好,又要保證聲音低失真,所以我們十幾年來(lái)就一直圍繞這個(gè)點(diǎn),因?yàn)楹芏鄷r(shí)候我們?nèi)硕瓦@個(gè)機(jī)器啊,它對(duì)聲音的敏感度還不一樣。我們?nèi)硕鷮?duì)噪聲的容忍度是相對(duì)比較好的,但是機(jī)器因?yàn)楹芏嗍窃诎察o環(huán)境下訓(xùn)練出來(lái)的,噪聲和失真對(duì)它的影響就比較大。未來(lái)的時(shí)代是人機(jī)交互的時(shí)代,我們的聲音發(fā)揮的作用越來(lái)越多的不光是在人和人之間通信,還包括人機(jī)交互。咱們的論壇上很多嘉賓都在討論這個(gè)問(wèn)題,對(duì)吧?所以說(shuō)聲音的降噪、語(yǔ)音的增強(qiáng),作為產(chǎn)業(yè)鏈條上的前端技術(shù),是大家都繞不開(kāi)的一個(gè)問(wèn)題。我們看到這個(gè)技術(shù)巨大的市場(chǎng)應(yīng)用價(jià)值,所以經(jīng)過(guò)前面的這些積淀之后,我們決定把這一塊的技術(shù)獨(dú)立出來(lái),專門圍繞著拾音降噪,我們通過(guò)這種人工智能和信號(hào)處理相結(jié)合的這種方式,來(lái)解決這個(gè)降噪難題。然后我們就是圍繞著幾個(gè)大的應(yīng)用場(chǎng)景,或者說(shuō)幾個(gè)未來(lái)大的趨勢(shì):第一個(gè)就是人和人之間通信,需要拾取清晰干凈的聲音;第二是人機(jī)交互,讓機(jī)器能夠聽(tīng)懂人;第三是未來(lái)需要讓人能聽(tīng)懂機(jī)器,因?yàn)闄C(jī)器也會(huì)發(fā)出聲音,要想聽(tīng)懂機(jī)器的語(yǔ)言同樣需要降噪處理。在這三個(gè)大的場(chǎng)景當(dāng)中,我們認(rèn)為降噪都能夠發(fā)揮作用。這個(gè)就是我們黃鸝智聲成立的初衷,我們的使命叫做“用聲音智能改善人類生活與工作品質(zhì)”。因?yàn)槁曇粼谖覀兩罟ぷ鳟?dāng)中方方面面都能起到作用,但是今天我們覺(jué)得聲音的價(jià)值還是很多時(shí)候沒(méi)有發(fā)揮出來(lái)。所以我們是希望能夠通過(guò)我們所做的這些工作,真正的把聲音的價(jià)值給發(fā)揮出來(lái),能夠讓整個(gè)行業(yè)更好的給我們?nèi)祟惾ヌ峁└嗟谋憷,這是我們的初衷。
CTI論壇:好的,謝謝劉總。這個(gè)聲音對(duì)于我們?nèi)祟惿畹暮凸ぷ鬟@種價(jià)值,也是黃鸝成立的初衷。劉總,我的第二個(gè)問(wèn)題是隨著5G和AI的發(fā)展,聲音通信和智能化處理存在巨大需求。但噪聲干擾和器件限制,極大降低了聲音采集的精度和范圍,嚴(yán)重制約著通信質(zhì)量和聲音智能處理效果。聲請(qǐng)您談一下聲音前端處理的這種技術(shù)發(fā)展的方向和趨勢(shì)。
劉志:好的, 這是一個(gè)比較專業(yè)一點(diǎn)的問(wèn)題了。我就先盡我的所能做一些介紹,談?wù)勎易约旱睦斫狻?/div>
剛才其實(shí)說(shuō)到,聲音有非常大的作用。我們每天都在跟人打電話,對(duì)吧?這是聲音的傳輸,那在傳輸之前呢?我們要把聲音先采集下來(lái)。有了傳輸,這就是我們所說(shuō)的通信。那么人機(jī)交互是什么呢?聲音首先采集下來(lái),之后交給機(jī)器去做識(shí)別,F(xiàn)在有語(yǔ)音識(shí)別,有聲紋識(shí)別等等的智能化處理。現(xiàn)在甚至可以通過(guò)聲音來(lái)判別情緒,未來(lái)還有很多很多聲音里面可以傳遞出的信息。那我們通常來(lái)說(shuō)把這個(gè)前面采音的部分叫做聲音的前端處理,后面做識(shí)別也好、做通信也好,我們把它叫做后端。簡(jiǎn)單來(lái)說(shuō)就是說(shuō)我先得把聲音采集下來(lái),而且在這個(gè)采的這個(gè)過(guò)程中,我們希望這個(gè)聲音盡可能采的清晰,盡可能把我想要的有用的聲音給抓取,把噪聲盡可能給屏蔽掉,這個(gè)我們廣義的把它叫做聲音的前端處理。您剛才也提到前端處理有幾種大的手段,一種是靠聲學(xué)的器件,就是麥克風(fēng)。好的麥克風(fēng)很貴的,有的甚至上百萬(wàn)一只,它的動(dòng)態(tài)范圍、保真度都有差異。另一種手段就是做信號(hào)處理,就是麥克風(fēng)采集進(jìn)來(lái)之后,怎么樣去把這個(gè)聲音的降噪這個(gè)問(wèn)題,把語(yǔ)音的增強(qiáng)這個(gè)問(wèn)題給解決。我們就是站在這個(gè)角度去研究,著眼點(diǎn)是在算法層面。降噪又有很多具體的細(xì)分的點(diǎn),比如回聲就是一種噪聲;芈暿鞘裁茨?比如說(shuō)我有個(gè)音箱,它放出來(lái)的聲音被麥克風(fēng)又采集進(jìn)去了,這個(gè)就叫回聲。還有混響,房間中的反射,會(huì)非常嚴(yán)重的影響我們的聽(tīng)感,我們聽(tīng)著就是感覺(jué)嗡嗡嗡嗡的不清楚;然后還有噪聲,比如說(shuō)我在家辦公呢,旁邊有人在裝修,打電鉆;或者我在這說(shuō)話呢,我孩子在旁邊喊一嗓子,這都是噪聲。噪聲還分穩(wěn)態(tài)和非穩(wěn)態(tài)的等等。這些對(duì)于我們的有用聲音來(lái)說(shuō),它都屬于噪聲。我們的目的就是要把他們都消除掉,而且還要保證我的這個(gè)聲音盡量的少受損傷。這就是前端要做的事情,那從技術(shù)手段上來(lái)說(shuō)呢,又分為很多信號(hào)處理的手段,以及深度學(xué)習(xí)的手段,AI的算法。具體到每一種手段的話,他又有各自的優(yōu)點(diǎn)和缺點(diǎn)。那么對(duì)于我們黃鸝智聲來(lái)說(shuō),我們所做的是一種融合性的手段,是一種創(chuàng)新性的融合,是把信號(hào)處理和AI的算法綜合在一起,取長(zhǎng)補(bǔ)短,這樣能夠達(dá)到的一個(gè)效果就是剛才說(shuō)的最難辦的問(wèn)題--高降噪的同時(shí)還要保證低失真這一點(diǎn)。這是我們團(tuán)隊(duì)在聲音前端處理這個(gè)技術(shù)上取得的一個(gè)相比于其他方法更加有價(jià)值的一個(gè)成果。
CTI論壇:聽(tīng)劉總這一段解釋,然后真的讓我覺(jué)得自己也得到了一個(gè)知識(shí)的普及。觀眾可能也會(huì)是對(duì)于這個(gè)行業(yè)可能會(huì)理解得更深一些。
那么第三問(wèn)題是黃鸝精巧C101u單耳專業(yè)降噪話務(wù)耳機(jī)榮獲CTI論壇2020編輯推薦獎(jiǎng),與市面上大部分降噪耳機(jī)不同,黃鸝主攻“通話降噪”,請(qǐng)介紹此款耳機(jī)的創(chuàng)新具體表現(xiàn)在哪里?
劉志:其實(shí)如果單純從外觀和基本的功能上來(lái)說(shuō)的話,和市面上所有的這種單耳的話務(wù)耳機(jī)基本沒(méi)有區(qū)別。我們自己找了點(diǎn)區(qū)別,比如說(shuō)我們做了一個(gè)防止夾發(fā)的設(shè)計(jì),我們還有一個(gè)波浪型的設(shè)計(jì),讓佩戴舒適性更高一些;當(dāng)然還有輕巧,我們做到四十幾克。但是這些坦率來(lái)說(shuō),不是我們最核心的創(chuàng)新。我們的最核心的創(chuàng)新還是集中在我們的拾音降噪性能。因?yàn)槲覀儼l(fā)現(xiàn),今天在呼叫中心,企業(yè)的通訊辦公這個(gè)領(lǐng)域,噪音是一個(gè)大家都很頭疼的問(wèn)題。但是之前也沒(méi)有好的解決方案,我走訪了一些客戶,他們的坐席距離比今天我跟秦總要近多了,最多的就是胳膊挨著胳膊,中間都沒(méi)有隔板,在他們業(yè)務(wù)最高峰的時(shí)候啊,使用我們的這款耳機(jī)去和客戶溝通,把這個(gè)聲音錄下來(lái),回放回聽(tīng)的時(shí)候,客戶都是非常驚訝的,就是完全沒(méi)有周邊的聲音干擾,每個(gè)接線員的聲音就是他自己的聲音,清晰可聞。這樣的客戶體驗(yàn)我相信是我們很多企業(yè)都希望能夠達(dá)到。其次我們跟后端做語(yǔ)音識(shí)別的一些伙伴做了測(cè)試,那我們可以看到今天的安靜環(huán)境下,語(yǔ)音識(shí)別的系統(tǒng)識(shí)別率可以到90%以上。但是真到了這個(gè)實(shí)際的噪聲場(chǎng)景,一旦大家都坐下來(lái),都開(kāi)始嘰嘰喳喳說(shuō)話的時(shí)候,那個(gè)識(shí)別率下降非常嚴(yán)重,掉到了70%甚至以下。這個(gè)時(shí)候把我們的這個(gè)耳機(jī)用上之后,識(shí)別率就一下回到了接近安靜環(huán)境下的水平,所以針對(duì)呼叫中心語(yǔ)音質(zhì)檢,智能客服的應(yīng)用,可以輔助語(yǔ)音識(shí)別,讓語(yǔ)音識(shí)別能夠在這種嘈雜環(huán)境下依然可以保持一個(gè)健壯穩(wěn)定,高識(shí)別率、高水準(zhǔn)的輸出。所以說(shuō)這樣一款產(chǎn)品,它搭載了我們的核心技術(shù)之后,能夠產(chǎn)生的兩大優(yōu)點(diǎn):一個(gè)是讓我通話的對(duì)方,讓我們的客戶體驗(yàn)度提升。第二個(gè)是讓機(jī)器也能聽(tīng)明白,讓今天的很多智能化場(chǎng)景真正能夠落地。我們能夠做到的就是用一款產(chǎn)品可以同時(shí)滿足這兩點(diǎn),這個(gè)恰恰是今天很多其他技術(shù)做不到的。這是我們這款耳機(jī)最核心的亮點(diǎn),也是我們給客戶真真實(shí)實(shí)帶來(lái)的價(jià)值。我們的團(tuán)隊(duì)做事情的一個(gè)原則,就是一定是真真實(shí)實(shí)的要給大家?guī)?lái)價(jià)值,聽(tīng)得見(jiàn),聽(tīng)得清,聽(tīng)得懂,能夠感受體會(huì)的到。
CTI論壇:謝謝劉總精彩的分享。我想在這里說(shuō)一下,就是說(shuō)我跟劉總的初次見(jiàn)面應(yīng)該是在2019年的10月份啊,在深圳的一個(gè)大會(huì)上,然后呢。我們?cè)谛袠I(yè)有個(gè)老專家胡志明先生介紹的。然后當(dāng)時(shí)因?yàn)楫吘挂矝](méi)有體驗(yàn)過(guò),然后我們就邀請(qǐng)他參加我們2019年12月年底的編輯推薦活動(dòng),然后劉總就帶來(lái)了一款他們的這個(gè)產(chǎn)品的一個(gè)功能的現(xiàn)場(chǎng)演示。我跟大家介紹一下當(dāng)時(shí)在座的近100位的行業(yè)的專家們真的在聽(tīng)完劉總的這個(gè)演示以后,真的我覺(jué)得那個(gè)掌聲是我最近幾年聽(tīng)到最熱烈的,真的是因?yàn)樗_實(shí)是就如同剛才劉總介紹。在呼叫中心里頭,就是說(shuō)他們那耳機(jī)上完了以后,人家說(shuō)就完全的就是說(shuō)真的當(dāng)時(shí)的現(xiàn)場(chǎng)的這些,近百位的專家們真的都有那種感覺(jué),哇,就是說(shuō)在噪音的情況下,完了以后,他們?cè)侔阎匦聲r(shí)間和降噪之后的呈現(xiàn)了以后,真的很震驚,因?yàn)閯⒖偖?dāng)時(shí)也是就是說(shuō)你們你們這些人隨便鼓掌,說(shuō)話呀,然后唱歌什么都行。然后劉總在那說(shuō),然后居然就把其他人的聲音都給屏蔽了。真的我非常感謝劉總,感謝黃鸝智聲給行業(yè)帶來(lái)這么一個(gè)新鮮的一個(gè)震撼的一個(gè)產(chǎn)品和技術(shù)。謝謝謝謝。
劉志:也特別感謝CTI論壇。其實(shí)您說(shuō)的這個(gè)場(chǎng)景我歷歷在目啊,那個(gè)時(shí)候我拿的還是一個(gè)非常粗糙的demo,當(dāng)時(shí)心里也非常忐忑啊。但恰恰是這次機(jī)會(huì),把我們引入到了這個(gè)行業(yè),帶我們走出了第一步。所以真的是也是非常感謝秦總,包括我們整個(gè)cti論壇所有的同仁,也希望把更多更好的產(chǎn)品帶給我們行業(yè),帶給我們所有的客戶,以及未來(lái)進(jìn)入到千家萬(wàn)戶!
CTI論壇:謝謝劉總,謝謝。我們?cè)谶@里頭也預(yù)祝黃鸝智聲一個(gè)年輕的公司,在今后真的未來(lái)可期取得更大的成績(jī)。謝謝大家,。
劉志:感謝大家!
采訪嘉賓介紹:
劉志:深圳黃鸝智能科技有限公司CEO,兼任清華大學(xué)電子工程系企業(yè)導(dǎo)師、經(jīng)管學(xué)院GTE項(xiàng)目導(dǎo)師,中國(guó)教育學(xué)會(huì)智能語(yǔ)言教學(xué)研究中心研究員。清華大學(xué)工學(xué)碩士,高級(jí)工程師,擁有近20年人工智能領(lǐng)域創(chuàng)新創(chuàng)業(yè)經(jīng)驗(yàn)。曾獲北京市科技進(jìn)步獎(jiǎng)、中國(guó)電子學(xué)會(huì)科技進(jìn)步獎(jiǎng)等多項(xiàng)榮譽(yù),擁有專利數(shù)十項(xiàng)。中國(guó)語(yǔ)音環(huán)境降噪處理專家。
【免責(zé)聲明】本文僅代表作者本人觀點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。
相關(guān)閱讀:
- ·專訪深圳黃鸝智能科技有限公司CEO劉志2020-09-21 14:10:16