為了讓更多有障礙同學(xué)能夠參與其中,交流會(huì)引入了捷通華聲提供的“靈云智錄”智能語音轉(zhuǎn)寫系統(tǒng),可將講演者的發(fā)言實(shí)時(shí)轉(zhuǎn)寫成文字上屏,精準(zhǔn)的識(shí)別效果引發(fā)一致好評(píng)。
“這是我第一次親身感受到,人工智能技術(shù)所帶來的便捷。”一名負(fù)責(zé)組織交流會(huì)的志愿者說道,“有了這個(gè)智錄系統(tǒng),再組織尤其是有聽力障礙人士參加的活動(dòng)時(shí),會(huì)議的溝通真變得‘無障礙’了。”
靈云智錄系統(tǒng)現(xiàn)場(chǎng)轉(zhuǎn)寫效果
此前,靈云智錄系統(tǒng)已經(jīng)在去年的無障礙發(fā)展國(guó)際學(xué)術(shù)大會(huì)成功應(yīng)用,受到現(xiàn)場(chǎng)各國(guó)研究學(xué)者、清華師生及各界人士高度好評(píng)。
無障礙國(guó)際大會(huì)現(xiàn)場(chǎng)轉(zhuǎn)寫效果
在一些有殘障人士參與的會(huì)議中,尤其是有聽力障礙的人士,“聽會(huì)”成為了巨大的問題。靈云智錄系統(tǒng)可以讓會(huì)議現(xiàn)場(chǎng)的發(fā)言實(shí)時(shí)以字幕的形式展現(xiàn)出來,一方面便捷、加快了會(huì)議的交流,另一方面也極大地方便了聽力障礙人士。
清華交流會(huì)上應(yīng)用的靈云智能轉(zhuǎn)錄系統(tǒng),采用靈云最新一代語音識(shí)別技術(shù),擁有超快的轉(zhuǎn)寫速度和超高的準(zhǔn)確率,對(duì)不同口音、語速的發(fā)言人都能輕松適配,面對(duì)遠(yuǎn)場(chǎng)講話等場(chǎng)景亦能準(zhǔn)確識(shí)別并轉(zhuǎn)寫。系統(tǒng)可實(shí)現(xiàn)會(huì)議場(chǎng)景的現(xiàn)場(chǎng)語音轉(zhuǎn)錄、發(fā)言實(shí)時(shí)上屏、離線錄音轉(zhuǎn)寫、語音自動(dòng)合成播報(bào)、實(shí)時(shí)編輯、關(guān)鍵詞優(yōu)化等多種功能。
實(shí)時(shí)語音轉(zhuǎn)寫:通過多個(gè)話筒預(yù)設(shè)發(fā)言人角色,系統(tǒng)可將每個(gè)人的發(fā)言實(shí)時(shí)轉(zhuǎn)寫并分別呈現(xiàn)在系統(tǒng)中,極大地方便了多角色會(huì)議記錄。
除了支持中文普通話,系統(tǒng)也可支持四川話、廣東陽江話、粵語以及維吾爾語、英語、哈薩克語、藏語安多、藏語康巴、朝鮮語、蒙文等多種語言的轉(zhuǎn)寫,并針對(duì)金融、電信、公檢法、會(huì)議、醫(yī)療等領(lǐng)域訓(xùn)練了專用ASR模型,可根據(jù)自身企業(yè)需求進(jìn)行定制。
在線實(shí)時(shí)編輯:記錄人員根據(jù)實(shí)時(shí)轉(zhuǎn)寫的內(nèi)容,可在編輯框里實(shí)時(shí)對(duì)語音轉(zhuǎn)寫輸出的文字內(nèi)容進(jìn)行修改、刪除、替換,使會(huì)議記錄更為準(zhǔn)確、精煉。
發(fā)言實(shí)時(shí)上屏:針對(duì)不同會(huì)議的需求,系統(tǒng)可將實(shí)時(shí)語音轉(zhuǎn)寫的結(jié)果,以彈幕的形式展現(xiàn)在大屏上,方便現(xiàn)場(chǎng)聽會(huì)者閱讀。
離線錄音轉(zhuǎn)寫:歷史錄音文件針可直接導(dǎo)入系統(tǒng)進(jìn)行轉(zhuǎn)寫,系統(tǒng)支持wma/wav/mp3/m4a/amr等多種格式音頻,轉(zhuǎn)寫結(jié)果支持錄音文字同步調(diào)聽矯正,讓錄音整理者可快速完成文字校核。
語音合成播報(bào):系統(tǒng)為會(huì)議主持者提供語音合成服務(wù),可通過輸入文字,選擇男聲、女聲等不同的音色,完成廣播音頻合成。通過采用深度神經(jīng)算法的語音合成技術(shù),合成的聲音清晰優(yōu)美、抑揚(yáng)頓挫,滿足會(huì)議會(huì)場(chǎng)廣播等各種場(chǎng)景需求。
文本訓(xùn)練優(yōu)化:針對(duì)不同行業(yè)、不同會(huì)議場(chǎng)景,系統(tǒng)可以預(yù)先進(jìn)行語音識(shí)別模型的優(yōu)化訓(xùn)練,并在會(huì)前預(yù)先導(dǎo)入與會(huì)議相關(guān)的文字材料,或直接輸入人名、地名、專業(yè)術(shù)語等關(guān)鍵詞進(jìn)行優(yōu)化,從而提高專業(yè)領(lǐng)域會(huì)議的語音識(shí)別準(zhǔn)確率。
“讓每家企業(yè)都擁有人工智能,讓人工智能像‘水和電’一樣便捷服務(wù)大眾無處不在”一直都是捷通華聲的企業(yè)愿景,清華交流會(huì)上靈云智錄系統(tǒng)成功服務(wù)殘障人士即是一次典型的AI技術(shù)落地應(yīng)用。捷通華聲將繼續(xù)專注于AI技術(shù)與產(chǎn)品的研發(fā),不斷深入行業(yè)了解需求,開發(fā)更多能夠“落地應(yīng)用”的產(chǎn)品與方案,從而讓更多人享受到人工智能所帶來的輕松與便捷。