語音合成技術(shù)在不知不覺中已融入人們的生活。
捷通華聲從2001年在國內(nèi)率先推出面向市場(chǎng)的語音合成技術(shù)以來,至今已深耕語音市場(chǎng)20年,廣泛服務(wù)金融、電信、能源、交通、教育、司法、公安、醫(yī)療、互聯(lián)網(wǎng)等多個(gè)領(lǐng)域,包括北京奧運(yùn)會(huì)、上海世博會(huì)、北京大興國際機(jī)場(chǎng)、全國大部分高鐵等等。
極致運(yùn)行速度高品質(zhì)合成效果
最新靈云語音合成技術(shù)引用“全并行架構(gòu)聲學(xué)模型”將運(yùn)行速度提升10倍,實(shí)時(shí)率顯著提升,這意味著在人機(jī)交互中,語音合成技術(shù)幾乎不會(huì)形成用戶等待時(shí)間。
通過采用一體化的智能文本分析算法,結(jié)合統(tǒng)計(jì)和規(guī)則等處理手段,靈云語音合成技術(shù)對(duì)文本處理前端擁有較強(qiáng)的分詞、多音字、韻律環(huán)境預(yù)測(cè)能力,以及自動(dòng)識(shí)別和處理日期時(shí)間、數(shù)值金額、電話號(hào)碼等文本的能力。此外,還支持每個(gè)發(fā)音人私有一個(gè)韻律預(yù)測(cè)模型文件,進(jìn)一步提升韻律預(yù)測(cè)效果。
得益于聲學(xué)核心的深度學(xué)習(xí)化與高音質(zhì)聲碼器,語音合成效果干凈飽滿又飽含細(xì)節(jié)、個(gè)人特色還原到位,聲線細(xì)膩、情感豐富、語速真實(shí)、媲比真聲。靈云語音合成技術(shù)擁有多個(gè)音庫,包括普通話、英語、維語等20多個(gè)語種,男聲、女聲、童聲、甜美可愛、成熟穩(wěn)重、熱情洋溢等多種風(fēng)格。
多種語音合成接入方式個(gè)人定制觸手可及
捷通華聲在2011年推出國內(nèi)外首款全方位人工智能開放平臺(tái)——靈云開放平臺(tái)(AIcloud)。
靈云開放平臺(tái)通過提供公有云服務(wù)器API和SDK等接口服務(wù),讓開發(fā)者能夠免費(fèi)享受到最新的語音合成技術(shù)。
此外,靈云開放平臺(tái)為開發(fā)者提供語音識(shí)別、語義理解、聲紋識(shí)別、語音喚醒、光學(xué)字符識(shí)別、人臉識(shí)別、手寫識(shí)別、機(jī)器翻譯、鍵盤輸入等多種技術(shù)能力SDK。開發(fā)者可以簡單、快速地接入所需的能力,并自由靈活組合,定制開發(fā)自己的產(chǎn)品。
捷通華聲提供可私有云部署的語音合成能力平臺(tái)。比如在銀行客服中心,通過與客戶IVR系統(tǒng)對(duì)接,提供穩(wěn)定高效的語音合成服務(wù),實(shí)現(xiàn)用機(jī)器人來服務(wù)海量用戶,滿足用戶安全性、私有化、高并發(fā)等特性需求。
對(duì)于不懂開發(fā)的普通用戶,捷通華聲提供開放的語音合成云服務(wù)(speech.aicloud.com),可以讓用戶直接在網(wǎng)頁上生成和下載文本對(duì)應(yīng)的音頻文件。
目前,靈云語音云服務(wù)全部免費(fèi),這不僅方便個(gè)人用戶豐富短視頻內(nèi)容,還可以免去錄音成本,提升創(chuàng)作效率。有效地降低了使用語音合成產(chǎn)品的門檻,讓每個(gè)人都可以輕而易舉地享受語音合成帶來的便利。