靈云科技訊:4月21日,捷通華聲宣布推出最新靈云嵌入式語音合成(TTS)iHear 7.0Embedded版。iHear 7.0版在合成效果、資源占用、產(chǎn)品功能等多方面均進行了大幅度的優(yōu)化,達到了國內(nèi)嵌入式語音合成技術(shù)的最高水平。這也是繼靈云平臺相繼推出靈云身份證識別、靈云人臉識別技術(shù)能力以來,靈云平臺在智能語音技術(shù)上所取得的新的突破性進展。
靈云嵌入式語音合成技術(shù)iHear 7.0憑借資源占用小、合成效果優(yōu)異、集成簡單等優(yōu)點,廣泛應(yīng)用于APP、車載、智能可穿戴設(shè)備、智能家居、智能電視等設(shè)備,為智能終端設(shè)備和APP實現(xiàn)文本轉(zhuǎn)語音朗讀、信息播報等語音合成功能。
靈云嵌入式語音合成技術(shù)iHear 7.0使用了最新一代高音質(zhì)合成器,音質(zhì)效果更加真實、干凈、細膩;利用模型優(yōu)化了算法,大大提高音色的逼真度和音質(zhì)的細膩度,克服機器味底噪。增加了數(shù)據(jù)訓練流程,比傳統(tǒng)訓練方法穩(wěn)定性更高;優(yōu)化音高算法,使朗讀更加抑揚頓挫;優(yōu)化了計算效率,默認情況下比舊版快2.5倍,資源消耗大幅降低;更全面的地名詞庫,精心裁剪,可辨認全國常見地名、機構(gòu)名;支持用戶定制化需求:針對用戶特定詞匯、語句保證讀音正確、韻律自然。豐富的語種與發(fā)音人:語種可支持中文普通話、粵語、英語、北方語系方言、臺灣腔調(diào)國語等;已發(fā)布十余個發(fā)音人音色,性別涵蓋男聲、女聲、童聲,涵蓋正式、閑適、可愛、激昂、穩(wěn)重、柔美等各類風格,其中既有專業(yè)播音員,也有普通用戶。通用領(lǐng)域面向新聞、聽書等應(yīng)用,多音字判斷正確率高;導航領(lǐng)域面向打車、導航等應(yīng)用,能正確辨認全國常見地名、機構(gòu)名。
捷通華聲:中國智能語音產(chǎn)業(yè)領(lǐng)軍企業(yè)
捷通華聲公司成立于2000年,是一家專注智能語音、智能圖像、語義理解等人工智能技術(shù)的研究與開發(fā),全面發(fā)展人工智能技術(shù)云服務(wù)與產(chǎn)業(yè)應(yīng)用的高新技術(shù)企業(yè)。也是國內(nèi)最早從事智能語音技術(shù)研究與應(yīng)用的企業(yè)之一。目前,捷通華聲擁有自主知識產(chǎn)權(quán)的靈云語音識別(ASR)技術(shù),電話端和手機端準確率均達到國內(nèi)領(lǐng)先水平;捷通華聲靈云多語種語音合成(TTS)支持的語言已達19種,覆蓋了全球90%以上的國家和地區(qū)。同時,捷通華聲也是全球唯一一家擁有維吾爾語語音識別和語音合成技術(shù)能力的語音技術(shù)公司。
2015年,捷通華聲在語音合成,語音識別的基礎(chǔ)上,又逐步推出聲紋識別、IVr語音導航、語音質(zhì)檢系統(tǒng)、VoiceReader(PC端軟件)等一系列的優(yōu)秀能力或軟件,使捷通華聲擁有自主知識產(chǎn)權(quán)的靈云智能語音技術(shù)及產(chǎn)品在語音交互市場占有率超過50%。捷通華聲靈云智能語音技術(shù)通過服務(wù)百度導航、搜狗導航、導航犬、嘀嘀打車、快的打車、易到用車、天行聽書、靈云智能輸入法、觸寶輸入法等家喻戶曉的移動應(yīng)用服務(wù),及京東商城、攜程網(wǎng)、去哪兒網(wǎng)等大型互聯(lián)網(wǎng)平臺,使中國13億社會大眾群體充分感受并體驗到智能語音等人工智能技術(shù)為現(xiàn)代生活所帶來的輕松與便捷。
憑借在智能語音產(chǎn)業(yè)多年的深厚研究基礎(chǔ)和高達50%的市場份額,捷通華聲在“第六屆中國行業(yè)信息化獎項評選活動”上一舉奪得中國智能語音產(chǎn)業(yè)領(lǐng)軍企業(yè)大獎。
靈云嵌入式語音合成技術(shù)iHear 7.0是捷通華聲靈云語音合成(TTS)技術(shù)的重要分支,也是靈云全方位人工智能開放平臺的重要組成部分。iHear 7.0版本的推出,表明捷通華聲將繼續(xù)在傳統(tǒng)語音合成技術(shù)上的深耕細作,致力于打造比肩專業(yè)播音員水平語音合成技術(shù)的決心,再次鞏固了捷通華聲在中國智能語音產(chǎn)業(yè)領(lǐng)軍地位。
聯(lián)合清華大學 全面推動人工智能技術(shù)發(fā)展
2011年,捷通華聲創(chuàng)造性推出了全球第一個最大、最全的人工智能技術(shù)開放平臺 - 靈云(www.hcicloud.com)。靈云是一種可以用語音、手寫、拍照、手勢,將來甚至可使用腦波識別等智能手段來操作、感知手機、計算機等數(shù)字設(shè)備的網(wǎng)絡(luò)云服務(wù),靈云平臺的創(chuàng)建,標志著人工智能產(chǎn)業(yè)全面邁入云服務(wù)時代。
2013年,清華大學產(chǎn)業(yè)基金入資捷通華聲,成為捷通華聲第二大股東,共同創(chuàng)立“清華靈云人工智能研究中心”,共同致力于推動人工智能產(chǎn)業(yè)在中國的發(fā)展。在雙方的戰(zhàn)略合作中,捷通華聲將發(fā)揚清華大學在國家科技進步、國民經(jīng)濟建設(shè)中的強大推動力與影響力,全面推進靈云發(fā)展戰(zhàn)略,促進提升清華大學人工智能技術(shù)在產(chǎn)業(yè)中的影響力,助力清華大學構(gòu)建“學術(shù)超前、科研領(lǐng)先、產(chǎn)業(yè)化推廣最強”的領(lǐng)導地位,共同實現(xiàn)“靈云科技 源自清華 服務(wù)全球”的戰(zhàn)略發(fā)展規(guī)劃。
通過與清華大學的廣泛合作,靈云平臺“如虎添翼”,作為人工智能領(lǐng)域最大最全也最具影響力的云服務(wù)平臺,靈云面向產(chǎn)業(yè)全面開放,以“云 + 端”方式,為產(chǎn)業(yè)界提供國內(nèi)最高水平的靈云語音合成(TTS)、語音識別(ASR)、聲紋識別(VPR)、手寫識別(HWR)、光學字符識別(OCR)、指紋識別(FPR)、人臉識別(AFR)、機器翻譯(MT)、語義理解(NLU)等全方位人工智能能力。靈云平臺自推出以來,通過與華為、中興、阿里、京東、百度等數(shù)以萬記的國內(nèi)外各行各業(yè)企業(yè)的廣泛合作,使中國13億社會大眾充分感受并體驗到各項人工智能技術(shù)為現(xiàn)代生活所帶來的輕松與便捷。秉持開放、分享、合作共贏之發(fā)展理念,靈云平臺成功引領(lǐng)中國人工智能產(chǎn)業(yè)全面進入云服務(wù)時代,2014年,被產(chǎn)業(yè)內(nèi)評為“最具影響力人工智能云服務(wù)平臺”。
伴隨人工智能產(chǎn)業(yè)在世界范圍內(nèi)的高速發(fā)展,伴隨清華靈云人工智能研究中心、清華海峽研究院人工智能研究中心的陸續(xù)創(chuàng)建,捷通華聲將以清華人工智能研究中心研究力量為依托,更加專注人工智能技術(shù)研究與產(chǎn)業(yè)化應(yīng)用,與合作伙伴精誠合作,共同創(chuàng)建良好的人工智能產(chǎn)業(yè)生態(tài),共同推動中國人工智能產(chǎn)業(yè)的發(fā)展進步,為中國人工智能產(chǎn)業(yè)的發(fā)展做出應(yīng)有的貢獻!
靈云能力體驗與更多信息請訪問靈云官網(wǎng):www.hcicloud.com