靈云科技訊:近日,捷通華聲最新靈云嵌入式語音合成技術,iHear 7.0正式登陸靈云平臺,全面向產(chǎn)業(yè)開放。iHear 7.0版在語音合成效果、資源占用、產(chǎn)品功能等多方面全面超越目前市場的同類產(chǎn)品,達到國內(nèi)嵌入式語音合成技術的最高水平。捷通華聲面向智能車載、智能家電、智能家居、穿戴式設備等領域專門開發(fā)的全方位解決方案——靈云種子也藉此全面升級,并開始為國內(nèi)智能終端領域提供最清新的語音合成技術。
回顧2014年,眾多設備商、制造商、互聯(lián)網(wǎng)+公司在內(nèi)的各領域廠商都在智能硬件領域積極投入。業(yè)內(nèi)分析人士認為,除了市場前景廣闊外,智能硬件市場極有可能成為繼移動互聯(lián)網(wǎng)后下一個入口的新興行業(yè),這是海內(nèi)外眾多廠商搶占市場的另一個主要原因。此外,智能硬件系統(tǒng)的普及,也有利于增強消費者粘性,為未來搭建自有平臺做準備。
進入2015年,智能硬件廠商更是如雨后春筍般冒芽而出,從智能手環(huán)到智能手表、從智能車機到智能后視鏡、從智能插座到智能燈泡、從智能電視到智能空調(diào)。然而在硬件大軍的浪潮中,相對應的軟件卻少之又少,雖然各種“云”也有所冒頭,但是,卻鮮有能夠一套方案便能解決智能硬件所需所有功能的云服務。在現(xiàn)在推出的語音云中,大多數(shù)僅固步在“聲”的方向,如語音合成、語音識別等語音交互能力,對于用戶的圖像需求,如人臉識別、指紋識別、手寫識別、光學字符識別等能力則無法實現(xiàn)。
在此種形式下,捷通華聲推出了新一代“靈云種子”一體式解決方案。“靈云種子”融合了靈云(hcicloud。com)平臺語音識別(ASR)、語音合成(TTS)、聲紋識別(VPR)、語義理解(NLU)、手寫識別(HWR)和圖像識別(OCR、指紋識別、人臉識別等)等多項靈云核心技術能力,可實現(xiàn)智能語音交互、智能語音導航、智能語音控制、聲紋安全鎖、智能手寫/手勢輸入、智能圖像識別、身份認證等功能。涵蓋了智能車載、智能家電、智能家居及可穿戴式設備等行業(yè)。可廣泛應用在以下幾種場景中:
語音檢索:支持包括路況導航類、家居菜單智能導航類、周邊服務類、生活服務類、娛樂類等多種語音檢索服務;
消息提醒:人性化定制推送類別:來電提醒、短信提醒、應用提醒,并可將設置在云端;
通訊娛樂:支持短信發(fā)送,電話通訊,多媒體播放,手機操控;
健康服務:支持傳感器,提供傳感器數(shù)據(jù)分析,為用戶提供健康圖表,并結合云端服務提供定制健康指導等現(xiàn)有及正在研發(fā)的能力;
云平臺:基于靈云平臺,提供多設備數(shù)據(jù)同步,私人信息云存儲,智能推薦;
智能支付:結合智能終端特點,提供更便捷、更多樣的智能支付方式。
虛擬現(xiàn)實擴展:將AR技術與LBS技術整合,為用戶提供包括周邊景點商圈實景展示,路線提示,為O2O服務提供優(yōu)秀體驗;
靈云(hcicloud.com)平臺將這些特定領域和場景的智能交互方案經(jīng)過設計和優(yōu)化后,打造出一體化的全智能人機交互解決方案——“靈云種子”。合作伙伴開發(fā)應用時可直接應用“靈云種子”配置的技術服務和內(nèi)容服務,即可完全滿足智能終端行業(yè)需求。
靈云種子自推出以來,為滿足用戶需求,不斷升級以滿足智能車載、智能家電等智能終端設備的快速發(fā)展,靈云種子此次升級,采用了最新的靈云嵌入式語音合成——iHear7.0 Embedded 7.0.0技術,此項技術創(chuàng)造性使用了最新一代高音質(zhì)合成器,音質(zhì)效果更加真實、干凈、細膩;利用模型優(yōu)化了算法,大大提高音色的逼真度和音質(zhì)的細膩度,克服機器味底噪;增加了數(shù)據(jù)訓練流程,比傳統(tǒng)訓練方法穩(wěn)定性更高;優(yōu)化音高算法,使朗讀更加抑揚頓挫;優(yōu)化了計算效率,默認情況下比舊版快2.5倍,資源消耗大幅降低;更全面的地名詞庫,精心裁剪,可辨認全國常見地名、機構名;支持用戶定制化需求:針對用戶特定詞匯、語句保證讀音正確、韻律自然;豐富的語種與發(fā)音人:語種可支持中文普通話、粵語、英語、北方語系方言、臺灣腔調(diào)國語等;已發(fā)布十余種發(fā)音人音色,性別涵蓋男聲、女聲、童聲,涵蓋正式、閑適、可愛、激昂、穩(wěn)重、柔美等各類風格,尤其值得一提的是,最新語音合成技術為導航等特殊領域專門定制,可清晰流暢朗讀全國常見地名、機構名。
2011年,捷通華聲率先推出全球第一個全方位人工智能開放平臺-靈云平臺(hcicloud.com)。靈云平臺是一種可以用語音、手寫、拍照,手勢,將來甚至可使用腦波識別等智能手段來操作、感知手機、計算機等數(shù)字設備的網(wǎng)絡云服務,目標是讓人機交互像人與人溝通一樣的簡單自然。靈云平臺自全面向產(chǎn)業(yè)開放以來,靈云語音識別、語音合成、語義理解等人工智能技術能力通過百度導航、搜狗導航、導航犬、嘀嘀打車、快的打車、天行聽書、靈云輸入法等“家喻戶曉”的經(jīng)典應用服務中國13億社會大眾,使大眾群體充分感受并體驗到智能語音等人工智能技術為現(xiàn)代生活所帶來的輕松與便捷。
靈云平臺作為國內(nèi)外最大的全方位人工智能開放平臺,為促進智能車載、智能家電、智能家居、穿戴式設備等產(chǎn)業(yè)發(fā)展,將靈云智能語音交互(TTS、ASR、VPR)、智能圖像識別(OCR證照識別、文檔識別、名片識別、手寫識別)、生物特征識別(指紋識別、人臉識別)、自然語言理解(NLU)、語義分析、機器翻譯(MT)等人工智能技術能力全面向產(chǎn)業(yè)開放,此舉不但得到了數(shù)千家企業(yè)的支持,更直接推動了人工智能技術在車載、家電、家居、穿戴式設備的發(fā)展與進步。
在中國華南地區(qū),尤其廣州、深圳地區(qū)經(jīng)濟發(fā)達、創(chuàng)新力強,在智能車載、智能家電、智能家居、穿戴式設備擁有獨特優(yōu)勢。由此,捷通華聲在2015年初成立了深圳捷通華聲分公司,旨在依托靈云平臺,利用靈云平臺智能語音、智能圖像、語義理解等全方位人工智能技術能力和豐富完善的智能終端交互解決方案,與華南地區(qū)硬件廠商加強合作關系,發(fā)揮華南地區(qū)智能終端設備研發(fā)和生產(chǎn)的優(yōu)勢,以推動智能終端產(chǎn)業(yè)長足的進步,攜手智能硬件廠商互惠共贏,共同推動中國人工智能產(chǎn)業(yè)的發(fā)展。
更多靈云種子及iHear7.0相關信息,請訪問靈云官網(wǎng):www.hcicloud.com