語音合成在人機交互中扮演著重要的角色。隨著個性化產(chǎn)品需求,滿足產(chǎn)品的應用場景和用戶體驗,對于合成語音的要求也越來越高,流暢、連貫、自然已經(jīng)不能滿足,音色豐富,逼近真人、富有情感成為了市場發(fā)展需要。
目前,極限元語音合成技術已與百度、騰訊、搜狗、奇虎360、語文出版社等眾多客戶建立了長期穩(wěn)定的合作關系。無論是呼叫中心的智能客服、智能機器人、車載導航,智能家居、有聲讀物等應用場景下,所需要的甜美女生、渾厚男聲,還是特定場景下的明星聲音、可愛童聲、游戲動漫角色聲,極限元的語音合成技術都能夠幫助有需求的企業(yè)快速獲得。
結合市場發(fā)展和用戶需求,不同的企業(yè)為了更好展現(xiàn)產(chǎn)品特性,對于合成的語音就有了不同的要求,如:機場、車站廣播;銀行、醫(yī)院叫號需要甜美的女聲,而金融催款行業(yè)中,則需要渾厚聲音,略帶嚴厲,才有震懾力。極限元的語音合成技術全面支持多語種、多音色的選擇。
在語音合成技術的應用環(huán)節(jié)中,為了將聲音和場景能夠很好的契合,語音合成定制化的需求越來越高。極限元提供全方位的語音合成定制化服務,為有需要的企業(yè)和用戶提供專屬聲音,滿足用戶的不同應用場景和個性化的音色需求。如:林志玲的嗲氣十足,郭德綱幽默逗趣,稚氣呆萌的童聲、游戲動漫角色聲、各類方言等!秳(chuàng)新中國》紀錄片的節(jié)目解說配音就是采用語音合成技術重現(xiàn)已逝的知名播音員、配音員李易老師的聲音。極限元語音合成定制化支持錄音人選型、錄音采集、語料標注,還能實現(xiàn)模型迭代訓練、合成引擎優(yōu)化,支持在線、離線模式,適用于多種平臺。
讓合成語音飽含豐富的情感,還有很長的路要走。在情感語音合成領域,極限元與國際接軌,其創(chuàng)始團隊源自中科院自動化研究所并成立“智能交互聯(lián)合實驗室”,號稱語音合成界的“黃埔軍校”;在人工智能領域有20多年技術積累,在國際會議和期刊上發(fā)表論文400余篇,申請語音及音頻領域專利100余項;作為負責人、科研骨干參與多項國家自然基金項目、國家863項目和國家重點研發(fā)計劃等項目,獲得多媒體情感競賽第二名、北京市自然科學進步二等獎、中國專利獎優(yōu)秀獎、北京科技進步獎、Eurospeech大會獎等多種獎項。