日前,Google推出旗下云端語(yǔ)音識(shí)別API(Cloud Speech API)正式版(GA),Google云端語(yǔ)音識(shí)別服務(wù)能夠?qū)崟r(shí)辨識(shí)80種以上的語(yǔ)言,轉(zhuǎn)換成文字,連正體中文也可以辨識(shí)。
Google在2016年夏天釋出云端語(yǔ)音識(shí)別API公開(kāi)測(cè)試版,現(xiàn)在終于推出正式版,提供云端開(kāi)發(fā)人員使用。
而云端語(yǔ)音識(shí)別API采用與Google Now、Google搜尋及Google Assistant相同的語(yǔ)音識(shí)別技術(shù),根據(jù)Google,云端語(yǔ)音識(shí)別API是幾款預(yù)先訓(xùn)練機(jī)器學(xué)習(xí)模型(Pre-Trained Machine-Learning Model)的其中之一,可以用來(lái)執(zhí)行如影像分析、圖像分析、文字分析和動(dòng)態(tài)翻譯等常見(jiàn)的任務(wù)。
在正式版的云端語(yǔ)音識(shí)別API,Google加強(qiáng)了長(zhǎng)度較長(zhǎng)的音頻檔案轉(zhuǎn)錄精準(zhǔn)度,以及新增支持WAV、Opus和Speex文件格式。Google也聲稱,新版語(yǔ)音識(shí)別API比舊版的批處理速度快3倍。
另外,目前已有廠商采用Google云端語(yǔ)音識(shí)別API,根據(jù)Google官網(wǎng),美國(guó)德州的電話語(yǔ)音SaaS開(kāi)發(fā)商InteractiveTel采用Google云端語(yǔ)音識(shí)別服務(wù),透過(guò)實(shí)時(shí)的語(yǔ)音轉(zhuǎn)文字,來(lái)分析業(yè)者與顧客在電話中的互動(dòng),以協(xié)助業(yè)者提升銷售業(yè)績(jī)。