首頁>>廠商>>軟件開發(fā)商>>microsoft

聲控你的系統(tǒng) Vista語音識別全體驗

2007/03/22

  Vista是微軟首個內(nèi)置了語音識別功能的操作系統(tǒng)。通過這個特性,你可以完成一些任務(wù),例如打開或關(guān)閉程序,保存或刪除文件,通過聽寫輸入文檔并編輯文本等等。下面就一起來分享一下在Vista中使用語音識別的體驗,并講解一下可用的選項。

  隨著科技的發(fā)展,許多的計算機用戶都夢想能夠拋棄他們的鍵盤,遠離他們的鼠標,只用聲音就能夠控制他們的計算機。一些能夠通過聲音指示命令或聽寫文本的程序已經(jīng)存在了很多年,也證實了它們對于那些身體上不能使用其它輸入方法的人來說,是特別有用的,但這樣的程序卻始終沒有得到真正地廣泛普及。

  Windows Vista是微軟第一個內(nèi)置了語音識別功能的操作系統(tǒng)。在以前,語音識別是作為微軟Office XP或Office 2003的一部分,或是通過像Dragon NaturallySpeaking這樣的第三方軟件進行添加。微軟的Voice Command將語音識別功能添加到了Windows移動操作系統(tǒng)中。但無論如何,在這些情況下,你都需要購買并安裝額外的軟件。

圖1 你可以在控制面板中對語音識別進行設(shè)置

  在Vista中,你就不需要再購買其它的東西來對你的計算機說話。但它在默認情況下是沒有啟用的,但它一直都呆在你的控制面板中,時刻嚴陣以待。

  如圖2所示,你也可以在“所有程序|附件|輕松訪問”菜單下找到語音識別特性。圖2 在“輕松訪問”菜單中,你也能看到“語音識別”

它是如何工作的呢?在此,有兩種情況能夠使用語音識別技術(shù):

  1. 用來控制軟件:打開和關(guān)閉程序,以及在它們之間進行切換;保存和刪除文件等等。

  2. 聽寫文本,逐字譯入文檔以及對文本進行編輯。

  開發(fā)者可以使用Vista語音的API來對任何應(yīng)用程序添加語音識別功能。然而,Vista的語音識別目前還不能支持所有語言,它只能夠支持英語(美式和英式)、德語、法語、西班牙語、日語和中文(簡體與繁體)。

對語音識別進行設(shè)置和配置

  在你開始使用語音識別之前,你需要完成以下步驟:

  1. 打開語音識別。

  2. 安裝好你的麥克風(fēng)。

  3. 完成指導(dǎo)學(xué)習(xí)(這并非必須,但推薦這么做)。

  4. 訓(xùn)練識別引擎,使它能理解你的聲音(這也并非必須,但我們還是推薦這么做)。

   當你雙擊控制面板中的“語音識別”,或在“輕松訪問”菜單中選擇“語音識別”時,“語音識別選項”對話框就會出現(xiàn),如圖3所示。

圖3 第一步要做的就是對你的語音識別進行配置

  當你點擊了“啟動語音識別”時,語音控制臺就會出現(xiàn)在屏幕的頂部,如圖4所示。


圖4 語音識別啟動時出現(xiàn)的語音識別控制臺

  如果你將語音識別設(shè)置為當Windows啟動時啟動,那么每當你開啟你的電腦,這個控制臺就會出現(xiàn)在屏幕上方。同時,一個“語音”圖標(趁著藍色圓形背景的一個白色的麥克風(fēng))就會當語音識別啟動時出現(xiàn)在系統(tǒng)托盤處。

  你可以通過右鍵點擊這個麥克風(fēng)圖標來選擇語音選項,無論是在控制臺上的還是系統(tǒng)托盤中的圖標。接著就會顯示如圖5所示的相關(guān)菜單。

圖5 在相關(guān)菜單中你有很多可選項目

在菜單中,你可以做如下選擇:

  開:計算機會聆聽你所說的一切,并嘗試執(zhí)行它能夠識別的命令。
  休眠:計算機會聆聽,但除非你說“開始聆聽”,否則它不會做出任何反應(yīng)。
  關(guān):計算機將不會聆聽你所說的任何東西。
  打開語音參考卡:這是一個便利的簡單說明,關(guān)于一些常用的命令以及如何操作的信息。
  開始語音教程:這是一個互動的簡單視頻教程,它會通過實際操作教你如何使用語音識別。
  幫助:這將會打開幫助文件,告訴你關(guān)于設(shè)置以及使用語音識別的信息。
  選項:在此,你可以選擇是否需要語音識別播放聲訊反饋、啟動時運行、朗讀更正對話框中的文本、以及在所有位置啟用聽寫。
  配置:在此,你可以設(shè)置你的麥克風(fēng)、提高語音識別,或是打開語音控制面板。
  打開語音詞典:你可以添加新的詞到你的詞典中,特別是可以添加一些名字之類引擎難以識別的詞,或是阻止某些詞會被聽寫出來(例如一些你不會聽寫到的詞)。
  聽寫主題:在此僅有一個“敘述性”選項。
  你還可以訪問“Windows語音識別網(wǎng)站”。
  關(guān)于Windows語音識別:這也就是熟悉的Windows“關(guān)于”對話框,它能夠告訴你版本號以及許可授予名。
  打開語音識別。
  退出:關(guān)閉語音識別,控制臺會從屏幕上消失,而語音圖標也會從系統(tǒng)托盤中消失。

設(shè)置麥克風(fēng)

  你可以在語音識別選項對話框或是語音關(guān)聯(lián)菜單中設(shè)置你的麥克風(fēng)。麥克風(fēng)設(shè)置程序首先會要求你確認麥克風(fēng)的類型(頭戴式、桌面式或其它)。程序推薦你使用的是頭戴式麥克風(fēng),而我能夠證明,麥克風(fēng)類型的不同會造成語音識別使用過程中很大的差異。

  第一次我嘗試使用Vista的語音識別時,我使用的是桌面式的麥克風(fēng),在Camtasia中錄制PowerPoint的演示的聲音中的一些任務(wù)中,它能夠很好地完成。然而,當我在 Vista中進行聽寫時,所得到的結(jié)果是非?尚Φ模晃?guī)缀醪荒苈爩懗鰶]有一處錯誤的完整的一個句子,無論我如何清晰、認真地發(fā)音。當我換成花費了比桌面式麥克風(fēng)更昂貴的頭戴式麥克風(fēng)時,準確性就得到了改進,每五六個句子中只會發(fā)生一次錯誤,而不是之前的每個句子中的幾個錯誤。

  在你選擇好麥克風(fēng)類型之后,設(shè)置過程的下一頁會告訴你如何放置麥克風(fēng)的位置能獲得最好的效果。接下來,你會被要求對著麥克風(fēng)大聲閱讀一個短句,如圖6所示。

圖6 你必須對著麥克風(fēng)說話,這樣Windows才能夠自動適應(yīng)你的音量

  現(xiàn)在,麥克風(fēng)就設(shè)置完畢等待使用了。然而,這并不意味著語音引擎就已經(jīng)為你的聲音做好了充分準備。如果你像新聞播報員那樣發(fā)音標準,沒有口音,又總是咬字清晰的話,你也許可以在不做訓(xùn)練的情況下使用語音識別。如果你有一些口音,或是并不能說完全標準的普通話,那么如果你想要獲得更好的使用效果,你需要通過一個訓(xùn)練的過程。

  訓(xùn)練過程就是閱讀屏幕上一系列的文本選段,如圖7所示。

圖7 訓(xùn)練語音引擎以適應(yīng)你的發(fā)音方式能提高語音識別的準確度

使用聲音命令

  現(xiàn)在,你就可以使用你的聲音命令來讓你的計算機完成一些任務(wù)。語音引擎統(tǒng)稱在識別命令上要比聽寫來得準確,因為它僅需要聽取有限的幾個命令。

  首先,確認你的語音控制臺的語音狀態(tài)是“正在聽”。如果不是,那么你就可以說“開始聆聽”,或右鍵點擊麥克風(fēng)圖標并選擇“開:聆聽我說的所有話語”。

  聲音命令的設(shè)計基本上都是盡可能地讓你能夠憑直覺地發(fā)出指令。例如,要打開一個開始菜單中的程序:

  說“點擊開始”

  說“點擊所有程序”

  說“Office Word 2007”(或是在“程序”菜單中任何其它你想要打開的程序名稱)

  簡單的命令是很容易使用的。但在一些程序中進行一些操作時則會更具一些挑戰(zhàn),但你還是能夠做到的。

  如果你想要點擊一個按鈕或是連接,而它的名字是你不知道的,例如Office中,左上角的Office標志按鈕,那么這時你該怎么做呢?在此有一個巧妙的方法:只需要說“顯示編號”,在當前活動窗口中所有能夠互動的元素就會被數(shù)字所覆蓋,如圖8所示。

圖8 “顯示編號”能夠幫助你點擊不知道名字的按鈕或鏈接

  現(xiàn)在,你所需要做的就是說出你想要點擊的按鈕的編號。之后,一個“確定”就會出現(xiàn)在對應(yīng)的元素上。說“確定”,你就點擊了這個按鈕。

獲得幫助

  如果你不明白一些事要如何操作,你可以通過說“我能說什么”來使用幫助。在使用“我能說什么”命令之后,Windows的幫助和支持就會彈出,你可以在里面尋找你所需要的幫助信息。

圖9 你可以通過說“我能說什么”打開幫助獲得相關(guān)信息

聽寫文本

  你可以在任何可以使用語音的應(yīng)用程序中通過聽寫輸入文本。你不會像過去那樣,只能在微軟的Office應(yīng)用程序中才能夠使用。例如,你可以在記事本或是寫字板中聽寫文本。

  在默認情況下,我無法在Open Office和其它非微軟的程序中聽寫文本,但我可以通過語音關(guān)聯(lián)菜單中的“選項|在所有位置啟用聽寫”,這樣就能夠在那些不是自動接受聽寫的程序中聽寫輸入文本,這樣我就能夠在Open Office中進行聽寫輸入了。然而,它工作起來的效果就不如在微軟的程序中所使用的效果。它不能在我說的時候馬上輸入文本,它會彈出一些可選的提示讓我選擇。使用語音API,開發(fā)者能夠讓他們的應(yīng)用程序可以使用語音,而更多的可能在將來就能夠使用。

小貼士:

  當你在聽寫的時候,Vista會將你所說的所有東西輸入文檔。這也許會造成一些不便,如果當你在編輯文檔時,有一會兒可能聽下來去與同事談話,之后你可能會發(fā)現(xiàn)你的談話內(nèi)容也輸入了文檔。當你希望有些話語不被轉(zhuǎn)譯到文檔中時,你可以先說“停止聆聽”,再開始說其它內(nèi)容。

  Vista在轉(zhuǎn)譯你的聽寫時很可能會產(chǎn)生錯誤。而只得慶幸的是它們能夠很容易地得到糾正。例如,如果你說“我現(xiàn)在能說任何”,而Vista輸入的是“我不能說任何”,這時你可以說“更正不能”,接著你就會看到一個清單,里面列有可替換的詞,如圖10所示。

圖10 你只需要在列表中選擇替換詞語進行錯誤更正

  如果你要更正的錯誤不再列表中,只需要再次說出詞語,就會有新的列表出現(xiàn)在其中供你選擇。當你想輸入英文時,它可能會不能識別,你可以說“拼寫”來將英文單詞拼寫出來。

圖11 你可以通過“拼寫”輸入英文單詞

高級配置設(shè)置

  你可以通過點擊語音識別選項對話框左邊窗格中的“高級語音選項”鏈接來訪問一些高級的配置設(shè)置,如圖12所示。

圖12 你可以在此設(shè)置高級配置選項并進行用戶設(shè)置

  在此,你可以創(chuàng)建并進行用戶設(shè)置。這當你的計算機不止一人使用時就顯得特別有用。你可以選擇是否在啟動時就運行語音識別,以及是否允許計算機檢查文檔和郵件,以提高語音識別的準確性。

  此外,你還可以選擇在標點符號后插入的空格數(shù),并調(diào)節(jié)麥克風(fēng)的等級。

語音識別的局限性

  在對語音識別進行了一個半小時的訓(xùn)練后,我感受到了Vista準確的語音識別所帶來的輕松使用的感受。之前我也試用過一些聽寫程序,但都沒有發(fā)現(xiàn)它們具有足夠的實用性,我使用鍵盤輸入總是要比聽寫出正確的文本要快的多。但現(xiàn)在我的感受就是,如果我失去了雙手,還是有辦法能夠讓我的工作繼續(xù)得以完成。對于我來說,語音識別結(jié)合鍵盤輸入就能達到完美的工作效果。

  然而,我是在一臺具有Core Duo processor和2GB內(nèi)存的計算機上使用Vista,我不敢保證如果在性能稍遜一些的計算機上使用時它能有多迅速。我一直使用的也是最上乘的麥克風(fēng)。之前我提到過,在我的體驗中,使用桌面式的麥克風(fēng)是不能很好地完成工作的。使用你自己的聲音進行一些訓(xùn)練也能夠帶來不同的效果。

  顯然,語音識別是不能在嘈雜的環(huán)境下很好地工作的,比如你身在一個與其他人公用的辦公室中,而其他人在你工作的時候打電話。另外,當你在聽音樂或廣播時,它也無法良好地工作。

安全問題

  在你決定一直都對著你的計算機說話的時候,請意識到使用語音識別會存在一個安全問題。攻擊者可能將一個聲音文件植入,當你瀏覽網(wǎng)頁時能夠自動播放,或使用電子郵件將聲音文件發(fā)送給你,當你雙擊時它就會自動播放。如果所播放的聲音文件傳入你的麥克風(fēng),而它又是Vista的語音引擎能夠識別的命令,那么語音識別就會將它運行,計算機就會執(zhí)行這個命令。

  但這并不需要引起太大的恐慌。因為在Vista中要以管理員身份執(zhí)行大多數(shù)命令的時候,你都需要回應(yīng)用戶帳戶控制的提示,而這是不能通過聲音來做到的。但是,攻擊者還是有可能使用這種方法刪除你計算機上的文件。

  當語音識別處在休眠模式下時,它僅會對“開始聆聽”命令做出反應(yīng),但攻擊者很容易就能將這個詞組當成一個聲音文件。因此,當你不使用它時,你應(yīng)該習(xí)慣地將語音識別完全關(guān)閉,而不是僅讓它處在休眠模式,并且不要設(shè)置它在Windows啟動時隨之運行。

www.17tech.com



相關(guān)鏈接:
微軟國內(nèi)首推Push mail 酷派3G產(chǎn)品率先支持 2009-09-28
鮑爾默:我們搞砸了Windows Mobile 7 2009-09-25
微軟全球基礎(chǔ)服務(wù)部門副總裁離職加盟思科 2009-09-24
微軟推最新手機操作系統(tǒng)WindowsMobile6.5 2009-09-04
微軟Windows Mobile 6.5系統(tǒng)手機10月上市 2009-09-02

分類信息: