聲控你的系統(tǒng) Vista語音識別全體驗
2007/03/22
Vista是微軟首個內(nèi)置了語音識別功能的操作系統(tǒng)。通過這個特性,你可以完成一些任務(wù),例如打開或關(guān)閉程序,保存或刪除文件,通過聽寫輸入文檔并編輯文本等等。下面就一起來分享一下在Vista中使用語音識別的體驗,并講解一下可用的選項。圖1 你可以在控制面板中對語音識別進行設(shè)置
在Vista中,你就不需要再購買其它的東西來對你的計算機說話。但它在默認情況下是沒有啟用的,但它一直都呆在你的控制面板中,時刻嚴陣以待。
如圖2所示,你也可以在“所有程序|附件|輕松訪問”菜單下找到語音識別特性。圖2 在“輕松訪問”菜單中,你也能看到“語音識別”
它是如何工作的呢?在此,有兩種情況能夠使用語音識別技術(shù):
開發(fā)者可以使用Vista語音的API來對任何應(yīng)用程序添加語音識別功能。然而,Vista的語音識別目前還不能支持所有語言,它只能夠支持英語(美式和英式)、德語、法語、西班牙語、日語和中文(簡體與繁體)。
對語音識別進行設(shè)置和配置
在你開始使用語音識別之前,你需要完成以下步驟:
當你雙擊控制面板中的“語音識別”,或在“輕松訪問”菜單中選擇“語音識別”時,“語音識別選項”對話框就會出現(xiàn),如圖3所示。
圖3 第一步要做的就是對你的語音識別進行配置
當你點擊了“啟動語音識別”時,語音控制臺就會出現(xiàn)在屏幕的頂部,如圖4所示。
圖4 語音識別啟動時出現(xiàn)的語音識別控制臺
如果你將語音識別設(shè)置為當Windows啟動時啟動,那么每當你開啟你的電腦,這個控制臺就會出現(xiàn)在屏幕上方。同時,一個“語音”圖標(趁著藍色圓形背景的一個白色的麥克風(fēng))就會當語音識別啟動時出現(xiàn)在系統(tǒng)托盤處。
你可以通過右鍵點擊這個麥克風(fēng)圖標來選擇語音選項,無論是在控制臺上的還是系統(tǒng)托盤中的圖標。接著就會顯示如圖5所示的相關(guān)菜單。
圖5 在相關(guān)菜單中你有很多可選項目
在菜單中,你可以做如下選擇:
開:計算機會聆聽你所說的一切,并嘗試執(zhí)行它能夠識別的命令。
休眠:計算機會聆聽,但除非你說“開始聆聽”,否則它不會做出任何反應(yīng)。
關(guān):計算機將不會聆聽你所說的任何東西。
打開語音參考卡:這是一個便利的簡單說明,關(guān)于一些常用的命令以及如何操作的信息。
開始語音教程:這是一個互動的簡單視頻教程,它會通過實際操作教你如何使用語音識別。
幫助:這將會打開幫助文件,告訴你關(guān)于設(shè)置以及使用語音識別的信息。
選項:在此,你可以選擇是否需要語音識別播放聲訊反饋、啟動時運行、朗讀更正對話框中的文本、以及在所有位置啟用聽寫。
配置:在此,你可以設(shè)置你的麥克風(fēng)、提高語音識別,或是打開語音控制面板。
打開語音詞典:你可以添加新的詞到你的詞典中,特別是可以添加一些名字之類引擎難以識別的詞,或是阻止某些詞會被聽寫出來(例如一些你不會聽寫到的詞)。
聽寫主題:在此僅有一個“敘述性”選項。
你還可以訪問“Windows語音識別網(wǎng)站”。
關(guān)于Windows語音識別:這也就是熟悉的Windows“關(guān)于”對話框,它能夠告訴你版本號以及許可授予名。
打開語音識別。
退出:關(guān)閉語音識別,控制臺會從屏幕上消失,而語音圖標也會從系統(tǒng)托盤中消失。
設(shè)置麥克風(fēng)
你可以在語音識別選項對話框或是語音關(guān)聯(lián)菜單中設(shè)置你的麥克風(fēng)。麥克風(fēng)設(shè)置程序首先會要求你確認麥克風(fēng)的類型(頭戴式、桌面式或其它)。程序推薦你使用的是頭戴式麥克風(fēng),而我能夠證明,麥克風(fēng)類型的不同會造成語音識別使用過程中很大的差異。
第一次我嘗試使用Vista的語音識別時,我使用的是桌面式的麥克風(fēng),在Camtasia中錄制PowerPoint的演示的聲音中的一些任務(wù)中,它能夠很好地完成。然而,當我在
Vista中進行聽寫時,所得到的結(jié)果是非?尚Φ模晃?guī)缀醪荒苈爩懗鰶]有一處錯誤的完整的一個句子,無論我如何清晰、認真地發(fā)音。當我換成花費了比桌面式麥克風(fēng)更昂貴的頭戴式麥克風(fēng)時,準確性就得到了改進,每五六個句子中只會發(fā)生一次錯誤,而不是之前的每個句子中的幾個錯誤。
在你選擇好麥克風(fēng)類型之后,設(shè)置過程的下一頁會告訴你如何放置麥克風(fēng)的位置能獲得最好的效果。接下來,你會被要求對著麥克風(fēng)大聲閱讀一個短句,如圖6所示。
圖6 你必須對著麥克風(fēng)說話,這樣Windows才能夠自動適應(yīng)你的音量
現(xiàn)在,麥克風(fēng)就設(shè)置完畢等待使用了。然而,這并不意味著語音引擎就已經(jīng)為你的聲音做好了充分準備。如果你像新聞播報員那樣發(fā)音標準,沒有口音,又總是咬字清晰的話,你也許可以在不做訓(xùn)練的情況下使用語音識別。如果你有一些口音,或是并不能說完全標準的普通話,那么如果你想要獲得更好的使用效果,你需要通過一個訓(xùn)練的過程。
訓(xùn)練過程就是閱讀屏幕上一系列的文本選段,如圖7所示。
圖7 訓(xùn)練語音引擎以適應(yīng)你的發(fā)音方式能提高語音識別的準確度
使用聲音命令
現(xiàn)在,你就可以使用你的聲音命令來讓你的計算機完成一些任務(wù)。語音引擎統(tǒng)稱在識別命令上要比聽寫來得準確,因為它僅需要聽取有限的幾個命令。
首先,確認你的語音控制臺的語音狀態(tài)是“正在聽”。如果不是,那么你就可以說“開始聆聽”,或右鍵點擊麥克風(fēng)圖標并選擇“開:聆聽我說的所有話語”。
聲音命令的設(shè)計基本上都是盡可能地讓你能夠憑直覺地發(fā)出指令。例如,要打開一個開始菜單中的程序:
說“點擊開始”
說“點擊所有程序”
說“Office Word 2007”(或是在“程序”菜單中任何其它你想要打開的程序名稱)
簡單的命令是很容易使用的。但在一些程序中進行一些操作時則會更具一些挑戰(zhàn),但你還是能夠做到的。
如果你想要點擊一個按鈕或是連接,而它的名字是你不知道的,例如Office中,左上角的Office標志按鈕,那么這時你該怎么做呢?在此有一個巧妙的方法:只需要說“顯示編號”,在當前活動窗口中所有能夠互動的元素就會被數(shù)字所覆蓋,如圖8所示。
圖8 “顯示編號”能夠幫助你點擊不知道名字的按鈕或鏈接
現(xiàn)在,你所需要做的就是說出你想要點擊的按鈕的編號。之后,一個“確定”就會出現(xiàn)在對應(yīng)的元素上。說“確定”,你就點擊了這個按鈕。
獲得幫助
如果你不明白一些事要如何操作,你可以通過說“我能說什么”來使用幫助。在使用“我能說什么”命令之后,Windows的幫助和支持就會彈出,你可以在里面尋找你所需要的幫助信息。
圖9 你可以通過說“我能說什么”打開幫助獲得相關(guān)信息
聽寫文本
你可以在任何可以使用語音的應(yīng)用程序中通過聽寫輸入文本。你不會像過去那樣,只能在微軟的Office應(yīng)用程序中才能夠使用。例如,你可以在記事本或是寫字板中聽寫文本。
在默認情況下,我無法在Open Office和其它非微軟的程序中聽寫文本,但我可以通過語音關(guān)聯(lián)菜單中的“選項|在所有位置啟用聽寫”,這樣就能夠在那些不是自動接受聽寫的程序中聽寫輸入文本,這樣我就能夠在Open
Office中進行聽寫輸入了。然而,它工作起來的效果就不如在微軟的程序中所使用的效果。它不能在我說的時候馬上輸入文本,它會彈出一些可選的提示讓我選擇。使用語音API,開發(fā)者能夠讓他們的應(yīng)用程序可以使用語音,而更多的可能在將來就能夠使用。
小貼士:
當你在聽寫的時候,Vista會將你所說的所有東西輸入文檔。這也許會造成一些不便,如果當你在編輯文檔時,有一會兒可能聽下來去與同事談話,之后你可能會發(fā)現(xiàn)你的談話內(nèi)容也輸入了文檔。當你希望有些話語不被轉(zhuǎn)譯到文檔中時,你可以先說“停止聆聽”,再開始說其它內(nèi)容。
Vista在轉(zhuǎn)譯你的聽寫時很可能會產(chǎn)生錯誤。而只得慶幸的是它們能夠很容易地得到糾正。例如,如果你說“我現(xiàn)在能說任何”,而Vista輸入的是“我不能說任何”,這時你可以說“更正不能”,接著你就會看到一個清單,里面列有可替換的詞,如圖10所示。
圖10 你只需要在列表中選擇替換詞語進行錯誤更正
如果你要更正的錯誤不再列表中,只需要再次說出詞語,就會有新的列表出現(xiàn)在其中供你選擇。當你想輸入英文時,它可能會不能識別,你可以說“拼寫”來將英文單詞拼寫出來。
圖11 你可以通過“拼寫”輸入英文單詞
高級配置設(shè)置
你可以通過點擊語音識別選項對話框左邊窗格中的“高級語音選項”鏈接來訪問一些高級的配置設(shè)置,如圖12所示。
圖12 你可以在此設(shè)置高級配置選項并進行用戶設(shè)置
在此,你可以創(chuàng)建并進行用戶設(shè)置。這當你的計算機不止一人使用時就顯得特別有用。你可以選擇是否在啟動時就運行語音識別,以及是否允許計算機檢查文檔和郵件,以提高語音識別的準確性。
此外,你還可以選擇在標點符號后插入的空格數(shù),并調(diào)節(jié)麥克風(fēng)的等級。
語音識別的局限性
在對語音識別進行了一個半小時的訓(xùn)練后,我感受到了Vista準確的語音識別所帶來的輕松使用的感受。之前我也試用過一些聽寫程序,但都沒有發(fā)現(xiàn)它們具有足夠的實用性,我使用鍵盤輸入總是要比聽寫出正確的文本要快的多。但現(xiàn)在我的感受就是,如果我失去了雙手,還是有辦法能夠讓我的工作繼續(xù)得以完成。對于我來說,語音識別結(jié)合鍵盤輸入就能達到完美的工作效果。
然而,我是在一臺具有Core Duo processor和2GB內(nèi)存的計算機上使用Vista,我不敢保證如果在性能稍遜一些的計算機上使用時它能有多迅速。我一直使用的也是最上乘的麥克風(fēng)。之前我提到過,在我的體驗中,使用桌面式的麥克風(fēng)是不能很好地完成工作的。使用你自己的聲音進行一些訓(xùn)練也能夠帶來不同的效果。
顯然,語音識別是不能在嘈雜的環(huán)境下很好地工作的,比如你身在一個與其他人公用的辦公室中,而其他人在你工作的時候打電話。另外,當你在聽音樂或廣播時,它也無法良好地工作。
安全問題
在你決定一直都對著你的計算機說話的時候,請意識到使用語音識別會存在一個安全問題。攻擊者可能將一個聲音文件植入,當你瀏覽網(wǎng)頁時能夠自動播放,或使用電子郵件將聲音文件發(fā)送給你,當你雙擊時它就會自動播放。如果所播放的聲音文件傳入你的麥克風(fēng),而它又是Vista的語音引擎能夠識別的命令,那么語音識別就會將它運行,計算機就會執(zhí)行這個命令。
但這并不需要引起太大的恐慌。因為在Vista中要以管理員身份執(zhí)行大多數(shù)命令的時候,你都需要回應(yīng)用戶帳戶控制的提示,而這是不能通過聲音來做到的。但是,攻擊者還是有可能使用這種方法刪除你計算機上的文件。
當語音識別處在休眠模式下時,它僅會對“開始聆聽”命令做出反應(yīng),但攻擊者很容易就能將這個詞組當成一個聲音文件。因此,當你不使用它時,你應(yīng)該習(xí)慣地將語音識別完全關(guān)閉,而不是僅讓它處在休眠模式,并且不要設(shè)置它在Windows啟動時隨之運行。
微軟國內(nèi)首推Push mail 酷派3G產(chǎn)品率先支持 2009-09-28 |
鮑爾默:我們搞砸了Windows Mobile 7 2009-09-25 |
微軟全球基礎(chǔ)服務(wù)部門副總裁離職加盟思科 2009-09-24 |
微軟推最新手機操作系統(tǒng)WindowsMobile6.5 2009-09-04 |
微軟Windows Mobile 6.5系統(tǒng)手機10月上市 2009-09-02 |