- 計算機應(yīng)用技術(shù)基礎(chǔ)
- 程向前主編
- 2725字
- 2018-12-27 20:35:58
1.3 數(shù)據(jù)輸入綜合應(yīng)用
計算機中的信息處理過程中理想的字符輸入方式是利用語音或圖像識別技術(shù)“自動”將文本輸入到計算機中,使計算機能認(rèn)識漢字(包括手寫體),聽懂漢語,并將其轉(zhuǎn)換為機內(nèi)代碼表示。目前這種理想已經(jīng)成為現(xiàn)實。
1.3.1 光學(xué)字符識別
光學(xué)字符識別(Optical Character Recognition, OCR)是指通過掃描等光學(xué)輸入方式,將各種票據(jù)、報刊、書籍、文稿及其他印刷品的文字轉(zhuǎn)化為圖像信息,再利用文字識別技術(shù)將圖像信息轉(zhuǎn)化為可以使用的計算機輸入技術(shù)。其基本原理是:利用光學(xué)技術(shù)對含有文字或字符的紙介質(zhì)進行掃描、識別并轉(zhuǎn)換成計算機內(nèi)碼。所需要的軟件、硬件支持包括:掃描儀(見圖1-32)、OCR識別軟件。OCR的優(yōu)點在于,非鍵盤輸入,速度最快,所以主要的行業(yè)應(yīng)用包括:銀行票據(jù)、大量文字資料(如圖書館館藏圖書)、檔案卷宗等。但是OCR對手寫體漢字的輸入有較大的局限性。

圖1-32 掃描儀工作圖
下面是一個運用OCR對在線電子文檔進行識別的案例。
PDF文件是因特網(wǎng)上最為流行的電子文檔格式,許多期刊、書籍在網(wǎng)上流通的版本保存成為PDF文檔,這個事實通過Google的高級搜索的文件分類檢索可以說明。PDF文檔中保存的文字信息有相當(dāng)一部分實際上是掃描得到的圖像,所以不可以直接通過復(fù)制、粘貼來選取其中的文字材料進行引用或編輯,但是再次錄入無疑是令人頭痛的重復(fù)勞動。這個問題可以通過以下方式解決:
1)在畫圖軟件中顯示在PDF閱讀器中的文本,通過屏幕截圖,得到含有文字的位圖信息(見圖1-33)。

圖1-33 利用畫圖軟件可以將屏幕截圖轉(zhuǎn)為黑白格式
2)將圖像成為黑白二值的BMP格式文件(見圖1-34)。

圖1-34 將位圖文件保存成二值格式
3)通過OCR軟件,將圖像文件中的文字識別成為可編輯文本(見圖1-35)。

圖1-35 通過OCR軟件將圖像信息識別、轉(zhuǎn)換成文本信息
由于轉(zhuǎn)換過程中可能由于受文字的色彩、大小和其他因素的影響,轉(zhuǎn)換得到的文字中可能存在誤碼或錯字,需要仔細(xì)校對后方能采用。
OCR軟件為用戶提供了簡體、繁體、英文、手寫等不同的識別方式,以及豎排、表格等版面模式,千萬不要在OCR文字識別過程中搞混。
通常而言,OCR對不能完全確定的文字,會顯示出藍(lán)色,請用戶確認(rèn)。但值得注意的是,在沒有提示出錯的地方,也有可能出錯,尤其是中文文本中的英文單詞,OCR一般會將其作為中文識別,錯誤率非常高。所以在校對時,可以先通讀一遍,以提高文字校對的效率。
特別注意容易出現(xiàn)識別錯誤的地方,包括:數(shù)字“1”和字母“l(fā)”,各種全角和半角的標(biāo)點符號,電子郵件中的“@”符號等。上述符號如果出現(xiàn)在電子郵件地址中,結(jié)果就是郵件無法發(fā)送。
1.3.2 手寫字體輸入
手寫字體輸入常見于手機等嵌入式產(chǎn)品,使用方便,但輸入效率較低,需要專用的手寫板、筆、手機、PDA(掌上電腦)感應(yīng)屏幕等硬件支持。
手寫輸入漢字利用輸入設(shè)備(如輸入板或鼠標(biāo))模仿成一支筆進行書寫,輸入板或屏幕中內(nèi)置的高精密的電子信號采集系統(tǒng)將筆畫變?yōu)橐痪S電信號,輸入計算機的是以坐標(biāo)點序列表示的筆尖移動軌跡,因而被處理的是一維的線條(筆畫)串,這些線條串含有筆畫數(shù)目、筆畫走向、筆順和書寫速度等信息。
手寫輸入漢字解決了聯(lián)機手寫漢字的識別率問題,其中較為有名的產(chǎn)品有北京漢王科技有限公司的“漢王筆”和摩托羅拉公司的“慧筆”。利用手寫輸入可以解決兩個問題:冷門字或只會寫不會讀的字的輸入;要求對電子文檔進行手寫體簽名的輸入。
漢王提供的手寫輸入有三種模式:框式輸入、任意位置書寫、繪圖板(見圖1-36)。同樣,在Office XP中,手寫輸入必須在微軟自帶的輸入法下才有效。

圖1-36 輸入法中的手寫選項
“框式輸入”模式的手寫范圍限定在左邊框的范圍內(nèi),單擊右邊的“查找”按鈕,在中間框顯示與左邊框相似的文字供選擇(見圖1-37)。

圖1-37 “框式輸入”模式
“任意位置書寫”模式可在屏幕任意位置書寫,隨意性較大,容易干擾視線。
“繪圖板”也規(guī)定了書寫范圍,書寫的字作為圖形對象插入到文檔中。
但是,手寫輸入的速度慢,使用不方便,長期操作眼睛特別辛苦,這些都是手寫輸入難以逾越的障礙。由于在使用計算機輸入時,錄入者要同時照顧書寫板和屏幕,眼睛特別容易疲勞,不可能實現(xiàn)大量漢字的輸入。因此,手寫輸入只會在特定人群中流行,如:對計算機不熟悉只需要輸入少量的漢字,或需要簽名的人士。同時,PDA和手機也可以采用筆輸入,因為機器尺寸小,鍵盤輸入不方便。
1.3.3 漢字語音輸入
漢字語音輸入,源于語音識別技術(shù),通常是采用語言相關(guān)的信息模型進行統(tǒng)計處理和基于規(guī)則方法進行歧義判別。例如,我們平時說話,說一個字的時候,由于有重碼,別人可能聽不懂,但是說上一個詞語,別人能聽懂的可能性增加,當(dāng)說上一句話的時候,旁人就都懂了,這是因為話語中的字和詞相互之間是關(guān)聯(lián)的。將這種關(guān)聯(lián)因素以量化方式進行統(tǒng)計分析,得出常用詞語之間搭配的統(tǒng)計數(shù)量關(guān)系,計算機根據(jù)這種數(shù)量關(guān)系,通常能夠在一定范圍具備“智力”。對錄制的語音進行識別,有時還需要采取一定的語言規(guī)則,對統(tǒng)計方法進行補充,以提高機器的智力水平。
20世紀(jì)90年代中后期,IBM推出中文普通話的語音輸入系統(tǒng)ViaVoice,實現(xiàn)了每分鐘150字以上的高速輸入,這是目前語音輸入中的佼佼者。IBM ViaVoice是專業(yè)語音識別輸入系統(tǒng),正確率可達95%,可用于所有打開的程序,包括控制瀏覽器的某些操作。
微軟的語音輸入識別正確率可達85%以上,僅用于Office軟件產(chǎn)品,不能應(yīng)用于整個系統(tǒng)和其他軟件。
計算機對語音識別方法主要通過樣板匹配法,即對輸入的語音信息與識別系統(tǒng)中的詞匯表內(nèi)的詞條進行匹配來實現(xiàn)語音識別,所以漢字語音輸入的重要條件是中文語言資料庫(又叫語料庫),語音識別技術(shù)的效率與語料庫的大小、說話人的口音等因素有關(guān)。因此,為了提高識別率,一般語音識別系統(tǒng)為使用者提供了語音識別訓(xùn)練,以掌握使用者的口音、語調(diào)、語速以及朗讀習(xí)慣,便于提高識別率。
在Microsoft Office中,語音輸入有“聽寫”和“聲音命令”兩種工作模式(見圖1-38)。“聽寫”利用語音輸入文字;“聲音命令”利用聲音來對菜單、工具欄和對話框發(fā)出控制命令,實現(xiàn)對文檔的對應(yīng)操作。

圖1-38 微軟輸入法中的語音輸入
當(dāng)用戶第一次執(zhí)行“工具 — 語音”命令時,Office將彈出語音識別向?qū)В屪R別系統(tǒng)對讀者個人的語音進行識別訓(xùn)練(見圖1-39和圖1-40)。整個訓(xùn)練大概持續(xù)10分鐘左右。在Microsoft Office中,語音輸入必須在微軟自帶的輸入法模式下才有效使用。

圖1-39 調(diào)節(jié)麥克風(fēng)音量

圖1-40 識別系統(tǒng)對讀者個人的語音進行識別訓(xùn)練
語音輸入的不足之處在于,它要求輸入環(huán)境的安靜與發(fā)音的準(zhǔn)確和洪亮。由于系統(tǒng)中語料庫的前后關(guān)聯(lián),一處錯誤就會引發(fā)出一連串的錯誤。若朗讀者的地方口音偏重,則輸入結(jié)果更不可想象。專業(yè)錄入員采用這種方式工作,寬敞的計算機房變成一個個隔音的小空間,而且連續(xù)數(shù)小時的朗讀,無疑勞動強度會很大。非專業(yè)人士使用計算機錄入,通常是一邊思考,一邊錄入,而語音輸入要求輸入者高度集中在語音的準(zhǔn)確、流暢上,而很難把注意力放在問題的思考上。
- AutoCAD 2012中文版基礎(chǔ)教程
- 計算機組成原理
- 用戶體驗定律:簡單好用的產(chǎn)品設(shè)計法則
- 測試設(shè)計思想
- 大學(xué)計算機:計算思維導(dǎo)學(xué)
- 全國高等院校計算機基礎(chǔ)教育研究會2016年會學(xué)術(shù)論文集(高職)
- 深度學(xué)習(xí):從基礎(chǔ)到實踐(全2冊)
- 光榮與夢想:互聯(lián)網(wǎng)口述系列叢書·張樹新篇
- 思科網(wǎng)絡(luò)技術(shù)學(xué)院教程:IT基礎(chǔ)(第7版)
- VRML虛擬現(xiàn)實應(yīng)用技術(shù)
- Windows Server 2008操作系統(tǒng)項目教程
- 計算學(xué)科導(dǎo)論
- 計算機應(yīng)用技術(shù)基礎(chǔ)
- 數(shù)字廣告系統(tǒng):技術(shù)、產(chǎn)品與市場
- 工業(yè)互聯(lián)網(wǎng)平臺理論架構(gòu)、評價方法與應(yīng)用實踐