發(fā)表時間:2023-06-23 來源:明輝站整理相關(guān)軟件相關(guān)文章人氣:
清華紫光OCR官方版是一款專業(yè)優(yōu)秀的圖像識別工具。清華紫光OCR最新版能夠直接將圖片信息提取出來,支持從TIF、BMP和PCX圖片格式中讀取文字內(nèi)容。清華紫光OCR軟件還支持簡/繁體中文、英文和手寫中英文,可以快速完成識別,識別率、準(zhǔn)確率都十分的高。
清華紫光OCR軟件功能
清華紫光OCR支持Windows環(huán)境下的GB、BIG5、JIS和Shift-JIS等多種內(nèi)碼。在印刷體漢字識別中還加入了MMX優(yōu)化技術(shù),使識別速度得到了很大提高。我們用它識別一頁A4大小的印刷體中英文混排的純文本文件,只用了幾秒鐘。而且識別率非常高,只有極個別的字出現(xiàn)了差錯。
在這個版本中新增了表格識別功能。選擇了識別表格的選項后,它會自動將表格的框線先識別出來,再對表格中的文字進行識別。文字全部識別出來之后會將文字按原樣恢復(fù)到表格中。在這項測試中識別率也很不錯。但是在測試中我們的工程師發(fā)現(xiàn),當(dāng)文字與表格的框線距離較近時,它的識別效果就沒有那么理想了。
如果用戶想對一個圖文混排的文件進行識別,則清華紫光OCR還具有版面自動分析功能。它自動對掃描的版面進行分析,把應(yīng)識別的文字區(qū)域劃分出來,之后進行識別。對于被劃分區(qū)域內(nèi)的文字有很高的識別率,而且速度同樣很快。不過遺憾的是,在這個版本中沒有提供版面自動恢復(fù)的功能,因此如果想把文件恢復(fù)成原來的版面,則還需要重新手動排版。
它的導(dǎo)出功能可以將帶有表格的文當(dāng)導(dǎo)出成為RTF格式的文件,從而允許用戶在Word等應(yīng)用程序中繼續(xù)進行編輯。它還可以將掃描進來的圖像格式轉(zhuǎn)換成TIFF、BMP或PCZ等格式,具有很大的靈活性。
它的批量識別功能可以讓用戶一次把多頁文稿全部掃描之后再進行識別,避免了掃描一頁識別一頁帶來的麻煩。這一版本最多可實現(xiàn)10000頁的批量識別。
該版本還增加了一項非常實用的功能,就是手寫體的識別。有了這一功能,許多以前手寫的信件或文件就可以掃描到計算機中,識別出來后用電子文檔的方式進行保存了。
不過目前的手寫體識別功能還不夠完全成熟,它對書寫有很高的要求,如每個字之間要有一定的間隔,不能有連筆的情況等。盡管如此,手寫體識別這一功能還是能夠在一定程度上減輕文字錄入工作的負(fù)擔(dān)。
該OCR還具有自學(xué)習(xí)功能,當(dāng)遇到有生僻字時,可以通過鍵盤輸入進行學(xué)習(xí)。有了這一功能,用戶就可以自由地添加一些本來不“認(rèn)識”的字,大大拓寬了中文OCR系統(tǒng)的識別字符集。
清華紫光這一款專業(yè)版的OCR軟件,不僅可以對純文本文件進行識別,而且可以進行復(fù)雜的圖文混排和圖表文檔的識別,最大限度地把人們從繁雜的文字再錄入的工作中解脫出來。
清華紫光OCR軟件特色
1、識別率高、速度快:對于被劃分區(qū)域內(nèi)的文字有很高的識別率,而且速度同樣很快。
2、導(dǎo)出功能:可以將帶有表格的文當(dāng)導(dǎo)出成為RTF格式的文件,從而允許用戶在Word等應(yīng)用程序中繼續(xù)進行編輯。
3、版面自動分析:對圖文混排的文件具有版面自動分析功能,它自動對掃描的版面進行分析,把應(yīng)識別的文字區(qū)域劃分出來,之后進行識別。
4、轉(zhuǎn)換圖像格式:將掃描進來的圖像格式轉(zhuǎn)換成TIFF、BMP或PCZ等格式,具有很大的靈活性。
5、批量識別:可以讓用戶一次把多頁文稿全部掃描之后再進行識別,避免了掃描一頁識別一頁帶來的麻煩,這一版本最多可實現(xiàn)10000頁的批量識別。
6、手寫體識別:手寫的信件或文件就可以掃描到計算機中,識別出來后用電子文檔的方式進行保存。
7、自學(xué)習(xí):當(dāng)遇到有生僻字時,可以通過鍵盤輸入進行學(xué)習(xí),用戶就可以自由地添加一些本來不“認(rèn)識”的字,大大拓寬了中文OCR系統(tǒng)的識別字符集。
8、漢字和英文混排、日文和英文混排、韓文和英文混排同時識別。
9、是唯一可以識別2萬多漢字的多體文字識別系統(tǒng),漢字識別國內(nèi)最優(yōu)。
10、支持多種環(huán)境接口。文通TH-OCR支持WINDOWS環(huán)境和GB、BIG5、GBK、JIS、 SHIFT-JIS和KSC等多種內(nèi)碼,適合全球各個地區(qū)使用。TH-OCR還具有自學(xué)習(xí)功能,不論什么生僻字,都可以通過鍵盤輸入進行學(xué)習(xí),大大拓寬了OCR系統(tǒng)的識別字符集。
清華紫光OCR使用方法
1.文件->打開,選擇要識別的文件,可以是tif、bmp、jpg格式的
2.命令->識別,會自動識別的
3.識別完成后,軟件左邊的樹狀欄里會有圖像文件名,用鼠標(biāo)點開哪個加號,就是識別后的文本文件
4.單擊它,軟件右邊上方是識別后的文本,下方是被識別的圖像文件
5.這時用鍵盤移動光標(biāo),就能查看圖像和對應(yīng)文本,并能直接改動文本
6.二值圖像就是只有黑白兩色的圖像,用windows自帶的畫圖軟件就能做出來
7.先用畫圖打開圖像,圖像->屬性,將顏色改成黑白,再存盤就得到二值圖像了
清華紫光OCR更新日志
1.修復(fù)若干bug;
2.優(yōu)化細(xì)節(jié)問題;
騰訊視頻官方版 | 45.34MB
愛奇藝視頻官方正式版 | 35.10MB
暴風(fēng)影音最新版下載 | 50.3MB
QQ音樂官方正式版 | 24.2MB
酷狗音樂2022下載 | 37MB