Visual Basic 6編程中的漢字處理
發(fā)表時(shí)間:2023-07-30 來源:明輝站整理相關(guān)軟件相關(guān)文章人氣:
[摘要]焦純 楊國(guó)勝 王健琪 在DOS時(shí)代,擁有一個(gè)華麗的漢字菜單幾乎是每個(gè)高檔中文應(yīng)用程序必須的包裝。中文Windows操作系統(tǒng)的出現(xiàn)使得高級(jí)開發(fā)平臺(tái)實(shí)現(xiàn)全中文的提示和界面非常容易和方便。在一般的應(yīng)用程...
焦純 楊國(guó)勝 王健琪
在DOS時(shí)代,擁有一個(gè)華麗的漢字菜單幾乎是每個(gè)高檔中文應(yīng)用程序必須的包裝。中文Windows操作系統(tǒng)的出現(xiàn)使得高級(jí)開發(fā)平臺(tái)實(shí)現(xiàn)全中文的提示和界面非常容易和方便。在一般的應(yīng)用程序中已經(jīng)很少需要去專門考慮漢字處理的問題。
但是在許多工程控制和字符串處理的環(huán)境中,漢字字符的處理仍然有別于西文字符的處理,需要加以專門的考慮。
一、VB6對(duì)漢字處理的支持
對(duì)漢字處理,VB6主要是提供了一些輸入法設(shè)置方面的支持。它提供了一個(gè)ImeMode屬性和ImeStatus函數(shù)來確定和設(shè)置輸入法的狀態(tài)。而且此屬性和方法只在VB6的東亞區(qū)版本中有效。
IMEStatus函數(shù)返回一個(gè)整數(shù),用來指定當(dāng)前Windows的輸入法(IME)方式。
下面是中文地區(qū)的返回值:
常數(shù) 值 描述
vbIMENoOP 0 不安裝IME(缺省)
vbIMEOn 1 打開IME
ImeMode屬性返回或者設(shè)置被選定的對(duì)象的 IME (Input Method Editor,輸入方法編輯器)狀態(tài)。
可以先用ImeStatus函數(shù)來檢測(cè)當(dāng)前的輸入狀態(tài),并用IMEMode來控制其輸入狀態(tài)。
如Text1.IMEMode=0(預(yù)定值)、=1(切換為中文輸入)、=2(切換為英文輸入)
對(duì)于簡(jiǎn)體漢字和繁體漢字 IME,只能使用設(shè)置 0 到 2。設(shè)置 3 到 10 對(duì)于漢字系統(tǒng)是無效的。
VB6功能上對(duì)漢字處理的直接支持也僅限于此。對(duì)于漢字字符串的處理,VB6并沒有提供專門的函數(shù)和方法。
二、確定漢字字符串的長(zhǎng)度
各個(gè)版本的VB對(duì)漢字字符的長(zhǎng)度定義并不相同。在Windows 3.x中,VB3中認(rèn)為每個(gè)漢字的長(zhǎng)度為2字節(jié)。VB自從32位版本以後,不管中英文字,均以2 bytes來儲(chǔ)存,這與中文Win95的漢字內(nèi)核有關(guān)。但是VB4以后,VB認(rèn)為每個(gè)漢字的長(zhǎng)度為1。這在處理包含漢字的字符串時(shí)帶來很多的不便。
由于Len、Left、Mid等字符串函數(shù)認(rèn)為一個(gè)漢字和一個(gè)西文字符的長(zhǎng)度都為1,因此處理漢字字符串時(shí)有一定的難度。實(shí)現(xiàn)上必須要能把漢字按照兩個(gè)字符(字節(jié))的形式讀出。因此在截取漢字字符串的子串時(shí)需特別注意。
由于漢字處理和漢字字模存儲(chǔ)的特殊性,在許多情況下我們希望漢字字符的長(zhǎng)度為2,英文字符為1。由于VB5和VB6把一個(gè)漢字作為一個(gè)字符。因此處理漢字時(shí)首先必須能正確判斷漢字字符串的長(zhǎng)度。
在VB3或C++里,漢字的 ASCII碼均大于零,而VB5和VB6中漢字的ASCII碼小于0。因此通過判斷一個(gè)未知字符的ASCII碼就可以判斷該字符是否漢字。
這里我們提供了兩種方法來判斷漢字字符串的長(zhǎng)度。
1、方法1
VB6中提供了LenB函數(shù)用于字符串中的字節(jié)數(shù)據(jù)。如同在雙字節(jié)字符集(DBCS)語言中一樣,LenB返回的是用于代表字符串的字節(jié)數(shù),而不是返回字符串中字符的數(shù)量。如為用戶自定義類型,LenB返回在內(nèi)存中的大小。
LenB(StrConv(Str1,vbFormUnicode))
對(duì)要處理的字符串Str1,必須先使用StrConv函數(shù)把ANSI格式的Byte數(shù)組轉(zhuǎn)換為字符串,否則直接使用LenB函數(shù)得到的結(jié)果比實(shí)際結(jié)果大。
2、方法2
這里自定義了一個(gè)子函數(shù)CLen來計(jì)算漢字字符串的實(shí)際長(zhǎng)度。同時(shí)還能判斷字符串中漢字的實(shí)際個(gè)數(shù)。
Function CLen(HzStr$) as Integer
Static HzNum as Integer
L = len(HzStr$)
For n=1 to L
If Asc(mid$( HzStr$,n,1))<0 Then HzNum = HzNum + 1
Next n
Clen = L + HzNum
End Function
CLen函數(shù)中的靜態(tài)變量HzNum返回字符串中實(shí)際漢字的數(shù)目。
三、漢字字模讀寫和存儲(chǔ)的機(jī)理
計(jì)算機(jī)是以編碼的方式來處理和使用字符的。西文字符采用一個(gè)字節(jié)表示,即ASCII碼,一般只用七位來表示128個(gè)字符,而把最高位用作奇偶校驗(yàn)(或者不用)。我國(guó)國(guó)標(biāo)規(guī)定漢字用內(nèi)碼表示,內(nèi)碼為兩個(gè)字節(jié)。為了保證中西文兼容,也就是說漢字系統(tǒng)的內(nèi)碼必須同時(shí)允許ASCII碼和漢字的使用,兩者之間不應(yīng)發(fā)生沖突。目前規(guī)定每個(gè)字節(jié)只用七位,若兩個(gè)字節(jié)的最高位均為1,則該字符為漢字。
國(guó)標(biāo)對(duì)漢字字庫(kù)的結(jié)構(gòu)作了統(tǒng)一規(guī)定,即將字庫(kù)分成若干個(gè)區(qū),每個(gè)區(qū)有94個(gè)漢字,每個(gè)漢字在字庫(kù)中有確定的區(qū)和位,因此每個(gè)漢字各有一個(gè)區(qū)位碼,知道了區(qū)位碼也就相當(dāng)于知道了漢字在字庫(kù)中的位置。由于漢字的內(nèi)碼與區(qū)位碼有一定的關(guān)系,所以只要通過漢字的內(nèi)碼就可得到該漢字的區(qū)位碼,也就得到了該漢字的字模。
查找一個(gè)漢字字模數(shù)據(jù)的算法為:
漢字內(nèi)碼 -> 區(qū)位碼 -> 記錄號(hào) -> 字模數(shù)據(jù)
一個(gè)16點(diǎn)陣漢字其字模數(shù)據(jù)共有32字節(jié),可以看作是一條記錄,在程序中可以用一個(gè)數(shù)組存放。在DOS的圖形模式下,漢字是通過描點(diǎn)的方法逐點(diǎn)畫上去的。讀取字模中每個(gè)字節(jié)的每一位,就能確定漢字中的每個(gè)點(diǎn)。故一個(gè)16×16點(diǎn)陣的漢字必須要32個(gè)字節(jié)的字模數(shù)據(jù)才能確定。
以下是DOS的圖形模式下顯示一個(gè)16×16點(diǎn)陣漢字時(shí)的描點(diǎn)順序圖。每?jī)蓚(gè)字節(jié)的字模數(shù)據(jù)確定一行。
四、VB6中實(shí)現(xiàn)漢字字模轉(zhuǎn)換的技巧
在許多工程控制的應(yīng)用環(huán)境中,經(jīng)常需要對(duì)標(biāo)準(zhǔn)的漢字字模進(jìn)行調(diào)整和轉(zhuǎn)換。
要對(duì)漢字字模進(jìn)行轉(zhuǎn)換首先應(yīng)該正確地讀出16點(diǎn)陣漢字在字庫(kù)中的32字節(jié)的字模數(shù)據(jù)。設(shè)某一漢字的內(nèi)碼為ddff,其中dd表示區(qū)內(nèi)碼,ff表示位內(nèi)碼,則dd-&Ha1為該漢字的區(qū)碼,ff-&Ha1為該漢字的位碼。則該漢字在字庫(kù)中的位置為:
Location = [(dd-&Ha1)×94 + (ff-&Ha1)]×32
需要注意的是,以何種方式從字庫(kù)文件中讀取這32字節(jié)也是一個(gè)關(guān)鍵問題。由于二進(jìn)制(Binary)方式訪問文件可以直接查看文件中指定的字節(jié),而且二進(jìn)制方式也是唯一支持用戶到文件的任何位置讀寫任意長(zhǎng)度數(shù)據(jù)的方法。因而以二進(jìn)制方式打開漢字字庫(kù)文件是最適合的。
VB6雖然提供了較強(qiáng)的位運(yùn)算功能,但是對(duì)于在字模轉(zhuǎn)換中使用較多的移位操作,卻沒有提供對(duì)應(yīng)的移位運(yùn)算符、指令或函數(shù)。其實(shí)通過and(與)、or(或)二個(gè)位運(yùn)算符即可編制一個(gè)自定義子函數(shù)來實(shí)現(xiàn)移位運(yùn)算。
下面的自定義子函數(shù)就是實(shí)現(xiàn)循環(huán)右移的:
Public Function byteRight(byte1 As Byte, n As Integer) As Byte '將byte1右移n位
Dim TemVar As Byte '臨時(shí)變量
Dim TemVar1 As Byte '臨時(shí)變量
Dim X, Y As Integer
TemVar = byte1
For X = 1 To n '移多少位就循環(huán)多少次
For Y = 1 To 8 '從第一位(右邊第一位)開始循環(huán)右移
Select Case Y
Case 1
If (TemVar And &H1) = &H1 Then '如果臨時(shí)變量TemVar的第一位是1,
TemVar1 = &H1 '則將臨時(shí)變量TemVar1置1,
Else
TemVar1 = &H0 '則將臨時(shí)變量TemVar1置0,
End If
Case 2
If (TemVar And &H2) = &H2 Then '如果臨時(shí)變量TemVar的第二位是1,
TemVar = TemVar Or &H1 '則將其第一位置1(其它位不變),
Else
TemVar = TemVar And &HFE '反之將第一位置0(其它位不變)
End If
Case 3
If (TemVar And &H4) = &H4 Then '操作與上面相同
TemVar = TemVar Or &H2
Else
TemVar = TemVar And &HFD
End If
Case 4
If (TemVar And &H8) = &H8 Then
TemVar = TemVar Or &H4
Else
TemVar = TemVar And &HFB
End If
Case 5
If (TemVar And &H10) = &H10 Then
TemVar = TemVar Or &H8
Else
TemVar = TemVar And &HF7
End If
Case 6
If (TemVar And &H20) = &H20 Then
TemVar = TemVar Or &H10
Else
TemVar = TemVar And &HEF
End If
Case 7
If (TemVar And &H40) = &H40 Then
TemVar = TemVar Or &H20
Else
TemVar = TemVar And &HDF
End If
Case 8
If (TemVar And &H80) = &H80 Then
TemVar = TemVar Or &H40
Else
TemVar = TemVar And &HBF
End If
If TemVar1 = &H1 Then '移完第八位后,如果TemVar1是1(即第一位是1)
TemVar = TemVar Or &H80 '則將TemVar的第八位置1
Else
TemVar = TemVar And &H7F '反之置0
End If
End Select
Next Y
Next X
byteRight = TemVar '將TemVar的值返回給函數(shù)名
End Function
尤其需要注意的是當(dāng)把二進(jìn)制數(shù)據(jù)寫入文件中時(shí),必須使用Byte數(shù)據(jù)類型的數(shù)組變量,而不是 String 變量。 String 被認(rèn)為包含的是字符,而二進(jìn)制型數(shù)據(jù)可能無法正確地存在 String 變量中。
五、一個(gè)實(shí)際應(yīng)用案例
圖形點(diǎn)陣液晶在現(xiàn)代單片機(jī)系統(tǒng)中是一種十分常用的顯示設(shè)備,BP機(jī)、手機(jī)上的顯示屏就是圖形點(diǎn)陣液晶。它能顯示漢字和圖形,與行列式鍵盤組成了單片機(jī)系統(tǒng)中最常用的人機(jī)交互界面。但是直接從中文系統(tǒng)漢字字庫(kù)中提取的漢字字模并不能直接在液晶上顯示,通常都必須經(jīng)過格式上的調(diào)整和轉(zhuǎn)換。
1、圖形點(diǎn)陣液晶的漢字字模
與在西文DOS中顯示漢字不同的是,圖形點(diǎn)陣液晶并不是簡(jiǎn)單地用畫點(diǎn)的方式來描出漢字。以常用的HD61202圖形點(diǎn)陣液晶顯示控制模塊為例,它能控制64×64點(diǎn)陣液晶的顯示,其顯示RAM共64行,分8頁,每頁8行,每一頁的數(shù)據(jù)寄存器分別對(duì)應(yīng)液晶屏幕上的8行點(diǎn),對(duì)顯示RAM的一個(gè)字節(jié)單位賦值就是對(duì)當(dāng)前列的8行(一頁)的像素點(diǎn)是否顯示進(jìn)行控制。連續(xù)16列和相鄰的2頁的32字節(jié)顯示RAM就可以控制一個(gè)漢字的顯示區(qū)域。對(duì)這些顯示RAM賦以相應(yīng)的值就可以顯示出一個(gè)漢字。
HD61202圖形點(diǎn)陣液晶顯示控制模塊的漢字字模的排列實(shí)際上是標(biāo)準(zhǔn)漢字字模排列形式旋轉(zhuǎn)而成的。對(duì)標(biāo)準(zhǔn)漢字字模轉(zhuǎn)換的目的就是在單片機(jī)系統(tǒng)的數(shù)據(jù)存儲(chǔ)器中(如E2PROM)存儲(chǔ)經(jīng)過調(diào)整的連續(xù)32字節(jié)的16進(jìn)制數(shù)。
2、實(shí)際源程序
以下這段程序是放置在漢字源文本輸入框(SrcTxt)的Change事件中。通過判斷輸入在文本框內(nèi)的字符的ASCII碼是否小于零,就能判斷輸入的字符是不是漢字。這段程序還能計(jì)算漢字字符串的長(zhǎng)度。同時(shí)把輸入的漢字存儲(chǔ)在一個(gè)臨時(shí)文件TempSrc.txt中。由于這段代碼是放在文本框的Change事件中,它能立即更新漢字個(gè)數(shù)的顯示。
Private Sub SrcTxt_Change( )
Static SStr As String
Dim i As Integer
Dim TempFile, TempFileBinary As String
TotalNum = 0
L = Len(SrcTxt.Text)
For i = 1 To L
tmpStr = StrConv(Mid$(SrcTxt.Text, i, 1), vbWide)
If Asc(Mid$(SrcTxt.Text, i, 1)) < 0 Then
TotalNum = TotalNum + 1
SStr = SrcTxt.Text
Else
MsgBox "寫入的不是漢字!"
SrcTxt.Text = Left(SrcTxt.Text, Len(SrcTxt.Text) - 1)
Exit Sub
End If
Next i
LblNum.Caption = Str$(TotalNum) + "個(gè)漢字"
TempFile = App.Path + "\" + "TempSrc.txt"
'TempFileBinary = App.Path + "\" + "TempSrcBinary.txt"
Open TempFile For Output As #1
Print #1, SrcTxt.Text
Close #1
End Sub
在實(shí)例中選用了UCDOS 5.0漢字系統(tǒng)中的16點(diǎn)陣字庫(kù)Hzk16作為提取漢字字模的標(biāo)準(zhǔn)字庫(kù)。
Private Sub CmdCnt_Click( )
Dim TempSrcFile As String
Dim TempDestFile As String
Dim TempFile As String
Dim HzFile As String
Dim To61202(32) As Integer
Dim p(1 To 2) As Byte
Dim C1, C2
Dim rec As Integer
Dim Location As Long '漢字在字庫(kù)中的位置
Dim Hz(0 To 31) As Byte '轉(zhuǎn)換完的32字節(jié)的字模數(shù)據(jù)
Dim Buf1(0 To 31) As Byte '暫存轉(zhuǎn)換過程中的32字節(jié)字模數(shù)據(jù)
Dim HzAll( ) As Byte '存放全部字模數(shù)據(jù)的動(dòng)態(tài)數(shù)組
Dim LoopAll As Integer
Dim bit, k2, k3 As Byte
Dim i, j, i1, k, k1, k4, k5, k6 As Integer
DestTxt.Text = "" 'DestTxt是目標(biāo)文本框,存放轉(zhuǎn)換后的16進(jìn)制數(shù)據(jù)
Flag = 0
TempDestFile$ = App.Path + "\" + "TempDest.txt"
If FileExists(TempDestFile$) Then Kill TempDestFile 'FileExists是一個(gè)檢查文件是否存在的自定義函數(shù)
If SrcTxt.Text = "" Then '漢字輸入框內(nèi)無漢字則退出
MsgBox "沒有可以轉(zhuǎn)換的字模源文件!"
Exit Sub
End If
HzNum = Len(SrcTxt.Text) '獲得漢字的個(gè)數(shù)
ReDim HzAll(0 To HzNum * 32 - 1) '重新定義動(dòng)態(tài)數(shù)組的上界
Open TempFile For Output As #1
Print #1, SrcTxt.Text
Close #1
For LoopAll = 0 To HzNum - 1
Open TempFile For Binary Access Read As #1 '按二進(jìn)制方式打開
Get #1, 2 * LoopAll + 1, p
Close #1
C1 = CStr(p(1)) - &Ha1 '區(qū)內(nèi)碼
C2 = CStr(p(2)) - &Ha1 '位內(nèi)碼
rec = C1 * 94 + C2
Location = CLng(rec) * 32 + 1 '該漢字在16*16點(diǎn)陣字庫(kù)中字模第一個(gè)字節(jié)的位置
HzFile = App.Path + "\" + "hzk16"
Open HzFile For Binary Access Read As #1 '讀取該漢字在16點(diǎn)陣字庫(kù)中的原始字模
Get #1, Location, Hz
Close #1
'以下是將UCDOS字庫(kù)的存儲(chǔ)格式調(diào)整為HD61202的規(guī)范格式
For j = 0 To 3
If j = 0 Then k4 = 14
If j = 1 Then k4 = 15
If j = 2 Then k4 = 30
If j = 3 Then k4 = 31
For k = 0 To 7
bit = &H80
bit = byteRight((bit), (k))
For i = 0 To 7
k2 = byteleft(Buf1(j * 8 + k), 1) '整個(gè)流程是由低位向高位移動(dòng),最后湊成一個(gè)字節(jié)
k3 = byteRight((Hz(k4 - i * 2) And bit), 7 - k) '將字節(jié)中的某位移到最低位
k3 = k3 And &H1 '屏蔽掉其余7位
Buf1(j * 8 + k) = k2 Or k3
Next i
Next k
Next j
For i1 = 0 To 31 '將調(diào)整后的漢字字模再裝入原數(shù)組
Hz(i1) = Buf1(i1)
HzAll(LoopAll * 32 + i1) = Buf1(i1)
Next
Next LoopAll
Open TempDestFile For Binary Access Write As #1 '轉(zhuǎn)換結(jié)果保存到TempDestFile中
Put #1, 1, HzAll
Close #1
MsgBox "OK!"
End Sub
以上程序均在中文VB6專業(yè)版上調(diào)試通過。
以上程序在實(shí)用中取得了很好的效果。此漢字字模轉(zhuǎn)換程序豐富了單片機(jī)系統(tǒng)開發(fā)工具的功能,是包含液晶顯示功能的單片機(jī)系統(tǒng)在系統(tǒng)調(diào)試和開發(fā)過程中不可或缺的功能模塊。