明輝手游網(wǎng)中心:是一個(gè)免費(fèi)提供流行視頻軟件教程、在線學(xué)習(xí)分享的學(xué)習(xí)平臺(tái)!

XMLHTTP Get HTML頁面時(shí)的中文亂碼之完全客戶端Script處理方案

[摘要]常有人說,他們?cè)谑褂肵MLHTTP過程中,總是為中文亂碼的問題煩惱。本人查閱了一些資料,結(jié)果令我失望,大家都是使用ASP服務(wù)器端技術(shù)解決該問題。 先分析一下為何會(huì)出現(xiàn)中文亂碼的問題。原因很簡(jiǎn)單:XMLHTTP得到Response時(shí)假定Response是UTF8編碼的,它把含GB2312編碼的...

    常有人說,他們?cè)谑褂肵MLHTTP過程中,總是為中文亂碼的問題煩惱。本人查閱了一些資料,結(jié)果令我失望,大家都是使用ASP服務(wù)器端技術(shù)解決該問題。
    先分析一下為何會(huì)出現(xiàn)中文亂碼的問題。原因很簡(jiǎn)單:XMLHTTP得到Response時(shí)假定Response是UTF8編碼的,它把含GB2312編碼的HTML當(dāng)成UTF8格式,因此,出現(xiàn)了中文亂碼。
    那么,除了使用ASP服務(wù)器端腳本技術(shù)外,就沒有客戶端的解決辦法嗎?答案是:有!
    本人使用VBScript客戶端腳本,成功實(shí)現(xiàn)了不使用ASP,解決了XMLHTTP 抓取 HTML頁面時(shí)出現(xiàn)中文亂碼的問題。
    為何使用VBScript,而不是大家常用的JScript?XMLHTTP的responseBody返回的是一個(gè)unsigned bytes數(shù)組。VBScript提供了許多用于操作字符串和格式化數(shù)據(jù)的函數(shù),以及訪問安全數(shù)組的方法。這些函數(shù)或方法在JScript中并不存在。這里我們需要使用VBScript的內(nèi)置函數(shù):MidB、AscB、LenB等,來訪問responseBody。
    說句題外話,我不是在強(qiáng)調(diào)VBScript比JScript好,而是二者都有自己的特點(diǎn)。第一次在CSDN上寫文章,謝謝大家支持。寫這邊文章有兩個(gè)目的:一、鍛煉自己;二、希望大家遇到問題時(shí),要學(xué)會(huì)分析問題,做到有的放矢,知其然也知其所以然。
    我給出代碼Test.htm,它包括了獲取自身代碼和獲取其他網(wǎng)頁代碼兩種應(yīng)用,具體腳本如下:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<!-- 作者:小林,sulins@tom.com -->
<HTML>

<HEAD>
<META http-equiv="Content-Type" content="text/html; charset=gb2312">
</HEAD>

<script language=VBScript>

Function bytes2BSTR(vIn)
    strReturn = ""
    For i = 1 To LenB(vIn)
        ThisCharCode = AscB(MidB(vIn,i,1))
        If ThisCharCode < &H80 Then
            strReturn = strReturn & Chr(ThisCharCode)
        Else
            NextCharCode = AscB(MidB(vIn,i+1,1))
            strReturn = strReturn & Chr(CLng(ThisCharCode) * &H100 + CInt(NextCharCode))
            i = i + 1
        End If
    Next
    bytes2BSTR = strReturn
End Function

Function viewSource1()
 dim XmlHttp
 set XmlHttp = CreateObject("Microsoft.XMLHTTP")
 XmlHttp.Open "GET", document.location.href, false
 XmlHttp.setRequestHeader "Content-Type","text/XML"
 XmlHttp.Send
 
 dim html
 html = bytes2BSTR(XmlHttp.responseBody)
 msgbox html
End Function

Function viewSource2()
 dim XmlHttp
 set XmlHttp = CreateObject("Microsoft.XMLHTTP")
 XmlHttp.Open "GET", "http://www.google.com", false
 XmlHttp.setRequestHeader "Content-Type","text/XML"
 XmlHttp.Send
 
 dim html
 html = bytes2BSTR(XmlHttp.responseBody)
 msgbox html
End Function

</script>

<BODY bgcolor=gainsboro style='border:1pt solid white'>
<TABLE class=text>
 <tr>
  <td class=text>XMLHTTP Get HTML頁面時(shí)的中文亂碼之完全客戶端Script解決方案</td>
 </tr>
 <tr>
  <td class=button><button onclick=viewSource1()>查看自身的網(wǎng)頁代碼</button></td>
 </tr>
 <tr>
  <td class=button><button onclick=viewSource2()>查看google主頁代碼</button></td>
 </tr> 
</TABLE>
</BODY>
</HTML>