UNICODE与多字节字符集等字符问题
VS2008默認的字符集是Unicode,而VC6.0默認是多字節字符集,Unicode字符集你要加_T("")或L"",你也可以“
工程-屬性-修改字符集”。
?1.?UNICODE:它是用兩個字節表示一個字符的方法。比如字符'A'在ASCII下面是一個字符,可'A'在UNICODE下面是
兩個字符,高字符用0填充,而且漢字'程'在ASCII下面是兩個字節,而在UNICODE下仍舊是兩個字節。UNICODE的
用處就是定長表示世界文字,據統計,用兩個字節可以編碼現存的所有文字而沒有二義。?
?
?2.?MBCS,它是多字節字符集,它是不定長表示世界文字的編碼。MBCS表示英文字母時就和ASCII一樣(這也是我們
容易把MBCS和ASCII搞混的原因),但表示其他文字時就需要用多字節。
?
WINDOWS下面的程序設計可以支持MBCS和UNICODE兩種編碼的字符串,具體用那種就看你定義了MBCS宏還是
UNICODE宏。MBCS宏對應的字符串指針是char*也就是LPSTR,UNICODE對應的指針是unsigned?? short*也就是
LPWSTR,為了寫程序方便微軟定義了類型LPTSTR,在MBCS下他就是char*,?? 在UNICODE下它是unsigned??
char*,這樣你就可以重定義一個宏進行不同字符集的轉換了。
3. LPTSTR、LPCSTR、LPCTSTR、LPSTR的意義:
LPSTR:??32-bit指針 指向一個字符串,每個字符占1字節
LPCSTR:??32-bit指針 指向一個常字符串,每個字符占1字節
LPCTSTR:?32-bit指針 指向一個常字符串,每字符可能占1字節或2字節,取決于Unicode是否定義
LPTSTR:??32-bit指針 每字符可能占1字節或2字節,取決于Unicode是否定義
?
Windows使用兩種字符集ANSI和UNICODE,前者就是通常使用的單字節方式,但這種方式處理象中文這樣的雙字節
字符不方便,容易出現半個漢字的情況。而后者是雙字節方式,方便處理雙字節字符。WindowsNT的所有與字符
有關的函數都提供兩種方式的版本,而Windows9x只支持ANSI方式。_T一般同字常數相關,如_T("Hello"。如果
你編譯一個程序為ANSI方式,_T實際不起任何作用。而如果編譯一個程序為UNICODE方式,則編譯器會把"Hello"
字符串以UNICODE方式保存。_T和_L的區別在于,_L不管你是以什么方式編譯,一律以UNICODE方式保存.
?
?4.?例1:
Windows核心編程的第一章。
L是表示字符串資源為Unicode的。
比如
wchar_t Str[] = L"Hello World!";??? 這個就是雙子節存儲字符了。
_T是一個適配的宏~
當
#ifdef _UNICODE的時候
_T就是L
沒有#ifdef _UNICODE的時候
_T就是ANSI的。
?
比如
LPTSTR lpStr = new TCHAR[32];
TCHAR* szBuf = _T("Hello");
以上兩句使得無論是在UNICODE編譯條件下都是正確編譯的。
而且MS推薦你使用相匹配的字符串函數。
比如處理LPTSTR或者LPCTSTR 的時候,不要用strlen ,而是要用_tcslen
否則在UNICODE的編譯條件下,strlen不能處理 wchar_t*的字符串。
T是非常有意思的一個符號(TCHAR、LPCTSTR、LPTSTR、_T()、_TEXT()...),它表示使用一種中間類型,既不
明確表示使用 MBCS,也不明確表示使用 UNICODE。那到底使用哪種字符集?編譯的時候才決定
在大多數情況下,CString 轉換成 LPTSTR是非常容易的,如果函數要求傳入LPTSTR型的參數,直接傳一個
CString也行,但是在visual studio 2008中,卻偶爾會出現不能轉換的情況,這個為什么呢?
有人以為這是ASCII(多字節)與Unicode(寬字節)之間的問題,其實不是,要知LPTSTR這個宏是隨編譯器參數
不同而不同的,如果在編譯器——常規里面設置程序按ASCII編譯,那LPTSTR就表示char*,如果選擇按Unicode
編譯那就是wchar_t*。CString也是如此,隨編譯器選項的不同,可以是ASCII字符串也可以是Unicode字符串。
那么CString與LPTSTR,要么全是多字節,要么全是寬字節,不可能存在兩者之間不能轉換的問題。
?
例2:
1. 如何將 CString 型轉換為 LPBYTE?
CString?? str;???
LPBYTE?? by?? =?? (LPBYTE)(LPCSTR)str;
?
2. LPBYTE 如何轉為CString 型
CString?? str;
str.Format("%s", by);
總結
以上是生活随笔為你收集整理的UNICODE与多字节字符集等字符问题的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 计算机专用英语词汇pdf,计算机专用英语
- 下一篇: linux教程第五版第三章课后答案,li