细谈软件界面多语言
2019獨角獸企業重金招聘Python工程師標準>>>
? ? 軟件要走出國門,邁向國際客戶,必須要實現軟件界面多語言。
比如download.com,elance.com,odesk.com,豬八戒國際站等,所發布定制的軟件外包程序,要求是多語言的,英韓,英漢,英西界面等等。
? ?軟件程序多語言解決最簡單的方法
如:大名鼎鼎的GNU?GetText,另外,還有一種方式是操作程序的資源文件。
通過多語言代碼生成工具,圖:
實現方法:
1.? 建立一個文件夾,?把要支持多語種的源碼工程拷貝到此文件夾下,?工程數目不限,?源文件數目不限。 (同時你備份一份源碼工程)
點擊選擇工程目錄按鈕,?選擇此目錄。
2.點擊選擇配置目錄按鈕,選擇隨EXE一起的配置文件目錄,?同時你的翻譯文檔也拷貝到這個配置目錄。
3.點擊轉成多語種按鈕,?這時轉換開始,下面的文本框會提示轉換過程發生的一切。??轉換一般瞬間即可完成,?除非源碼和翻譯信息是海量,?時間可能會稍長些。
OK,第一步建立的文件夾下的所有源碼工程現在都是支持多語種的了,?就這么簡單。
? ? 當然還有別的方法,通過編程語言來實現軟件程序多語言
? Delphi實現軟件多語言
先按照Delphi2010,圖:
也可以安裝Delphi的IDE---cnpack ide,支持c+與Delphi的IDE
Delphi 2010作為一個優秀的快速RAD開發工具,可以很容易地實現國際化支持,因為Delphi 2010內置了對多語言界面的支持。
? ?你必須設計好你的軟件界面,以便能夠使你的軟件界面元素有足夠的空間顯示語言文字信息。一般說來,在50個字節以內的英文單詞所表達的意思,用其他的語言來描述的話,長度要超過50字節,但中文是一個例外。特別對于幾個字節的英文單詞,其他的語言的長度幾乎百分之百要超過英文的長度!因此,必須在控件中留出足夠的長度以便在更改語言之后,還能顯示全部的語言文字信息。
3. 你必須翻譯所有的資源。
Delphi 2010實現多語言的支持和切換,界面設計和上述要求不在本文討論范圍之內。
要為程序添加語言支持,只要在Delphi主菜單項Project下面選擇LanguagesàAdd…即可。點擊之后出現語言向導,讀者按照向導進行操作即可。向導結束之后,會生成一個工程組文件(BPG),最后出現Translation Manager,軟件開發者可以在這里翻譯所有語言的所有資源,包括字體、位置、文字等等。說明一下:你可以隨時隨地用Project下面的Languages子菜單的功能來添加、刪除、修改各種界面元素。
做完上述工作之后,我們現在就差切換語言的代碼了。為了切換語言,大家可以使用下面的一個單元[],單元中提供了兩個函數,用來更換語言界面元素,其中LoadNewResourceModule是用來修改文字信息等等,ReinitializeForms用來重新刷新窗體和控件以保證同步。
? ?c+builder實現軟件多語言界面,以vc++為主
-
以Unicode為核心
-
采用 GNU gettext?
-
基于Qt的多語言開發工具:Qt Linguist?
以Unicode為核心
軟件多國語言化,使程序員在編碼處理上花費了大量時間和精力;然而各種各樣的亂碼問題,如 XML 格式錯誤、文本顯示異常、解析器異常等依然層出不窮。特別的,相對于 JAVA 語言,C/C++ 在處理編碼問題上有更大的困難。本文避免糾纏不同編碼格式的具體異同,以 Unicode 為核心,以簡體中文為例,從工程應用角度分析編碼問題存在的原因,不僅提出 C/C++ 標準庫編程的解決方案,更結合項目經驗,總結出處理多國語言編碼問題的一般思路。
resolution
多國語言的存在、不同語言操作系統的存在,使得針對多語言的設計頗費周章,在編碼上所付出的工作量也是可觀的。所謂編碼的問題,歸結起來,就是二進制的編碼以何種編碼格式進行解析的問題。特別是在硬盤文件和內存數據的相互轉化、即讀寫過程中,如果采用了錯誤的編碼格式,就會造成亂碼。JAVA 語言在字符串、編碼等處理方面給了程序員更為直接、方便的接口,習慣使用 JAVA 做編碼的程序員,在使用 C/C++ 進行文本編碼相關的操作時,常會感到困惑。本文的目的在于以常用的 Unicode(UCS-2)、GB2312、UTF8 三種編碼為例,分析不同編碼在實用中的關系,特別是 C/C++ 中,怎樣處理各種編碼的問題。
編碼處理常見的問題
- 1. 將內存中編碼 A 的字符串以編碼 B 格式處理成字節流寫入文件
- 2. 將原本以 A 編碼組成的文件以字節流形式讀入內存、并以編碼 B 解析為字符串。
第一種情況,可能造成數據的變化、失真。
如果使用 JAVA 語言,發生這種錯誤的情況稍少一些,因為在 JAVA 中沒有 wstring 這種概念,在內存中的 String,使用的編碼都是 Unicode,其中的轉換對于程序員來講是透明的。只要使用輸入 / 輸出方法時注意字節流的字符集選擇即可。
例如,編碼為中文 GB2312 的“標準”字符串被讀入內存后轉存為 UTF8 的過程:
圖 1. 文件轉換編碼的 JAVA 處理方式
但 C/C++ 編程,由于通常使用 char、string 類型的時候比較多,特別是進行文件讀寫,基本都是操作 char* 類型的數據。并且也沒有像 JAVA 中 getByte(String charsetname) 這種函數,不能直接根據字符集重新編碼得到字符串的 byte 數組。這時候,我們使用的 string 其實就一般不是 Unicode,而是符合某種編碼表的。這使得我們往往困惑于 string 的編碼問題。假設有 utf8 的字符串“一”(E4 B8 80),而我們錯誤的認為它是符合 gb2312(編碼 A)的,并將其轉換為 utf8(編碼 B),這種轉換結果是破壞性的,錯誤的輸出將永遠無法正確識別。依然以“標準”為例,這是一個正確的轉換:
圖 2. 文件轉換編碼的 C/C++ 處理方式
第二種情況,則是更常見到的。例如:瀏覽器瀏覽網頁時的發生的亂碼問題;在寫 XML 文件時,指定了 < ?xml version="1.0" encoding="utf-8" ?> 然而文件中卻包含 GB2312 的字符串——這樣經常會導致 XML 文件 bad formatted,而使得解析器出錯。
這種情況下,其實數據都是正確的,只要瀏覽器選擇正確的編碼,將 XML 文件中的 GB2312 轉換為 UTF8 或者修改 encoding,就可以解決問題。
需要注意的是,ASCII 碼的字符,即單字節字符,一般不受編碼變動影響,在所有編碼表中的值是一樣的;需要小心處理的是多字節字符,例如中文語言。
一般的編碼轉換,直接做映射的不太可能,需要比較多的工作量,大多情況下還是選擇 Unicode 作為轉換的中介。
使用庫函數
如在開發JAVA項目中 的 String 對象是以 Unicode 編碼存在的,所以 JAVA 程序員主要關心的是讀入時判斷字節流的編碼,從而確保可以正確的轉化為 Unicode 編碼;相比之下,C/C++ 將外部文件讀出的數據存為字符數組、或者是 string 類型;而 wstring 才是符合 Unicode 編碼的雙字節數組。一般常用的方法是 C 標準庫的 wcstombs、mbstowcs 函數,和 windows API 的 MultiByteToWideChar 與 WideCharToMultiByte 函數來完成向 Unicode 的轉入和轉出。
這里以 MBs2WCs 函數的實現說明 GB2312 向 Unicode 的轉換的主要通過?多字節字符串向寬字節字符串轉換
wchar_t * MBs2WCs(const char* pszSrc){? wchar_t* pwcs = NULL; ? intsize = 0; #ifdefined(_linux_) ? setlocale(LC_ALL, "zh_CN.GB2312"); ? size = mbstowcs(NULL,pszSrc,0); ? pwcs = new wchar_t[size+1]; ? size = mbstowcs(pwcs, pszSrc, size+1); ? pwcs[size] = 0; #else ? size = MultiByteToWideChar(20936, 0, pszSrc, -1, 0, 0); if(size <= 0) ? returnNULL; pwcs = new wchar_t[size]; ? MultiByteToWideChar(20936, 0,? pszSrc, -1, pwcs, size); #endif returnpwcs; }相應的,WCs2MBs 可以將寬字符串轉化為字節流。
清單 2. 寬字節字符串向多字節字符串轉換
char* WCs2MBs(const wchar_t * wcharStr){? char* str = NULL; intsize = 0; #ifdefined(_linux_) ? setlocale(LC_ALL, "zh_CN.UTF8"); ? size = wcstombs( NULL, wcharStr, 0); ? str = new char[size + 1]; ? wcstombs( str, wcharStr, size); ? str[size] = '\0'; #else ? size = WideCharToMultiByte( CP_UTF8, 0,? wcharStr, -1, NULL, NULL, NULL, NULL ); ? str = new char[size]; ? WideCharToMultiByte( CP_UTF8, 0, wcharStr, -1, str, size, NULL, NULL ); #endif returnstr; }Linux 的 setlocale 的具體使用可以參閱有 C/C++ 文檔,它關系到文字、貨幣單位、時間等很多格式問題。Windows 相關的代碼中 20936 和宏定義 CP_UTF8 是 GB2312 編碼對應的的 Code Page[ 類似的 Code Page 參數可以從?MSDN?的 Encoding Class 有關信息中獲得 ]。
這里需要特別指出的是 setlocale 的第二個參數,Linux 和 Windows 是不同的:
- 1. 筆者在 Eclipse CDT + MinGW 下使用 [country].[charset](如 zh_CN.gb2312 或 zh_CN.UTF8)的格式并不能通過編碼轉換測試,但可以使用 Code Page,即可以寫成 setlocale(LC_ALL, ".20936") 這樣的代碼。這說明,這個參數與編譯器無關,而與系統定義有關,而不同操作系統對于已安裝字符集的定義是不同的。
- 2. Linux 系統下可以參見 /usr/lib/locale/ 路徑,系統所支持的 locale 都在這里。轉換成 UTF8 時,并不需要 [country] 部分一定是 zh_CN,en_US.UTF8 也可以正常轉換。
另外,標準 C 和 Win32 API 函數返回值是不同的,標準 C 返回的 wchar_t 數組或者是 char 數組都沒有字符串結束符,需要手動賦值,所以 Linux 部分的代碼要有區別對待。
最后,還要注意應當在調用這兩個函數后釋放分配的空間。如果將 MBs2WCs 和 WCs2MBs 的返回值分別轉化為 wstring 和 string,就可以在它們函數體內做 delete,這里為了代碼簡明,故而省略,但請讀者別忘記。
第三方庫
目前的第三方工具已經比較完善,這里介紹兩個,本文側重點不在此,不對其做太多探討。
- Linux 上存在第三方的 iconv 項目,使用也較為簡單,其實質也是以 Unicode 作為轉換的中介。可以參閱??iconv 相關網站。
- ICU 是一個很完善的國際化工具。其中的 Code Page Conversion 功能也可以支持文本數據從任何字符集向 Unicode 的雙向轉換。可以訪問其?網站
在代碼中調用“編碼轉換方法”一節里提到的函數,將 gb2312 編碼的字符串轉換為 UTF8 編碼,分析其編碼轉換的行為:
在英文 Linux 環境下,執行下列命令:
export LC_ALL=zh_CN.gb2312然后編譯并執行以下程序(其中漢字都是在 gb2312 環境中寫入源文件)
L1: wstring ws = L"一";? L2: string s_gb2312 = "一"; ? L3: wchar_t * wcs = MBs2WChar(s_gb2312.c_str());? L4: char* cs = WChar2MBs(wcs);查看輸出:
- L1 - 1 wide char: 0x04bb
- L2 - 2 bytes:0xd2,0xbb,即 gb2312 編碼 0xD2BB
- L3 - 返回的 wchar_t 數組內容為 0x4E00,也就是 Unicode 編碼
- L4 - 將 Unicode 再度轉換為 UTF8 編碼,輸出的字符長度為 3,即 0xE4,oxB8,0x80
在 L1 行,執行結果顯示編碼為一個 0x04bb,其實這是一個轉換錯誤,如果使用其他漢字,如“哈”,編譯都將無法通過。也就是說 Linux 環境下,直接聲明中文寬字符串是不正確的,編譯器不能夠正確轉換。
而在中文 windows 下使用相同測試代碼,則會在 L1 處出現區別,ws 中的 wchar_t 元素十六進制值是 0x4e00,這是漢字“一”的 Unicode 編碼。
首先,這里先簡單說明一下 Unicode 和 UTF8 的關系:Unicode 的實現方式和它的編碼方式并不相同,UTF8 就是其實現之一。比方使用 UltraEdit 打開 UTF8 編碼的中文文件,使用 16 進制查看,可以發現看到的中文對應部分應當是 Unicode 編碼,每個中文字長度 2 字節—— UltraEdit 在這里已經做了轉化;如果直接查看其二進制文件,可以發現是 3 字節。但兩者的差別僅在于 Unicode 向 UTF8 做了數學上的轉化。
其次,關于第三方庫的選擇,應當綜合考慮項目的需求。一般的文本字符轉換,系統的庫函數已經可以滿足需求,實現也很簡單;如果需要針對不同地區的語言、文字、習慣進行編程,需要更為豐富的功能,當然選擇成熟的第三方工具可以事半功倍。
最后,從邏輯上保持字符串的編碼正確,需要注意幾條一般規律:
- 編碼選擇?:多國語言環境的編程,以使用 UTF 編碼為原則,減少字符集轉換。
- string 并不包含編碼信息,但是編碼確定了 string 的二進制內容。
- 讀寫一致?:讀入時使用的字符集要與寫出時使用的一致。如果不需要改變字符串內容,僅僅是將字符串讀入、再寫出,建議不要調整任何字符集——即使程序使用的系統默認字符集 A 與文件的實際編碼 B 不符合,寫出的字符串依然會是正確的 B 編碼。
- 讀入已知?:對于必須處理、解析或顯示的字符串,從文件讀入時必須知道它的編碼,避免處理字符串的代碼簡單使用系統默認字符集;即便對于程序從系統中收集到的內存字符串,也應知道其符合的編碼格式——一般為系統默認字符集。
- 避免直接使用 Unicode?:這里是說將非 ASCII 編碼的 16 進制或者 10 進制數值用 &# 與 ; 包含起來的使用方式,例如將中文“一”寫成“e00;”。這種方法的實質是 Unicode 編碼直接寫入文件。這不僅會降低代碼的通用性、輸出文件的可讀性,處理起來也很困難。比如法文字符在其他字符集中是大于 80H 的單字節字符,程序同時要支持中文的時候,很有可能會將多字節的中文字符錯誤割裂。
- 避免陷入直接的字符集編程?:國際化、本地化的工具已經比較成熟,非純粹做編碼轉換的程序員沒有必要自己去處理不同編碼表的映射轉換問題。
- Unicode/UTF8 并不能解決一切亂碼問題?:Unicode 可以說是將世界語言統一起來的一套編碼。但是這并不意味著在一個系統中可以正常顯示的按照 UTF8 編碼的文件,在另一個系統中也可以正常顯示。例如,在中文的 UTF8 編碼或者 Unicode 編碼在沒有東亞語言包支持的法文系統中,依然是不可識別的亂碼——盡管 UTF8、Unicode 它們都支持。
采用 GNU gettext
參考:http://zh.wikipedia.org/wiki/Gettext
gettext?是?GNU?國際化與本地化?(i18n)函數庫。它常被用于編寫多語言程序。
開發?
程序源代碼需要進行修改以響應 GNU gettext 請求。多數?編程語言?均已通過字符封裝的方式實現了對其的支持。為了減少輸入量和代碼量,此功能通常以標記?別名?_?的形式使用,所以例如以下?C語言?代碼:
printf(gettext("My name is %s.\n"), my_name);應當寫作:
printf(_("My name is %s.\n"), my_name);gettext使用其中的字符串尋找對應的其他語言翻譯,若沒有可用翻譯則返回原始內容。
除?C語言?外, GNU gettext 還支持??C++?,??Objective-C?,?Pascal?/?Object Pascal,?sh?腳本,?bash?腳本,?Python?,GNU??CLISP?,?Emacs Lisp?,librep,GNU?Smalltalk?,?Java?,GNU??awk?,?wxWidgets?(通過 wxLocale類),YCP (?YaST2?語言),?Tcl?,?Perl?,?PHP?,?Pike?,?Ruby?以及?R?。用法均與在?C語言?上類似。
xgettext程序從源代碼生成.pot文件,作為源代碼中需翻譯內容的模板。一個典型的 .pot 文件條目應當是這樣的:
#: src/name.c:36 msgid "My name is %s.\n" msgstr ""注釋?被直接放置在字符串前,用于幫助翻譯者理解待翻譯內容:
/// TRANSLATORS: Please leave %s as it is, because it is needed by the program. /// Thank you for contributing to this project. printf(_("My name is %s.\n"), my_name);本例中的注釋是以///開頭的,其作用是用于 xgettext 程序生成 .pot 模板文件。
xgettext --add-comments=///
在 .pot文件中的注釋應為以下形式:
#. TRANSLATORS: Please leave %s as it is, because it is needed by the program. #. Thank you for contributing to this project. #: src/name.c:36 msgid "My name is %s.\n" msgstr "" 翻譯?
翻譯者需要工作的對象是?.po?文件,它是由?msginit?程序從 .pot 模板文件生成的。例如使用?msginit?初始化法語翻譯文件時,我們運行以下命令:
msginit --locale=fr --input=name.pot這將會使用指定的 name.pot 在當前目錄創建一個 fr.po,其中的一個條目應該是以下形式的:
#: src/name.c:36 msgid "My name is %s.\n" msgstr ""翻譯者需要手工或使用類似?Poedit?、?gtranslator?或?Emacs?等工具的相應模式編輯該文件。翻譯完成后,文件應為如下的樣子:
#: src/name.c:36 msgid "My name is %s.\n" msgstr "Je m'appelle %s.\n"最后 .po 文件需要使用?msgfmt?編譯為?.mo?文件以用作發布。
運行?
使用?Unix?類型操作系統的用戶只需設置?環境變量?中的?LC_MESSAGES?,程序將自動從相應的?.mo?文件中讀取語言信息。
補充:最新版 gettext-0.18.3.2可在MSVC中實現多語言
參考:http://www.aslike.net/showart.asp?id=154
“通常,程序及其文檔信息都是用英語語言寫的,程序運行時同用戶交互的信息也是英語。這是一個事實,不僅僅GNU的軟件是這樣,其他大部分私有軟件或自由軟件也是這樣。一方面,對于來自所有國家的開發者、維護者和用戶來說,相互溝通中使用一種通用的語言非常的方便。另一方面,相對于母語來說大多數人并不適應使用英語,而且他們的日常工作都是盡可能的使用他們自己的母語。多數人都會喜歡他們的計算機屏幕顯示的英語更少,顯示的母語更多。"
" GNU 的 'gettext' 是 GNU翻譯項目的一個重要步驟,我們依賴于它 作很多其他的步驟。這個軟件包給程序員、翻譯者,或者用戶提供了一套集成工具和文檔。詳細地說,GNU gettext 提供了一套工具, 能讓其他 GNU 軟件創建多語言信息。..."
gettext的工作流程是這樣的:比如我們寫一個Visual C++(MSVC)程序,通常printf等輸出信息都是English的。如果我們在程序中加入gettext支持,在需要交互的字符串上用gettext函數,程序運行是就可以先調用gettext函數獲取當前語言的字符串,替換當前的字符串了。注意是運行時替換。
GNU gettext-0.18.3.2 是最新版本,?GNU官網?上可以直接下載,只是沒有Visual C++(MSVC)可用的運行支持庫,只能自己動手編譯了,編譯好的運行支持庫,?點擊這里下載?。
在Visual C++(MSVC)中使用GNU gettext實現多語言時,可以編寫翻譯函數來實現界面與菜單字符串的自動替換,程序中的字符串只能一個個手工替換了,這樣使用起來,就跟在Delphi與C++Builder中使用GNU gettext差不多方便快捷了。
簡單使用的例子
一個簡單的例子,
#include <stdio.h>#include <libgnuintl.h>
/*使用gettext通常使用類似下面的一個帶函數的宏定義
*你完全可以不用,直接使用 gettext(字符串)
*/
#define _(S) gettext(S)
/*PACKAGE是獲取語言字符串的文件名字(運行時輸入的命令)*/#define PACKAGE "default"
int main(int argc, char **argv)
{
/* 下面三個參數都是使用gettext時候需要使用的
* setlocale
* bindtextdomain
* textdomain
*/
setlocale(LC_ALL,"");
bindtextdomain(PACKAGE, "locale");
textdomain(PACKAGE);
printf(_("Hello,GetText!\n"));
return 0;
}
其中語言字符串文件的結構: .\locale\語言名稱\LC_MESSAGES\default.mo,如簡體中文:.\locale\ZH_CN\LC_MESSAGES\default.mo
mo文件是編譯后的語言字符串文件,GNU網站上有相應的工具軟件可以編輯與生成;
點擊這里下載Visual C++(MSVC)中可用的GNU gettext-0.18.3.2運行支持庫
基于Qt的多語言開發工具:Qt Linguist
Qt Linguist 是一個用來給 Qt 編寫的應用程序增加多語言支持的工具。
QT-Linguist工具主要用在項目的多語言翻譯處理過程中,所有先簡單介紹一下整個多語言處理過程,最后介紹Linguist的用法。
(一)QT項目實現多語言,必須做兩件事:
1)確保每一個用戶可見的字符串都使用了tr()函數。
2)在應用程序啟動的時候,使用QTranslator載入一個翻譯文件(.qm)。?
tr() 的用法:
?| 1 | caseCheckBox =?new?QCheckBox(tr(?"Match &case"?)); |
在main()函數里載入翻譯文件:
?| 1 2 3 4 5 6 7 8 9 | int?main(?int?argc,?char?*argv[]) {QApplication app(argc, argv); //翻譯程序 QTranslator translator; translator.load(?"spreadsheet_cn.qm"?); app.installTranslator(&translator); …… } |
注意:翻譯文件加載的位置必須在界面實例化之前完成。
(二)生成.qm翻譯文件
1、 在該應用程序的.pro文件文件中添加TRANSLATIONS項,可分別對應于不同的語言,如:spreadsheet_cn.ts, 對應中文,名字可以自己定義,后綴名.ts不可變動。<.ts是可讀的翻譯文件,使用簡單的XML格式;而.qm是經過.ts轉換而成的二進制機器 語言>
2、翻譯文件。分三步來完成:
1)運行lupdate, 從應用程序的源代碼中提取所有用戶可見的字符串。?
2)使用Qt Linguist 翻譯該應用程序。?
3)運行lrelease,生成二進制的.qm 文件。?
以上三步均需用到QT自帶的命令行控制臺,啟動方法:開始--->所有程序--->Qt by Nokia v4.6.3 (OpenSource)--->Qt 4.6.3 Command Prompt?
啟動命令行后,對應輸入如下命令:?
1)lupdate –verbose spreadsheet.pro //生成相應的.ts 文件?
2)linguist //啟動Linguist語言翻譯工具,可以翻譯相應可見字符串?
3)lrelease –verbose spreadsheet.pro //將翻譯好的文件生成.qm文件
(三)Linguist 語言工具的使用
1)啟動:命令行或者開始菜單均可
2)打開:工具界面中的File--->Open,可以打開所需的 .ts 文件?
3)翻譯:界面中部的翻譯欄,兩行:第一行:Source Text 第二行:… Translation, 在地二行進行相應的翻譯即可,翻譯完一條之后點擊“確定下一個”按鈕。?
4)發布:點擊File--->Release, 生成 .qm 文件。(與命令行的效果一樣)
(四)Linguist 語言工具使用方法建議
1、在代碼中所有需要使用中文的地方都用一段英文暫時代替,并用tr()函數做標記。
2、使用Qt Linguist對所有被tr()函數標記的字符串進行翻譯,并發布翻譯包。
3、在程序中加載翻譯包。
?????
??
? ? ??
?
??
?
? ??
? ?
?
? ?Java語言實現軟件多語言
在eclipse的Java軟件項目中的菜單欄、導航條、錯誤提示信息,狀態信息等這些固定不變的文本信息,可以把它們寫在一個properties文件中,并根據不同的國家編寫不同的properties文件。這一組properties文件稱之為一個資源包。
創建資源包和資源文件
一個資源包中的每個資源文件都必須擁有共同的基名。除了基名,每個資源文件的名稱中還必須有標識其本地信息的附加部分。例如:一個資源包的基名是“myproperties”,則與中文、英文環境相對應的資源文件名則為: "myproperties_zh.properties"? "myproperties_en.properties"
每個資源包都應有一個默認資源文件,這個文件不帶有標識本地信息的附加部分。若ResourceBundle對象在資源包中找不到與用戶匹配的資源文件,它將選擇該資源包中與用戶最相近的資源文件,如果再找不到,則使用默認資源文件。例如:myproperties.properties
資源文件的書寫格式
資源文件的內容通常采用"關鍵字=值"的形式,軟件根據關鍵字檢索值顯示在頁面上。一個資源包中的所有資源文件的關鍵字必須相同,值則為相應國家的文字。
并且資源文件中采用的是properties格式文件,所以文件中的所有字符都必須是ASCII字碼,屬性(properties)文件是不能保存中文的,對于像中文這樣的非ACSII字符,須先進行編碼。
例如:
國際化的中文環境的properties文件
國際化的英文環境的properties文件
java提供了一個native2ascII工具用于將中文字符進行編碼處理,native2ascII的用法如下所示:
編程實現固定文本的國際化
在JavaAPI中提供了一個ResourceBundle 類用于描述一個資源包,并且 ResourceBundle類提供了相應的方法getBundle,這個方法可以根據來訪者的國家地區自動獲取與之對應的資源文件予以顯示。
ResourceBundle類提供了一個靜態方法getBundle,該方法用于裝載資源文件,并創建ResourceBundle實例:
Locale?currentLocale?=?Locale.getDefault(); ResourceBundle?myResources?=ResourceBundle.getBundle(basename,?currentLocale); basename為資源包基名(且必須為完整路徑)。
如果與該locale對象匹配的資源包子類找不到。一般情況下,則選用默認資源文件予以顯示。?
加載資源文件后, 程序就可以調用ResourceBundle 實例對象的 getString 方法獲取指定的資源信息名稱所對應的值。
范例:根據國家地區自動獲取與之對應的資源文件
package?me.gacl.i18n;import?java.util.Locale; import?java.util.ResourceBundle; /** *?@ClassName:?I18NTest *?@Description:?編程實現固定文本的國際化 *?@author:?孤傲蒼狼 *?@date:?2014-8-29?下午9:34:05 * */? public?class?I18NTest?{public?static?void?main(String[]?args)?{//資源包基名(包名+myproperties)String?basename?=?"me.gacl.i18n.resource.myproperties";//設置語言環境Locale?cn?=?Locale.CHINA;//中文Locale?us?=?Locale.US;//英文//根據基名和語言環境加載對應的語言資源文件ResourceBundle?myResourcesCN?=?ResourceBundle.getBundle(basename,cn);//加載myproperties_zh.propertiesResourceBundle?myResourcesUS?=?ResourceBundle.getBundle(basename,us);//加載myproperties_en.properties//加載資源文件后,?程序就可以調用ResourceBundle實例對象的?getString方法獲取指定的資源信息名稱所對應的值。//String?value?=??myResources.getString(“key");String?usernameCN?=?myResourcesCN.getString("username");String?passwordCN?=?myResourcesCN.getString("password");String?usernameUS?=?myResourcesUS.getString("username");String?passwordUS?=?myResourcesUS.getString("password");System.out.println(usernameCN+"--"+passwordCN);System.out.println(usernameUS+"--"+passwordUS);} }運行結果:
3.4、在WEB應用中實現固定文本的國際化
如下所示:
<%@?page?language="java"??import="java.util.*"?pageEncoding="UTF-8"%> <!DOCTYPE?HTML> <html><head><title>國際化(i18n)測試</title></head><%//加載i18n資源文件,request.getLocale()獲取訪問用戶所在的國家地區ResourceBundle?myResourcesBundle?=?ResourceBundle.getBundle("me.gacl.i18n.resource.myproperties",request.getLocale());%><body><form?action=""?method="post"><%=myResourcesBundle.getString("username")%>:<input?type="text"?name="username"/><br/><%=myResourcesBundle.getString("password")%>:<input?type="password"?name="password"/><br/><input?type="submit"?value="<%=myResourcesBundle.getString("submit")%>"></form></body> </html>運行結果:
瀏覽器語言是中文環境下的顯示效果:
瀏覽器語言是英文環境下的顯示效果:
同樣一個頁面,在不同語言環境的瀏覽器下顯示出了不同的語言文字效果,這樣就實現了固定文本的國際化。
IE瀏覽器切換使用語言:工具→Internet選項
四、動態數據的國際化
數值,貨幣,時間,日期等數據由于可能在程序運行時動態產生,所以無法像文字一樣簡單地將它們從應用程序中分離出來,而是需要特殊處理。Java 中提供了解決這些問題的 API 類(位于 java.util 包和 java.text 包中)
Locale 類
Locale 實例對象代表一個特定的地理,政治、文化區域。
一個 Locale 對象本身不會驗證它代表的語言和國家地區信息是否正確,只是向本地敏感的類提供國家地區信息,與國際化相關的格式化和解析任務由本地敏感的類去完成。(若JDK中的某個類在運行時需要根據 Locale 對象來調整其功能,這個類就稱為本地敏感類)
DateFormat類(日期格式化)
DateFormat 類可以將一個日期/時間對象格式化為表示某個國家地區的日期/時間字符串。
DateFormat 類除了可按國家地區格式化輸出日期外,它還定義了一些用于描述日期/時間的顯示模式的 int 型的常量,包括FULL, LONG, MEDIUM, DEFAULT, SHORT,實例化DateFormat對象時,可以使用這些常量,控制日期/時間的顯示長度。
實例化DateFormat類
實例化DateFormat類有九種方式,以下三種為帶參形式,下面列出的三種方式也可以分別不帶參,或只帶顯示樣式的參數。
getDateInstance(int style, Locale aLocale):以指定的日期顯示模式和本地信息來獲得DateFormat實例對象,該實例對象不處理時間值部分。
getTimeInstance(int style, Locale aLocale):以指定的時間顯示模式和本地信息來獲得DateFormat實例對象,該實例對象不處理日期值部分。
getDateTimeInstance(int dateStyle, int timeStyle, Locale aLocale):以單獨指定的日期顯示模式、時間顯示模式和本地信息來獲得DateFormat實例對象。
、DateFormat 對象的方法
format:將date對象格式化為符合某個本地環境習慣的字符串。
parse:將字符串解析為日期/時間對象
注意:parse和format完全相反,一個是把date時間轉化為相應地區和國家的顯示樣式,一個是把相應地區的時間日期轉化成date對象,該方法在使用時,解析的時間或日期要符合指定的國家、地區格式,否則會拋異常。
DateFormat 對象通常不是線程安全的,每個線程都應該創建自己的 DateFormat? 實例對象
、DateFormat使用范例
package?me.gacl.i18n;import?java.text.DateFormat; import?java.text.ParseException; import?java.util.Date; import?java.util.Locale;/** *?@ClassName:?DateFormatTest *?@Description:?DateFormat類測試 *?DateFormat類可以將一個日期/時間對象格式化為表示某個國家地區的日期/時間字符串 *?@author:?孤傲蒼狼 *?@date:?2014-8-29?下午10:03:26 * */? public?class?DateFormatTest?{public?static?void?main(String[]?args)?throws?ParseException?{Date?date?=?new?Date();?//?當前這一刻的時間(日期、時間)//?輸出日期部分DateFormat?df?=?DateFormat.getDateInstance(DateFormat.FULL,Locale.GERMAN);String?result?=?df.format(date);System.out.println(result);//?輸出時間部分df?=?DateFormat.getTimeInstance(DateFormat.FULL,?Locale.CHINA);result?=?df.format(date);System.out.println(result);//?輸出日期和時間df?=?DateFormat.getDateTimeInstance(DateFormat.SHORT,?DateFormat.LONG,Locale.CHINA);result?=?df.format(date);System.out.println(result);//?把字符串反向解析成一個date對象String?s?=?"10-9-26?下午02時49分53秒";df?=?DateFormat.getDateTimeInstance(DateFormat.SHORT,?DateFormat.LONG,Locale.CHINA);Date?d?=?df.parse(s);System.out.println(d);} }、NumberFormat類(數字格式化)
NumberFormat類可以將一個數值格式化為符合某個國家地區習慣的數值字符串,也可以將符合某個國家地區習慣的數值字符串解析為對應的數值
NumberFormat類的方法:
format 方法:將一個數值格式化為符合某個國家地區習慣的數值字符串
parse 方法:將符合某個國家地區習慣的數值字符串解析為對應的數值。
實例化NumberFormat類時,可以使用locale對象作為參數,也可以不使用,下面列出的是使用參數的。
getNumberInstance(Locale locale):以參數locale對象所標識的本地信息來獲得具有多種用途的NumberFormat實例對象
getIntegerInstance(Locale locale):以參數locale對象所標識的本地信息來獲得處理整數的NumberFormat實例對象
getCurrencyInstance(Locale locale):以參數locale對象所標識的本地信息來獲得處理貨幣的NumberFormat實例對象
getPercentInstance(Locale locale):以參數locale對象所標識的本地信息來獲得處理百分比數值的NumberFormat實例對象
范例:
package?me.gacl.i18n;import?java.text.NumberFormat; import?java.text.ParseException; import?java.util.Locale;/** *?@ClassName:?NumberFormatTest *?@Description:?NumberFormat類測試 *?@author:?孤傲蒼狼 *?@date:?2014-8-29?下午10:25:29 * */? public?class?NumberFormatTest?{public?static?void?main(String[]?args)?throws?ParseException?{int?price?=?89;NumberFormat?nf?=?NumberFormat.getCurrencyInstance(Locale.CHINA);String?result?=?nf.format(price);System.out.println(result);String?s?=?"¥89.00";nf?=?NumberFormat.getCurrencyInstance(Locale.CHINA);Number?n?=?nf.parse(s);System.out.println(n.doubleValue()?+?1);double?num?=?0.5;nf?=?NumberFormat.getPercentInstance();System.out.println(nf.format(num));} }運行結果:
4.4、MessageFormat(文本格式化)
如果一個字符串中包含了多個與國際化相關的數據,可以使用MessageFormat類對這些數據進行批量處理。
例如:At 12:30 pm on jul 3,1998, a hurricance destroyed 99 houses and caused $1000000 of damage
以上字符串中包含了時間、數字、貨幣等多個與國際化相關的數據,對于這種字符串,可以使用MessageFormat類對其國際化相關的數據進行批量處理。
MessageFormat 類如何進行批量處理呢?
1.MessageFormat類允許開發人員用占位符替換掉字符串中的敏感數據(即國際化相關的數據)。
2.MessageFormat類在格式化輸出包含占位符的文本時,messageFormat類可以接收一個參數數組,以替換文本中的每一個占位符。
、模式字符串與占位符
模式字符串:
At {0} on {1},a destroyed {2} houses and caused {3} of damage
字符串中的{0}、{1}、{2}、{3}就是占位符
格式化模式字符串
1、實例化MessageFormat對象,并裝載相應的模式字符串。
2、使用format(object obj[])格式化輸出模式字符串,參數數組中指定占位符相應的替換對象。
范例:
package?me.gacl.i18n;import?java.text.MessageFormat; import?java.util.Date; import?java.util.Locale;/** *?@ClassName:?MessageFormatTest *?@Description:?MessageFormat類測試 *?@author:?孤傲蒼狼 *?@date:?2014-8-29?下午10:29:19 * */? public?class?MessageFormatTest?{public?static?void?main(String[]?args)?{//模式字符串String?pattern?=?"On?{0},?a?hurricance?destroyed?{1}?houses?and?caused?{2}?of?damage.";//實例化MessageFormat對象,并裝載相應的模式字符串MessageFormat?format?=?new?MessageFormat(pattern,?Locale.CHINA);Object?arr[]?=?{new?Date(),?99,?100000000};//格式化模式字符串,參數數組中指定占位符相應的替換對象String?result?=?format.format(arr);System.out.println(result);} }運行結果:
、占位符的三種書寫方式
{argumentIndex}: 0-9 之間的數字,表示要格式化對象數據在參數數組中的索引號
{argumentIndex,formatType}: 參數的格式化類型
{argumentIndex,formatType,FormatStyle}: 格式化的樣式,它的值必須是與格式化類型相匹配的合法模式、或表示合法模式的字符串。
范例:
package?me.gacl.i18n;import?java.text.MessageFormat; import?java.util.Date; import?java.util.Locale;/** *?@ClassName:?MessageFormatTest *?@Description:?MessageFormat類測試 * */? public?class?MessageFormatTest?{public?static?void?main(String[]?args)?{//模式字符串String?pattern?=?"At?{0,?time,?short}?on?{0,?date},?a?destroyed?{1}?houses?and?caused?{2,?number,?currency}?of?damage.";//實例化MessageFormat對象,并裝載相應的模式字符串MessageFormat?format?=?new?MessageFormat(pattern,?Locale.US);Object?arr[]?=?{new?Date(),?99,?100000000};//格式化模式字符串,參數數組中指定占位符相應的替換對象String?result?=?format.format(arr);System.out.println(result);} }運行結果:
net平臺下的c#編程語言
比如你做一個C# winform 項目,C#如何實現多語言界面程序呢?
方法:首先設計多語言文件,這里我用XML來保存,基本結構如下。?
敲擊代碼:
這里是語言文件的局部,主體分為四個部分,Menu, Toolbar, Form 和 Dialog,分別對應菜單,工具欄,窗體和對話框的顯示字符串。
在Form里面,其每個子樹分別對應一個窗體。XML每項有三個域,id 這個只是用來標號,程序中為用,key,value形成一個字典,key是控件的名稱,value是控件的text。在Dialog中key用數字編號。
做其他語言文件時,只用將value里面的值改成對應的語言即可。
當然,我們也不一定用XML來寫語言文件,簡單的ini文件也行。下面設計讀取這個XML的類,
這里我使用靜態類來讀取和保存,這樣效率相對會高一些。讀取XML時,我使用的是XmlReader,它使用流式讀取,速度也比較快。
Forms, Menu, Toolbar, Dialog幾個屬性分別對應XML中的子樹,使用.net中的Dictionary范型,Forms嵌套了一層Dictionary。
Load方法是加載語言文件,readLanguage 和paraseXML 函數對XML進行解析,并保存字符串到對應的屬性中。
AddForm這個方法是將每個窗體的動態的添加到forms 里面。
在程序開始main 函數中,首先調用AddForm方法,添加所有窗體。
//?添加所有窗體用于本地化(按XML中順序) ? private?static?void?AddForm() ? { ? ????Localization.AddForm("MainForm"); ? ????Localization.AddForm("UserLoginForm"); ? ????Localization.AddForm("UserManageForm"); ? ????Localization.AddForm("ChangePasswordForm"); ? }?然后加載語言文件。?
if?(!Localization.Load("zh")) ? ????????????{ ? ????????????????MessageBox.Show("無法加載語言配置文件,?將顯示英文.",?"錯誤",?MessageBoxButtons.OK, ? ????????????????????MessageBoxIcon.Exclamation); ? ????????????????Localization.HasLang?=?false; ? ????????????} ? ????????????else? ????????????????Localization.HasLang?=?true;?在每個Form的Load事件中初始化每個控件的Text。?
if?(Localization.HasLang) ? ?????????RefreshLanguage(); ? ? ? //?更新窗體語言 ? public?static?void?RefreshLanguage(Form?form) ? {?????????? ? ?????form.Text?=?Localization.Forms[form.Name][form.Name]; ? ?????SetControlsLanguage(form,?Localization.Forms[form.Name]); ? } ? ? ?????????遞歸更新每個控件Text ? ? ?///?<?summary> ? ?///?設置control子控件語言 ? ?///?<?/summary> ? ?///?<?param?name="control">父控件<?/param> ? ?///?<?param?name="obj">語言字典<?/param> ? ?public?static?void?SetControlsLanguage(Control?control,?Dictionary<?string,?string>?obj) ? ?{ ? ??????foreach?(Control?ctrl?in?control.Controls) ? ??????{ ? ?????????//?set?the?control?which?one's?key?in?the?dictionary ? ?????????string?text?=?""; ? ?????????if?(obj.TryGetValue(ctrl.Name,?out?text)) ? ???????????????ctrl.Text?=?text; ? ? ? ?????????if?(ctrl.HasChildren) ? ???????????????SetControlsLanguage(ctrl,?obj); ? ???????} ? ?}?另外主窗體的Menu和Toolbar,我采用以下的方法更新。?
//?Refresh?the?menu?language ? ?foreach?(ToolStripMenuItem?topItem?in?MainMenuStrip.Items) ? ?{ ? ???????topItem.Text?=?Localization.Menu[topItem.Name]; ? ???????foreach?(ToolStripItem?item?in?topItem.DropDownItems) ? ???????{ ? ?????????????if?(item?is?ToolStripMenuItem) ? ?????????????{ ? ??????????????????string?text?=?""; ? ??????????????????if?(Localization.Menu.TryGetValue(item.Name,?out?text)) ? ???????????????????????item.Text?=?text; ? ?????????????} ? ???????} ? ?} ? ? ? ?//?Refresh?the?statusbar?language ? ?foreach?(ToolStripItem?item?in?mainStatus.Items) ? ?{ ? ??????string?text?=?""; ? ??????if?(Localization.Toolbar.TryGetValue(item.Name,?out?text)) ? ??????????????item.Text?=?text; ? ?}?Dialog就直接調用Localization中的Dialog屬性即可。
需要轉變為不同語言時只需要再調用一次Localization.Load方法。
這樣,就完成了C#實現多語言界面程序。
大功告成adiOS
轉載于:https://my.oschina.net/bigfool007139/blog/552555
總結
- 上一篇: easyPOI导出时间字段注意事项
- 下一篇: 2021广东高考成绩排名如何查询,202