Linux基础优化方法(三)———字符集编码设置优化
生活随笔
收集整理的這篇文章主要介紹了
Linux基础优化方法(三)———字符集编码设置优化
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
Linux基礎(chǔ)優(yōu)化方法(三)———字符集編碼設(shè)置優(yōu)化
- 一、什么是字符編碼
- 二、編碼GB2312、GBK、UTF-8
- 三、工作時(shí)有亂碼的原因
- 四、進(jìn)行優(yōu)化
- 1、CentOS 6
- ①、查看默認(rèn)編碼信息:
- ②、臨時(shí)修改編碼信息:
- ③、永久修改:(兩種方法都使用,系統(tǒng)優(yōu)先選擇第一種)
- **方法一:**
- **方法二:**
- 2、CentOS 7
- ①、查看默認(rèn)編碼信息:
- ②、臨時(shí)修改編碼信息:
- ③、永久修改:(兩種方法都使用,系統(tǒng)優(yōu)先選擇第一種)
- **方法一:**
- **方法二:**
一、什么是字符編碼
- 字符編碼(英語:Character encoding)也稱字集碼,是把字符集中的字符編碼為指定集合中某一對(duì)象(例如:比特模式、自然數(shù)序列、8位組或者電脈沖),以便文本在計(jì)算機(jī)中存儲(chǔ)和通過通信網(wǎng)絡(luò)的傳遞。常見的例子包括將拉丁字母表編碼成摩斯電碼和ASCII。其中,ASCII將字母、數(shù)字和其它符號(hào)編號(hào),并用7比特的二進(jìn)制來表示這個(gè)整數(shù)。通常會(huì)額外使用一個(gè)擴(kuò)充的比特,以便于以1個(gè)字節(jié)的方式存儲(chǔ)。
- 在計(jì)算機(jī)技術(shù)發(fā)展的早期,如ASCII(1963年)和EBCDIC(1964年)這樣的字符集逐漸成為標(biāo)準(zhǔn)。但這些字符集的局限很快就變得明顯,于是人們開發(fā)了許多方法來擴(kuò)展它們。對(duì)于支持包括東亞CJK字符家族在內(nèi)的寫作系統(tǒng)的要求能支持更大量的字符,并且需要一種系統(tǒng)而不是臨時(shí)的方法實(shí)現(xiàn)這些字符的編碼。
二、編碼GB2312、GBK、UTF-8
- 早期時(shí)候,計(jì)算機(jī)編碼是不能識(shí)別漢字的,對(duì)于我們中國這個(gè)頻繁使用漢字的國家來說很不公平。 因此,出現(xiàn)了編碼GB2312。
- GB2312 也是ANSI編碼里的一種,對(duì)ANSI編碼最初始的ASCII編碼進(jìn)行擴(kuò)充,為了滿足國內(nèi)在計(jì)算機(jī)中使用漢字的需要,中國國家標(biāo)準(zhǔn)總局發(fā)布了一系列的漢字字符集國家標(biāo)準(zhǔn)編碼,統(tǒng)稱為GB碼,或國標(biāo)碼。
- GBK即漢字內(nèi)碼擴(kuò)展規(guī)范,K為擴(kuò)展的漢語拼音中“擴(kuò)”字的聲母。英文全稱Chinese Internal Code Specification。GBK編碼標(biāo)準(zhǔn)兼容GB2312,共收錄漢字21003個(gè)、符號(hào)883個(gè),并提供1894個(gè)造字碼位,簡(jiǎn)、繁體字融于一庫。GB2312碼是中華人民共和國國家漢字信息交換用編碼,全稱《信息交換用漢字編碼字符集——基本集》,1980年由國家標(biāo)準(zhǔn)總局發(fā)布。基本集共收入漢字6763個(gè)和非漢字圖形字符682個(gè),通行于中國大陸。新加坡等地也使用此編碼。GBK是對(duì)GB2312-80的擴(kuò)展,也就是CP936字碼表 (Code Page 936)的擴(kuò)展(之前CP936和GB 2312-80一模一樣)。
- Unicode編碼:有一種編碼,將世界上所有的符號(hào)都納入其中,無論是英文、日文、還是中文等,大家都使用這個(gè)編碼表,就不會(huì)出現(xiàn)編碼不匹配現(xiàn)象。每個(gè)符號(hào)對(duì)應(yīng)一個(gè)唯一的編碼,亂碼問題就不存在了。這就是Unicode編碼。
- UTF-8編碼: Unicode固然統(tǒng)一了編碼方式,但是它的效率不高,為了提高Unicode的編碼效率,于是就出現(xiàn)了UTF-8編碼。UTF-8可以根據(jù)不同的符號(hào)自動(dòng)選擇編碼的長(zhǎng)短。比如英文字母可以只用1個(gè)字節(jié)就夠了。
三、工作時(shí)有亂碼的原因
- 系統(tǒng)字符集設(shè)置有問題
- 遠(yuǎn)程軟件字符集設(shè)置有問題
- 文件編寫字符集和系統(tǒng)查看字符集不統(tǒng)一(例如編寫用UTF-8,查看歐諾個(gè)的是GBK)
四、進(jìn)行優(yōu)化
1、CentOS 6
①、查看默認(rèn)編碼信息:
②、臨時(shí)修改編碼信息:
③、永久修改:(兩種方法都使用,系統(tǒng)優(yōu)先選擇第一種)
方法一:
方法二:
2、CentOS 7
①、查看默認(rèn)編碼信息:
②、臨時(shí)修改編碼信息:
③、永久修改:(兩種方法都使用,系統(tǒng)優(yōu)先選擇第一種)
方法一:
方法二:
總結(jié)
以上是生活随笔為你收集整理的Linux基础优化方法(三)———字符集编码设置优化的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: haswell处理器内存选择:DDR3
- 下一篇: 256g内存卡:储存无忧,操作更流畅