spool导出姓名中文乱码_MySQL不同字符集转化标准—7步实现,杜绝乱码!
引言
作為資深的DBA程序員,在工作中是否會(huì)遇到更這樣的情況呢?
原有數(shù)據(jù)庫(kù)的字符集由于前期規(guī)劃不足,隨著業(yè)務(wù)的發(fā)展不能滿足業(yè)務(wù)的需求。如原來(lái)業(yè)務(wù)系統(tǒng)用的是utf8字符集,后期有存儲(chǔ)表情符號(hào)的需求,uft8字符集就不能滿足此時(shí)的業(yè)務(wù)需求了。需要用utf8mb4字符集。
數(shù)據(jù)庫(kù)遷移,源和目標(biāo)數(shù)據(jù)庫(kù)的字符集不一致,需要在遷移之前進(jìn)行轉(zhuǎn)換。
更換數(shù)據(jù)庫(kù)字符集的時(shí)候明明很認(rèn)(jian)真(dan),總是會(huì)出現(xiàn)各種各樣的問(wèn)題,導(dǎo)致更換之后數(shù)據(jù)庫(kù)的數(shù)據(jù)出現(xiàn)亂碼!
今天小編就同大家一起梳理下如何正確更換數(shù)據(jù)庫(kù)的字符集,下文將簡(jiǎn)單講解數(shù)據(jù)庫(kù)不同字符集的轉(zhuǎn)換過(guò)程。步驟轉(zhuǎn)化,杜絕亂碼!
常用字符集
- GBK是國(guó)家標(biāo)準(zhǔn)GB2312基礎(chǔ)上擴(kuò)容后兼容GB2312的標(biāo)準(zhǔn)。GBK的文字編碼是用雙字節(jié)來(lái)表示的,即不論中、英文字符均使用雙字節(jié)來(lái)表示,為了區(qū)分中文,將其最高位都設(shè)定成1。GBK包含全部中文字符,是國(guó)家編碼,通用性比UTF8差,不過(guò)UTF8占用的數(shù)據(jù)庫(kù)比GBK大。支持簡(jiǎn)體中文及繁體中文。
utf8字符集:是一種UTF-8編碼的Unicode字符集,每個(gè)字符占用1到3個(gè)字節(jié)。UTF-8包含全世界所有國(guó)家需要用到的字符,是國(guó)際編碼,通用性強(qiáng)。
- utf8mb4字符集:是一種UTF-8編碼的Unicode字符集,每個(gè)字符占用1到4個(gè)字節(jié)。可以覆蓋BMP范圍內(nèi)的字符和增補(bǔ)字符。BMP范圍內(nèi)的字符編碼和utf8字符集中的編碼是完全相同的,長(zhǎng)度也是完全一樣的,所以u(píng)tf8mb4字符集可以兼容utf8字符集。
- GB2312是GBK的子集,GBK是GB18030的子集。
- big5支持繁體中文
轉(zhuǎn)化過(guò)程
以下模擬的是將latin1字符集的數(shù)據(jù)庫(kù)修改成GBK的過(guò)程 。其他字符集的轉(zhuǎn)換過(guò)程類(lèi)似。需要注意的是要轉(zhuǎn)換的目標(biāo)字符集一定是源字符集的超級(jí)或者目標(biāo)字符集的范圍包含源字符集的范圍。
2.1 導(dǎo)表結(jié)構(gòu)
mysqldump -uroot -p --default-character-set=gbk -d databasename >createtb.sql其中--default-character-set=gbk表示設(shè)置以什么字符集連接,-d表示只導(dǎo)出表結(jié)構(gòu),不導(dǎo)出數(shù)據(jù)。
2.2 手工修改createtb.sql中表結(jié)構(gòu)定義中的字符集為新的字符集。
2.3 確保記錄不再更新,導(dǎo)出所有記錄
mysqldump -root -p --quick --no-create-info --extended-insert --default-character-set=latin1 databasename>data.sql- --quick:該選項(xiàng)用于轉(zhuǎn)儲(chǔ)大的表。它強(qiáng)制mysqldump從服務(wù)器一次一行地檢索表中的行而不是所有的行,并在輸出前將它緩沖到內(nèi)存中。
- --extended-insert:使用包括幾個(gè)values列表的多行insert語(yǔ)法。這樣使轉(zhuǎn)儲(chǔ)文件更小,重載文件時(shí)可以加速插入。
- --no-create-info:不導(dǎo)出每個(gè)轉(zhuǎn)儲(chǔ)表的create table語(yǔ)句。
- --default-character-set=latin1:按照原有的字符集導(dǎo)出所有數(shù)據(jù)。這樣導(dǎo)出的文件中,所有中文都是可見(jiàn)的,不會(huì)保存成亂碼。
2.4 打開(kāi)data.sql,將set names latin1修改成set names bgk.
2.5 使用新的字符集創(chuàng)建新的數(shù)據(jù)庫(kù)。
create database databasename default charset bgk;2.6 創(chuàng)建表,執(zhí)行createtab.sql
mysql -root -p databasename2.7 導(dǎo)入數(shù)據(jù),執(zhí)行data.sql
mysql -root -p databasename總結(jié)
新的字符集一定要是原字符集的超集,不然轉(zhuǎn)化之后,數(shù)據(jù)會(huì)出現(xiàn)亂碼。常見(jiàn)字符集轉(zhuǎn)換如下:
總結(jié)
以上是生活随笔為你收集整理的spool导出姓名中文乱码_MySQL不同字符集转化标准—7步实现,杜绝乱码!的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: [转载] Java8 Stream流遍历
- 下一篇: 求立方根_初一数学立方根考点详解,立足基