當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

关于编码

發布時間：2023/12/18 编程问答 25 豆豆

生活随笔收集整理的這篇文章主要介紹了关于编码小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

什么是base64編碼？（參考http://baike.baidu.com/link?url=cfsgKvvFm9WRUFz_gHVvRd5chcfclMd_yZLGShlkRh7LeiA4KmhoSxtOUMi7Qcb8t3FNkQNkyQT_VBOCDxLxHa）

采用Base64編碼不僅比較簡短，同時也具有不可讀性，即所編碼的數據不會被人用肉眼所直接看到。然而，標準的Base64并不適合直接放在URL里傳輸，因為URL編碼器會把標準Base64中的“/”和“+”字符變為形如“%XX”的形式，而這些“%”號在存入數據庫時還需要再進行轉換，因為ANSI SQL中已將“%”號用作通配符。為解決此問題，可采用一種用于URL的改進Base64編碼，它不僅在末尾填充'='號，并將標準Base64中的“+”和“/”分別改成了“-”和“_”，這樣就免去了在URL編解碼和數據庫存儲時所要作的轉換，避免了編碼信息長度在此過程中的增加，并統一了數據庫、表單等處對象標識符的格式。什么是Unicode（參考參考http://www.cnblogs.com/chenwenbiao/archive/2011/08/11/2134503.html）

?如果有一種編碼，將世界上所有的符號都納入其中。每一個符號都給予一個獨一無二的編碼，那么亂碼問題就會消失。這就是Unicode。

Unicode分為 Little endian和Big endian

Unicode碼可以采用UCS-2格式直接存儲。

以漢字”嚴“為例，Unicode碼是4E25，需要用兩個字節存儲，一個字節是4E，另一個字節是25。存儲的時候，4E在前，25在后，就是Big endian方式；25在前，4E在后，就是Little endian方式。

這兩個古怪的名稱來自英國作家斯威夫特的《格列佛游記》。在該書中，小人國里爆發了內戰，戰爭起因是人們爭論，吃雞蛋時究竟是從大頭(Big-Endian)敲開還是從小頭(Little-Endian)敲開。為了這件事情，前后爆發了六次戰爭，一個皇帝送了命，另一個皇帝丟了王位。

因此，第一個字節在前，就是”大頭方式“（Big endian），第二個字節在前就是”小頭方式“（Little endian）。

那么很自然的，就會出現一個問題：計算機怎么知道某一個文件到底采用哪一種方式編碼？

Unicode規范中定義，每一個文件的最前面分別加入一個表示編碼順序的字符，這個字符的名字叫做”零寬度非換行空格“（ZERO WIDTH NO-BREAK SPACE），用FEFF表示。這正好是兩個字節，而且FF比FE大1。

如果一個文本文件的頭兩個字節是FE FF，就表示該文件采用大頭方式；如果頭兩個字節是FF FE，就表示該文件采用小頭方式。

什么是ASCII碼

分為兩種，

基礎ASCII碼是使用7 位二進制數（剩下的1位二進制為0）表示128 種可能的字符（包括所有的大寫和小寫字母，數字0 到9、標點符號，以及在美式英語中使用的特殊控制字符）。

擴展ASCII 碼是8 位二進制數組合來表示從128 到255（0x80-0xff）的字符。

什么是utf編碼（參考http://www.cnblogs.com/chenwenbiao/archive/2011/08/11/2134503.html）

對可以用ASCII表示的字符使用UNICODE并不高效，因為UNICODE比ASCII占用大一倍的空間，而對ASCII來說高字節的0對他毫無用處。為了解決這個問題，就出現了一些中間格式的字符集，他們被稱為通用轉換格式，即UTF（Unicode Transformation Format）。

UTF-8就是在互聯網上使用最廣的一種unicode的實現方式。其他實現方式還包括UTF-16和UTF-32，不過在互聯網上基本不用。

UTF-8最大的一個特點，就是它是一種變長的編碼方式。它可以使用1~4個字節表示一個符號，根據不同的符號而變化字節長度。

UTF-8的編碼規則很簡單，只有二條：

1）對于單字節的符號，字節的第一位設為0，后面7位為這個符號的unicode碼。因此對于英語字母，UTF-8編碼和ASCII碼是相同的。

2）對于n字節的符號（n>1），第一個字節的前n位都設為1，第n+1位設為0，后面字節的前兩位一律設為10。剩下的沒有提及的二進制位，全部為這個符號的unicode碼。

下表總結了編碼規則，字母x表示可用編碼的位。

?什么是ANSI編碼

是一種相對于操作系統的默認編碼，對于英文文件是ASCII編碼，對于簡體中文文件是GB2312編碼（只針對Windows簡體中文版，如果是繁體中文版會采用Big5碼）。

轉載于:https://www.cnblogs.com/John-Marnoon/p/5825906.html

總結

以上是生活随笔為你收集整理的关于编码的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：使用ocr的自动备份还原ocr
下一篇：【转载】fullpage.js学习

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

编程问答

关于编码

總結