关于计算机编码的笔记
生活随笔
收集整理的這篇文章主要介紹了
关于计算机编码的笔记
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
一直對于字符編碼不是很清晰,今天各種百度百科刷一下,最后看到一篇文章:
https://www.zhihu.com/question/23374078寫的實在太好了,以上總結就是 ASCII => GB2312 => GBK =>? Unicode。
unicode跟utf-8、utf -16、utf-32有什么關系呢?
Unicode 是「字符集」 UTF-8 是「編碼規則」 字符集:為每一個「字符」分配一個唯一的 ID(學名為碼位 / 碼點 / Code Point) 編碼規則:將「碼位」轉換為字節序列的規則(編碼/解碼 可以理解為 加密/解密 的過程) 轉載自:https://www.zhihu.com/question/23374078unicode,gbk和大五碼就是編碼的值,而utf-8,uft-16之類就是這個值的表現形式。 utf的推出也是為了解決unicode在不同機器之中的傳輸差異問題、以及內存浪費的問題,比如2個8bit傳輸一個英文字母,那么高位字節就全是0000而浪費了一倍的內存。 所以utf-8代表的unicode碼,對于ASCII就能表示的字符,內存是浪費的,因為有個字節是空的。utf比gbk是更加浪費內存的。 utf8\16\32是unicode的三套編碼方式,utf-8之中字符是以8位序列來編碼的,16、32同理。考慮到最初的目的,通常說的unicode編碼指的是utf-16 (unicode的最初目標是用1個16位的編碼來為超過65000個字符提供映射,但仍然不能覆蓋歷史上所有文字以及不能解決傳輸上的問題)。
為什么所有網站更鐘情于utf-8呢?
UTF-8 的幾個優勢1. 亂碼不會擴散, GB2312 在丟失一字節等情況下會造成后續所有文字變成亂碼2. 不會產生錯誤的搜索結果, GB2312 在搜索的時候相鄰兩個中文會拼出一個新的字符,導致出現錯誤的搜索結果3. 更大的字符集4. 很多語言直接支持 UTF-8,部分語言存儲字符串到內存時直接使用 UTF-8編碼。5. 與 GB2312/GB18030 相比, UTF-8是一個通用解決方案6. Unicode 一直有人維護,而 GB18030 下一次更新不知道會是什么時候了。 另 對于中文, UTF-8 和 GB2312 在 gzip 壓縮后都差不多,所以用來做網頁對帶寬影響很小作者:李道兵 鏈接:https://www.zhihu.com/question/19817672/answer/20527784 來源:知乎 著作權歸作者所有。商業轉載請聯系作者獲得授權,非商業轉載請注明出處。?
GB2312、GBK、GB18030 這幾種字符集的主要區別是什么?
http://www.cnblogs.com/malecrab/p/5300497.html?
創建數據庫的時候眾多字符編碼、排序規則又該如何選擇呢、
?
?sublime的常用設置
?
{// 配色選擇"color_scheme": "Packages/Color Scheme - Default/Monokai.tmTheme",// 字體大小"font_size": 11,"ignored_packages":["Vintage"],// 顯示編碼"show_encoding": true,"show_line_endings": true,//把 tab 轉換成4個空格"tab_size": 4,//把tab 轉換成 空格"translate_tabs_to_spaces": true ,//主題選擇 "theme": "Adaptive.sublime-theme" }?
推薦書籍:
蔣本珊 -《計算機組成原理》
?
轉載于:https://www.cnblogs.com/xuweiqiang/p/8449957.html
總結
以上是生活随笔為你收集整理的关于计算机编码的笔记的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 将用户名保存至cookie中
- 下一篇: 一个简单IOC与DI示例