常用的编码
ASCII碼是標準化字符集,使用7個二進制位編碼,可以表示128個字符,通常ASCII表示的是英文字母的二進制編碼,
例如大寫字母'A'的二進制編碼為65,python代碼如下:
>>> ord('A') 65 >>> chr(65) 'A' Unicode是另外一種編碼方式,是為了解決傳統編碼方式的局限而產生的,它為每種語言中的每個字符設置了統一并且唯一的二進制編碼,以滿足跨語言、跨平臺進行文本轉化的要求。對每種語言的每個字符用兩個字節長的ID號進行編碼,從而規定出一個多達65536個字符的編碼空間。UTF-8編碼是一種可變長度的Unicode的實現方法,是一個多字節的編碼體系,英文對應Unicode的單字節,中文、日韓文對應Unicode的三字節。我們可以看出UTF-8與Unicode編碼方式的區別是,編碼長度的不同。Unicode采用固定長度的兩個字節來表示,而UTF-8可以采用一到四個字節,不同的長度來表示。
創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎總結
- 上一篇: 协方差理解,PCA以及奇异值分解(SVD
- 下一篇: “横平竖直”进行连线+将相邻框进行合并