2.1.4 什么是ASCII码?汉字的表示和编码是怎样的?
生活随笔
收集整理的這篇文章主要介紹了
2.1.4 什么是ASCII码?汉字的表示和编码是怎样的?
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
文章目錄:
- 1.什么是ASCII碼?
- 2.漢字的表示和編碼是怎樣的?
1.什么是ASCII碼?
- 我們知道我們日常見到的數字(0~9)、符號比如:#、%、+、@等、英語字母如:(A~z)、(a~z),它們在計算機中都是以二進制來表示存儲的,咱們可以用不同的二進制數來表示,但是為了統一化、使大家的相互通信可以正常進行,那么就必須制定一套統一的標準來規范它,由此ASCII碼隨之誕生,大家都遵從這一統一的標準進行數據的通信和交流。至于ASCII碼代表的意思,可參考百科。
2.漢字的表示和編碼是怎樣的?
- 漢字編碼:Hanzi bianma漢字編碼(Chinese character encoding )是為漢字設計的一種便于輸入計算機的代碼。由于電子計算機現有的輸入鍵盤與英文打字機鍵盤完全兼容。因而如何輸入非拉丁字母的文字(包括漢字)便成了多年來人們研究的課題。 漢字信息處理系統一般包括編碼、輸入、存儲、編輯、輸出和傳輸。編碼是關鍵。不解決這個問題,漢字就不能進入計算機。
- 途徑:漢字進入計算機的三種途徑 分別為:
①機器自動識別漢字:計算機通過“視覺”裝置(光學字符閱讀器或其他),用光電掃描等方法識別漢字。
②通過語音識別輸入:計算機利用人們給它配備的“聽覺器官”,自動辨別漢語語音要素,從不同的音節中找出不同的漢字,或從相同音節中判斷出不同漢字。
③通過漢字編碼輸入:根據一定的編碼方法,由人借助輸入設備將漢字輸入計算機。
機器自動識別漢字和漢語語音識別,國內外都在研究,雖然取得了不少進展,但由于難度大,預計還要經過相當一段時間才能得到解決。在現階段,比較現實的就是通過漢字編碼方法使漢字進入計算機。 - 分類:計算機中漢字的表示也是用二進制編碼,同樣是人為編碼的。根據應用目的的不同,漢字編碼分為外碼、交換碼、機內碼和字形碼。
1.外碼(輸入碼)
外碼也叫輸入碼,是用來將漢字輸入到計算機中的一組鍵盤符號。常用的輸入碼有拼音碼、五筆字型碼、自然碼、表形碼、認知碼、區位碼和電報碼等,一種好的編碼應有編碼規則簡單、易學好記、操作方便、重碼率低、輸入速度快等優點,每個人可根據自己的需要進行選擇。
2.交換碼(國標碼)
計算機內部處理的信息,都是用二進制代碼表示的,漢字也不例外。而二進制代碼使用起來是不方便的,于是需要采用信息交換碼。中國標準總局1981年制定了中華人民共和國國家標準GB2312–80《信息交換用漢字編碼字符集–基本集》,即國標碼。
區位碼是國標碼的另一種表現形式,把國標GB2312–80中的漢字、圖形符號組成一個94×94的方陣,分為94個“區”,每區包含94個“位”,其中“區”的序號由01至94,“位”的序號也是從01至94。94個區中位置總數=94×94=8836個,其中7445個漢字和圖形字符中的每一個占一個位置后,還剩下1391個空位,這1391個位置空下來保留備用。
3.機內碼
根據國標碼的規定,每一個漢字都有了確定的二進制代碼,在微機內部漢字代碼都用機內碼,在磁盤上記錄漢字代碼也使用機內碼。
4.漢字的字形碼
字形碼是漢字的輸出碼,輸出漢字時都采用圖形方式,無論漢字的筆畫多少,每個漢字都可以寫在同樣大小的方塊中。通常用16×16點陣來顯示漢字。
5.漢字地址碼
漢字地址碼是指漢字庫中存儲漢字字形信息的邏輯地址碼。它與漢字內碼有著簡單的對應關系,以簡化內碼到地址碼的轉換。
總結
以上是生活随笔為你收集整理的2.1.4 什么是ASCII码?汉字的表示和编码是怎样的?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 2.1.2 何为真值,何为机器数?
- 下一篇: 2.2.1 定点数的表示(无符号与有符号