异常空格,ASCII (194,160)问题
今天遇到了個異常空格的問題,與:http://www.cnblogs.com/wangyuyu/p/3711887.html 一致。
寫了兩行hive語句,看起來完全一樣,但是就是一個可以執行,一個不可以。diff出兩者不同,但是死活看不出來。
后來發現,由于一個是從qq中copy到onenote中再copy出來的,可能中間發生了轉化。具體見下。
-------------------------------------------------------------
今天運營的同學反映有一些店鋪的名稱后面帶空格,我下意識的說不可能啊,我已經處理過了啊。然后就找出來看。
其中有個店鋪的名稱是“安踏 ”,第一眼看上去好像是帶了個空格。然后我就仔細的看了下。
??
1 pry(main)> "安踏?".strip 2 => "安踏?"竟然沒有變化。
1 pry(main)> "安踏?"[-1] == " " 2 => false怪不得,原來不是一個空格。
到底是什么呢? 對,查一下ascii碼
1 pry(main)> " ".bytes 2 => [32]空格的ascii 是32
1 pry(main)> "安踏?"[-1].bytes 2 => [194, 160]這個竟然是194,160. 原來如此。
? 原因是字符串中的一個空格(ASCII:32)被UTF-8編碼之后變成了字符(ASCII:194 和 160的組合)。在 UTF-8編碼里面存在一個特殊的字符,其編碼是“0xC2 0xA0”,轉換成字符的時候表現為一個半角空格,跟一般的半角空格(ASCII 0x20)不同的是它的寬度不會被壓縮,所以排版中常能用到它。但是GB2312、Unicode之類并沒有這樣的字符,所以轉換后前臺會顯示為“?” 號,只是顯示為問號而不是真正的問號,所以無法被替換。
?
解決方法是:
1 Shop.each do |shop| 2 if shop.name.include?("?") 3 shop.name = shop.name.split("?")[0] 4 shop.save 5 end 6 end總結
以上是生活随笔為你收集整理的异常空格,ASCII (194,160)问题的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 蹬N级阶梯有几种走法
- 下一篇: python logging 毫秒级别的