python模块--json \ pickle \ shelve \ XML模块
一、json模塊
之前學習過的eval內置方法可以將一個字符串轉成一個python對象,不過eval方法時有局限性的,對于普通的數據類型,json.loads和eval都能用,但遇到特殊類型的時候,eval就不管用了。所以eval的重點還是通常用來執行一個字符串表達式,并返回表達式的值。
1 import json 2 x = "[null,true,false,1]" 3 # print(eval(x)) #用eval會報錯 4 print(json.loads(x)) # 用json就不會報錯 View Code什么是序列化?
我們把對象(變量)從內存種變成可存儲或傳輸的過程稱之為序列化,在python種叫picking,在其他語言種也被稱之為serialiation,marshalling,flattening,等等,都是一個意思。序列化之后,就可以把徐磊話后的內容寫入磁盤,或者通過網絡傳輸到機器上。反過來,把變量內容從徐磊話的對象重新督導內存里稱之為反序列化,即unpicking.
json
如果我們要在不同的編程語言之間傳遞對象,就必須把對象序列化為標準式,比如XML,但更好的方法是序列化為json,因為json表示出來就是一個字符串,可以被所有語言讀取。也可以方便的存儲到磁盤或者通過網絡傳輸。json不僅是標準式,并且比XML更快,而且可以直接在web頁面種讀取,非常方便。
1 json表示的對象就是標準的JavaScript語言的對象,json和python內置的書v類型如下: 2 3 JSON PYTHON類型 4 {} dict 5 [] list 6 "string" str 7 1234.56 int或float 8 true/false Ture/False 9 null Nonejson的內部轉成
1 dic={'name':'alex'}#---->{"name":"alex"}----->'{"name":"alex"}' 2 i=8 #---->'8' 3 s='hello' #---->"hello"------>'"hello"' 4 l=[11,22] #---->"[11,22]"?
例1:json和eval的區別
1 import json 2 x = "[null,true,false,1]" 3 # print(eval(x)) #用eval會報錯 4 print(json.loads(x)) # 用json就不會報錯,即eval有局限性例2:不用json時的讀寫文件方式
1 dic = '{"name":"老王","age":18}' 2 f = open("hello","w",encoding="utf-8") 3 f.write(dic) 4 f.close() # 注意,寫完文件后要記得關閉文件 5 f_read = open("hello","r",encoding="utf-8") 6 data = f_read.read() 7 # print(data) 8 print(type(data)) 9 dat = eval(data) 10 print(dat) 11 print(dat["name"])例3:運用json時的讀寫方式
1 import json 2 dic = {'name':'老王','age':19} 3 f = open("new_hello","w",encoding="utf-8") 4 dic_str = json.dumps(dic) #將字典編譯成json格式的字符串,因為json格式的可以進行多種數據傳輸。即序列化的過程 5 f.write(dic_str) #寫入文件,最后存在文件中的形式都是字符串格式的,已經不是字典了。 6 f.close() 7 #json.dump(dic,f) #該句相當于以上兩句的效果,平時用上面的比較好。 8 9 f_read = open("new_hello","r",encoding="utf-8") 10 data = json.loads(f_read.read()) #進行反序列化,將json格式的字符串轉成普通的字符串 11 #data = json.load(f_read) #該句相當于以上一句。可以簡單化,但是平時用上面的比較多。 12 print(data) 13 print(type(data)) #由此可見,反序列化后,又轉成了字典形式。 14 print(data["name"]) #由上一部可以得知,這里可以進行由鍵取值 1 {'name': '老王', 'age': 19} 2 <class 'dict'> 3 老王例4:注意一些細節
1 import json 2 with open("new_hello1","r") as f: #這種讀取方式可以命名,如別名 "f",也要有打開方式 3 data = f.read() 4 data = json.loads(data) 5 print(data["name"])二,pickle模塊
pickle
pickle的問題和所有其他編程語言特有的序列化問題一樣,就是它只能用于python,并且可能不同版本的python彼此都不兼容,因此,只能用pickle保存那些不重要的數據,不能成功地反序列化也沒關系。
例:pickle的序列化與反序列化的過程
1 dic = {"name":"老王","age":18,"gender":"male"} 2 import pickle 3 print(type(dic)) #<class 'dict'> 4 5 j = pickle.dumps(dic) 6 print(type(j)) #<class 'bytes'> 7 8 f = open("序列化_str","wb") #"w"是寫入str; "wb"是寫入bytes.注意這個細節 9 f.write(j) 10 f.close() 11 #j = picklr.dumps(dic) 和f.write(j) 這兩句等價于 pickle.dump(f) 12 ####-----> 以上pickle.dumps() 的過程就相當于 【序列化】 的過程 13 14 ####-----> 以下pickle.loads() 就是反序列化的過程 15 f_read = open("序列化_str","rb") 16 data = pickle.loads(f_read.read()) #相當于 data = pickle.load(f.read) 17 print(data["name"]) 18 print(data["age"]) 1 <class 'dict'> 2 <class 'bytes'> 3 老王 4 18三,shelve模塊
shelve
shelve模塊比pickle模塊簡單,只有一個open函數,返回類似字典的對象,可讀可寫;key必須為字符串,而值可以是python所支持的數據類。
四、XML
XML模塊
xml是實現不同語言或程序之間進行數據交換的協議,跟json差不多,但json使用起來更簡單,不過,古時候,在json還沒有誕生的的年代里,大家只能選擇用xml,至今很多傳統公司如金融行業的很多系統的接口還主要是xml.
xml的格式如下,就是通過<>節點來區別數據結構的:
數據代碼如下
1 <data> 2 <country name="Liechtenstein"> 3 <rank updated="yes">2</rank> 4 <year updated="yes">2010</year> 5 <gdppc>141100</gdppc> 6 <neighbor direction="E" name="Austria" /> 7 <neighbor direction="W" name="Switzerland" /> 8 </country> 9 <country name="Singapore"> 10 <rank updated="yes">5</rank> 11 <year updated="yes">2013</year> 12 <gdppc>59900</gdppc> 13 <neighbor direction="N" name="Malaysia" /> 14 </country> 15 <country name="Panama"> 16 <rank updated="yes">69</rank> 17 <year updated="yes">2013</year> 18 <gdppc>13600</gdppc> 19 <neighbor direction="W" name="Costa Rica" /> 20 <neighbor direction="E" name="Colombia" /> 21 </country> 22 </data> View Code注釋:屬性用來解釋標簽;屬性加在標簽的第一個<>里面;xml都是tag屬性。
xml協議在各個語言里都是支持的,在python中可以用以下模塊操作xml:
1 #####--------------------------> XML 2 import xml.etree.ElementTree as ET # 原名太長,可以起別名,方便下面引用 3 4 tree = ET.parse('xml_lesson1') #?? 5 root = tree.getroot() #?? 6 print(root.tag) #打印根節點 7 8 for i in root: 9 # print(i.tag) #打印data下的第一層節點,即三個country 10 # print(i.attrib) # 打印每個節點的屬性,即country,<>內部緊跟country的部分 11 for j in i: 12 # print(j.tag) #打印data下的第二層節點,即country下的節點, 13 # print(j.attrib) # 打印該層每個節點的屬性 14 print(j.text) #打印 每兩個<>之間包括的值 15 16 ##-------> 遍歷xml文檔 17 18 for child in root: 19 print(child.tag,child.attrib) 20 for n in child: 21 print(n.tag,n.text) 22 23 ##------> 只遍歷year節點 24 for code in root.iter('year'): 25 print(code.tag,code.text) 26 27 28 ###-------------> 修改 29 import xml.etree.ElementTree as ET # 原名太長,可以起別名,方便下面引用 30 31 tree = ET.parse('xml_lesson1') 32 root = tree.getroot() 33 34 ###-------------> 修改 35 for code in root.iter('year'): 36 new_year = int(code.text) + 1 37 code.text = str(new_year) 38 code.set("updated","yes") 39 tree.write('xml_lesson') 40 41 ##--------------> 刪除節點 42 for node in root.findall('country'): 43 rank = int(node.find('rank').text) 44 if rank > 5: 45 root.remove(node) 46 tree.write('output.xml') View Code?
1 import xml.etree.ElementTree as ET # 原名太長,可以起別名,方便下面引用 2 3 tree = ET.parse('xml_lesson1') #解析xml,讀取數據,攝取數據賦給變量tree,tree即成對象, 4 # 且是一個實體對象,可以調用一系類方法 5 #'xml_lesson1 里面存的都是文檔樹 6 #data是根對象,下面的country都是節點對象 7 root = tree.getroot() #獲取tree的根節點 8 print(root.tag) #打印根節點?
?
?
自己創建xml文檔
1 ####--------------------------> 自己創建標簽語言 2 import xml.etree.ElementTree as ET 3 new_xml = ET.Element('namelist') 4 name = ET.SubElement(new_xml,'name',attrib={'enrolled':'yes'}) 5 age = ET.SubElement(name,'age',attrib={'checked':'no'}) 6 sex = ET.SubElement(name, "sex") 7 sex.text = '33' 8 name2 = ET.SubElement(new_xml, 'name', attrib={"enrolled": "no"}) 9 age = ET.SubElement(name2, 'age') 10 age.text = '19' 11 12 et = ET.ElementTree('newx_xml') #生成文檔對象 13 et.write('test.xml',encoding='utf-8',xml_declaration=True) 14 #ET.dump(new_xml) # 打印生成的格式 View Code?
轉載于:https://www.cnblogs.com/jianguo221/p/9006879.html
總結
以上是生活随笔為你收集整理的python模块--json \ pickle \ shelve \ XML模块的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 判断url是否包含协议并添加协议(判断u
- 下一篇: (转)Linux:使用libgen.h: