Python 文件操作中的读写模式:open(path, ‘-模式-‘,encoding=‘UTF-8‘)+python读写文件txt +文本数据预处理
生活随笔
收集整理的這篇文章主要介紹了
Python 文件操作中的读写模式:open(path, ‘-模式-‘,encoding=‘UTF-8‘)+python读写文件txt +文本数据预处理
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
python讀寫txt文件
文件的打開的兩種方式f = open("data.txt","r") #設置文件對象 f.close() #關閉文件#為了方便,避免忘記close掉這個文件對象,可以用下面這種方式替代 with open('data.txt',"r") as f: #設置文件對象str = f.read() #可以是隨便對文件的操作一、讀文件1.簡單的將文件讀取到字符串中f = open("data.txt","r") #設置文件對象 str = f.read() #將txt文件的所有內容讀入到字符串str中 f.close() #將文件關閉2.按行讀取整個文件#第一種方法 f = open("data.txt","r") #設置文件對象 line = f.readline() line = line[:-1] while line: #直到讀取完文件line = f.readline() #讀取一行文件,包括換行符line = line[:-1] #去掉換行符,也可以不去 f.close() #關閉文件 #第二種方法 data = [] for line in open("data.txt","r"): #設置文件對象并讀取每一行文件data.append(line) #將每一行文件加入到list中 #第三種方法 f = open("data.txt","r") #設置文件對象 data = f.readlines() #直接將文件中按行讀到list里,效果與方法2一樣 f.close() #關閉文件3.將文件讀入數組中import numpy as np data = np.loadtxt("data.txt") #將文件中數據加載到data數組里二、寫文件1.簡單的將字符串寫入txt中with open('data.txt','w') as f: #設置文件對象f.write(str) #將字符串寫入文件中2.列表寫入文件單層列表data = ['a','b','c'] #單層列表寫入文件 with open("data.txt","w") as f:f.writelines(data)雙層列表#雙層列表寫入文件 #第一種方法,每一項用空格隔開,一個列表是一行寫入文件 data =[ ['a','b','c'],['a','b','c'],['a','b','c']] with open("data.txt","w") as f: #設置文件對象for i in data: #對于雙層列表中的數據i = str(i).strip('[').strip(']').replace(',','').replace('\'','')+'\n' #將其中每一個列表規范化成字符串f.write(i) #寫入文件#第二種方法,直接將每一項都寫入文件 data =[ ['a','b','c'],['a','b','c'],['a','b','c']] with open("data.txt","w") as f: #設置文件對象for i in data: #對于雙層列表中的數據f.writelines(i) #寫入文件3.數組寫入文件中#將數組寫入文件 import numpy as np #第一種方法 np.savetxt("data.txt",data) #將數組中數據寫入到data.txt文件 #第二種方法 np.save("data.txt",data) #將數組中數據寫入到data.txt文件Python 文件操作中的讀寫模式:open(path, ‘-模式-’,encoding=‘UTF-8’)
open(path, ‘-模式-‘,encoding=’UTF-8’) 即open(路徑+文件名, 讀寫模式, 編碼)在python對文件進行讀寫操作的時候,常常涉及到“讀寫模式”,整理了一下常見的幾種模式,如下:讀寫模式:r :只讀 r+ : 讀寫 w : 新建(會對原有文件進行覆蓋) a : 追加 b : 二進制文件常用的模式有:“a” 以“追加”模式打開, (從 EOF 開始, 必要時創建新文件) “a+” 以”讀寫”模式打開 “ab” 以”二進制 追加”模式打開 “ab+” 以”二進制 讀寫”模式打開“w” 以”寫”的方式打開 “w+” 以“讀寫”模式打開 “wb” 以“二進制 寫”模式打開 “wb+” 以“二進制 讀寫”模式打開“r+” 以”讀寫”模式打開 “rb” 以”二進制 讀”模式打開 “rb+” 以”二進制 讀寫”模式打開rU 或 Ua 以”讀”方式打開, 同時提供通用換行符支持 (PEP 278)需注意:1、使用“w”模式。文件若存在,首先要清空,然后重新創建 2、使用“a”模式。把所有要寫入文件的數據都追加到文件的末尾,即使你使用了seek()指向文件的其他地方,如果文件不存在,將自動被創建。3、f.read([size]) :size未指定則返回整個文件,如果文件大小>2倍內存則有問題。f.read()讀到文件尾時返回”“(空字串) 4、file.readline() 返回一行 5、file.readline([size]) 返回包含size行的列表,size 未指定則返回全部行 6、”for line in f: print line” #通過迭代器訪問 7、f.write(“hello\n”) #如果要寫入字符串以外的數據,先將他轉換為字符串. 8、f.tell() 返回一個整數,表示當前文件指針的位置(就是到文件頭的比特數). 9、f.seek(偏移量,[起始位置]) : 用來移動文件指針 偏移量 : 單位“比特”,可正可負 起始位置 : 0 -文件頭, 默認值; 1 -當前位置; 2 -文件尾 10、f.close() 關閉文件基本的中文文本數據預處理
利用內置方法及re模塊保留漢字rere.findall(u'[\u4e00-\u9fff]+', a_str) 保留漢字、換行符rere.findall(u'[\u4e00-\u9fff\n]+', a_str) list to stringa_str = ' '.join(a_list) string to lista_list = a_str.split(' ') 刪除\替換特定符號a_str_cln = a_str.replace('丨','')rea_str_cln = re.sub('|', ' ', a_str) 確定b中a位置并返回值rere.search(a, b).span()總結
以上是生活随笔為你收集整理的Python 文件操作中的读写模式:open(path, ‘-模式-‘,encoding=‘UTF-8‘)+python读写文件txt +文本数据预处理的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 论文浅尝 | Dynamic Weigh
- 下一篇: 胡伟 | 面向多实体人机协作消解的对比表