txt如何转成tsv文件
生活随笔
收集整理的這篇文章主要介紹了
txt如何转成tsv文件
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
首先區(qū)別這三個:
- csv文件,每一行中不同的數(shù)據(jù)用逗號分開, 不包含空格。
- tsv文件,分隔符號是‘\t’ 而不是csv中的逗號。
我是用的笨方法,先轉(zhuǎn)成csv文件,再轉(zhuǎn)成tsv。有其他更好用的方法可以交流
// txt to csv import csv csvFile = open("dev2.csv",'w',newline='',encoding='utf-8') // 我的數(shù)據(jù)是中文數(shù)據(jù)集,所以用utf-8 writer = csv.writer(csvFile) csvRow = []f = open("dev.txt",'r',encoding='utf8') for line in f:csvRow = line.split()writer.writerow(csvRow) f.close() csvFile.close()# 由于在txt中也包含了空格,所以得到的csv文件是根據(jù)空格劃分的。 # 我的數(shù)據(jù)集的格式分成了兩部分: (一個中文短句:string, 一個標(biāo)簽:int),但是短句中包括了空格,所以這樣變換會分成三個或者更多個部分。# 所以改進(jìn)代碼,將list中的前[:-1]個合并成一個部分。 # 改進(jìn)后代碼如下: import csv csvFile = open("dev2.csv",'w',newline='',encoding='utf-8') writer = csv.writer(csvFile) csvRow = []f = open("dev.txt",'r',encoding='utf8') for line in f:csvRow = line.split()temp_label = csvRow.pop() # 得到最后一個元素csvRow = ["".join(csvRow),temp_label] # join合并元素print(csvRow)writer.writerow(csvRow) f.close() csvFile.close()# # 轉(zhuǎn)成tsv文件 with open('dev2.csv',encoding='utf-8') as f:data = f.read().replace(',', '\t') with open('dev.tsv','w',encoding='utf-8') as f:f.write(data) f.close()?
總結(jié)
以上是生活随笔為你收集整理的txt如何转成tsv文件的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: totoro框架 入门
- 下一篇: 各种深度聚类方法摘要