當前位置：首頁 > 编程语言 > python >内容正文

python

Python词频对比并导入CSV文件

發布時間：2025/3/20 python 21 豆豆

生活随笔收集整理的這篇文章主要介紹了 Python词频对比并导入CSV文件小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

需要用到的停用詞庫我上傳到我的資源了，大家也可以自己去網上找！

本來是想把兩個詞頻統計放入一個CSV文件中，但是無奈向已經存在的CSV文件中追加寫入數據只能在已經存在的數據下面追加，也就是在同一列追加，不能另起一列添加數據，哪位兄弟懟出來了，歡迎回復或私信！

import jieba import pandas as pd import csv import codecs # num=jieba.lcut("中國是一個偉大的國家") # jieba庫的測試 # print(num) # 計算機專業的-1.txt txt1=open("計算機專業.txt").read() # 導入停用詞庫，過濾掉那些沒用的詞語，甚至都不是詞語，比如標點符號，停用詞在我的資源中有保存 stopwords=[line.strip() for line in open("停用詞.txt").readlines()] words1=jieba.lcut(txt1) # print(words1) counts1={} for word1 in words1:if len(word1)==1:continueelse:counts1[word1]=counts1.get(word1,0)+1 items1=list(counts1.items()) items1.sort(key=lambda x:x[1],reverse=True) # 根據詞頻進行降序排序 # print(items1) file_csv=open("計算機專業詞頻.csv",'w+',newline='') #添加newline=''，可以刪除每行之間的空行 writer=csv.writer(file_csv) writer.writerow(["詞匯","詞頻"]) for data in items1:writer.writerow(data) file_csv.close() # 法學專業的-2.txt txt2=open("法學專業.txt").read() words2=jieba.lcut(txt2) counts2={} for word2 in words2:if len(word2)==1:continueelse:counts2[word2]=counts2.get(word2,0)+1 items2=list(counts2.items()) items2.sort(key=lambda x:x[1],reverse=True) #print(items2) # dataframe=pd.DataFrame({'items1_name':items1,'items2_name':items2}) # dataframe.to_csv("test.csv") # file_csv=open('test.csv','a') file_csv=open("法學專業詞頻.csv",'w+',newline='') writer=csv.writer(file_csv) writer.writerow(["詞匯","詞頻"]) for data in items2:writer.writerow(data) file_csv.close()

總結

以上是生活随笔為你收集整理的Python词频对比并导入CSV文件的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： Python程序练习题6.2
下一篇： Pycharm解决中文字体大小不一致问题

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

python

Python词频对比并导入CSV文件

總結