當前位置：首頁 > 编程语言 > python >内容正文

python

python词频统计结果写入csv_Python词频对比并导入CSV文件

發布時間：2023/12/10 python 38 豆豆

生活随笔收集整理的這篇文章主要介紹了 python词频统计结果写入csv_Python词频对比并导入CSV文件小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

需要用到的停用詞庫我上傳到我的資源了，大家也可以自己去網上找！

本來是想把兩個詞頻統計放入一個CSV文件中，但是無奈向已經存在的CSV文件中追加寫入數據只能在已經存在的數據下面追加，也就是在同一列追加，不能另起一列添加數據，哪位兄弟懟出來了，歡迎回復或私信！

import jieba

import pandas as pd

import csv

import codecs

# num=jieba.lcut("中國是一個偉大的國家") # jieba庫的測試

# print(num)

# 計算機專業的-1.txt

txt1=open("計算機專業.txt").read()

# 導入停用詞庫，過濾掉那些沒用的詞語，甚至都不是詞語，比如標點符號，停用詞在我的資源中有保存

stopwords=[line.strip() for line in open("停用詞.txt").readlines()]

words1=jieba.lcut(txt1)

# print(words1)

counts1={}

for word1 in words1:

if len(word1)==1:

continue

else:

counts1[word1]=counts1.get(word1,0)+1

items1=list(counts1.items())

items1.sort(key=lambda x:x[1],reverse=True) # 根據詞頻進行降序排序

# print(items1)

file_csv=open("計算機專業詞頻.csv",'w+',newline='') #添加newline=''，可以刪除每行之間的空行

writer=csv.writer(file_csv)

writer.writerow(["詞匯","詞頻"])

for data in items1:

writer.writerow(data)

file_csv.close()

# 法學專業的-2.txt

txt2=open("法學專業.txt").read()

words2=jieba.lcut(txt2)

counts2={}

for word2 in words2:

if len(word2)==1:

continue

else:

counts2[word2]=counts2.get(word2,0)+1

items2=list(counts2.items())

items2.sort(key=lambda x:x[1],reverse=True)

#print(items2)

# dataframe=pd.DataFrame({'items1_name':items1,'items2_name':items2})

# dataframe.to_csv("test.csv")

# file_csv=open('test.csv','a')

file_csv=open("法學專業詞頻.csv",'w+',newline='')

writer=csv.writer(file_csv)

writer.writerow(["詞匯","詞頻"])

for data in items2:

writer.writerow(data)

file_csv.close()

總結

以上是生活随笔為你收集整理的python词频统计结果写入csv_Python词频对比并导入CSV文件的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： python 获取字符串中的字典_pyt
下一篇： cad转dwf格式怎么转换？

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

python

python词频统计结果写入csv_Python词频对比并导入CSV文件

總結