pandas python csv_python:pandas合并csv文件的方法(图书数据集成)
數(shù)據(jù)集成:將不同表的數(shù)據(jù)通過(guò)主鍵進(jìn)行連接起來(lái),方便對(duì)數(shù)據(jù)進(jìn)行整體的分析。
兩張表:ReaderInformation.csv,ReaderRentRecode.csv
ReaderInformation.csv:
ReaderRentRecode.csv:
pandas讀取csv文件,并進(jìn)行csv文件合并處理:
# -*- coding:utf-8 -*-
import csv as csv
import numpy as np
# -------------
# csv讀取表格數(shù)據(jù)
# -------------
'''
csv_file_object = csv.reader(codecs.open('ReaderRentRecode.csv', 'rb'))
header = csv_file_object.next()
print header
print type(header)
print header[1]
data = []
for row in csv_file_object:
data.append(row)
data = np.array(data)
print data[0::, 0]
'''
# -------------
# pandas讀取表格數(shù)據(jù)
# -------------
import pandas as pd
df = pd.read_csv('ReaderRentRecode.csv') # 讀者借閱信息表
'''
print df.head()
print '----------------'
print df[['讀者證號(hào)', '讀者姓名', '書(shū)名', '中圖法分類號(hào)']] # 選取其中的四列
print '------------------------------------------------------------------'
'''
dd = pd.read_csv('ReaderInformation.csv')
'''
print dd.head()
print '----------------'
print dd[['讀者證號(hào)', '讀者性別', '讀者單位', '讀者類別']]
print '------------------------------------------------------------------'
'''
data = pd.merge(df, dd, on=['讀者證號(hào)', '讀者姓名'], how='left') # pandas csv表左連接
data = data[['讀者證號(hào)', '讀者姓名', '讀者性別', '書(shū)名', '中圖法分類號(hào)', '讀者單位', '讀者類別']]
print data
print '------------------------------------------------------------------'
# -------------
# pandas寫入表格數(shù)據(jù)
# -------------
data.to_csv(r'data.csv', encoding='gbk')
合并后的csv文件:data.csv
通過(guò)使用pandas的函數(shù)merge來(lái)進(jìn)行兩個(gè)表的左連接,最后得到相應(yīng)的data.csv文件。
以上這篇python:pandas合并csv文件的方法(圖書(shū)數(shù)據(jù)集成)就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持我們。
本文標(biāo)題: python:pandas合并csv文件的方法(圖書(shū)數(shù)據(jù)集成)
本文地址: http://www.cppcns.com/jiaoben/python/225035.html
總結(jié)
以上是生活随笔為你收集整理的pandas python csv_python:pandas合并csv文件的方法(图书数据集成)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: python实现三叉树_使用python
- 下一篇: 启动ipython出错_python-在