您好,登錄后才能下訂單哦!
數據集成:將不同表的數據通過主鍵進行連接起來,方便對數據進行整體的分析。
兩張表:ReaderInformation.csv,ReaderRentRecode.csv
ReaderInformation.csv:
ReaderRentRecode.csv:
pandas讀取csv文件,并進行csv文件合并處理:
# -*- coding:utf-8 -*- import csv as csv import numpy as np # ------------- # csv讀取表格數據 # ------------- ''' csv_file_object = csv.reader(codecs.open('ReaderRentRecode.csv', 'rb')) header = csv_file_object.next() print header print type(header) print header[1] data = [] for row in csv_file_object: data.append(row) data = np.array(data) print data[0::, 0] ''' # ------------- # pandas讀取表格數據 # ------------- import pandas as pd df = pd.read_csv('ReaderRentRecode.csv') # 讀者借閱信息表 ''' print df.head() print '----------------' print df[['讀者證號', '讀者姓名', '書名', '中圖法分類號']] # 選取其中的四列 print '------------------------------------------------------------------' print ''' dd = pd.read_csv('ReaderInformation.csv') ''' print dd.head() print '----------------' print dd[['讀者證號', '讀者性別', '讀者單位', '讀者類別']] print '------------------------------------------------------------------' print ''' data = pd.merge(df, dd, on=['讀者證號', '讀者姓名'], how='left') # pandas csv表左連接 data = data[['讀者證號', '讀者姓名', '讀者性別', '書名', '中圖法分類號', '讀者單位', '讀者類別']] print data print '------------------------------------------------------------------' print # ------------- # pandas寫入表格數據 # ------------- data.to_csv(r'data.csv', encoding='gbk')
合并后的csv文件:data.csv
通過使用pandas的函數merge來進行兩個表的左連接,最后得到相應的data.csv文件。
以上這篇python:pandas合并csv文件的方法(圖書數據集成)就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持億速云。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。