您好,登錄后才能下訂單哦!
外部數據導入
導入excel文件
pandas導入excel用read_excel()方法:
import pandas as pd excel_file1 = pd.read_excel('data/測試.xlsx',encoding='utf-8')
姓名 年齡 工作 工資
0 張三 25 學生 200
1 李四 24 工人 3000
2 王偉 28 NaN 5000
3 王二毛 22 自由職業 6000
第一個參數是路徑,既可以使用絕對路徑又可以使用相對路徑,如果文件名含有漢字,注意指定設置一下屬性encoding = 'utf-8',另設置sheet_name指定具體的Sheet名字,也可傳入sheet的順序,從0開始。
excel_file1 = pd.read_excel('data/test.xlsx',sheet_name = 0)
指定索引
列索引默認從0開始,通過index_col設置,header設置行索引。
excel_file1 = pd.read_excel('data/測試.xlsx',encoding='utf-8',index_col=0)
年齡 工作 年資
姓名
張三 25 學生 200
李四 24 工人 3000
王偉 28 NaN 5000
王二毛 22 自由職業 6000
excel_file1 = pd.read_excel('data/測試.xlsx',encoding='utf-8',header=1)
張三 25 學生 200
0 李四 24 工人 3000
1 王偉 28 NaN 5000
2 王二毛 22 自由職業 6000
指定索引列
有時本地文件列數太多,可以設置usercols指定導入的列,也可以列表形式傳入多個值,表示傳入哪些列。
excel_file1 = pd.read_excel('data/測試.xlsx',encoding='utf-8',usecols=[0,2])
姓名 工作
0 張三 學生
1 李四 工人
2 王偉 NaN
3 王二毛 自由職業
常用方法
導入CSV文件
pandas導入csv文件用read_csv()方法;
import pandas as pd csv_file1 = pd.read_csv('.\\data\\train-pivot.csv',index_col=0,header=0,nrows = 2)
通過 sep 設置分割符, encoding 指定編碼格式。導入csv文件要指定為gbk,不然會報錯,如果一個大文件你只需看前面幾行,通過 nrows 設置。
import pandas as pd csv_file1 = pd.read_csv('data/train-pivot.csv',encoding='gbk',nrows=2) print(csv_file1)
用戶ID 客戶分類 區域 是否省會 7月銷量 8月銷量
0 59224 A類 一線城市 是 6 20 0
1 55295 B類 三線城市 否 37 27 35
可以設置 usercols 指定導入的列。
用戶ID 區域
0 59224 一線城市
1 55295 三線城市
2 46035 二線城市
3 2459 一線城市
4 22179 三線城市
導入sql
pandas中有 read_sql() 方法:
import pandas as pd import pymysql # 創建連接 conn = pymysql.connect(host = 'localhost',user = 'python', password = 'passwd',db = 'test', charset = 'utf-8' ) ''' user:用戶名 password:密碼 host:數據庫地址/本機用localhost db:數據庫名 charset:編碼,一般為utf-8 ''' sql = "SELECT * FROM user" # 寫要執行的sql語句 pd.read_sql(sql,conn)
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持億速云。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。