程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
您现在的位置: 程式師世界 >> 編程語言 >  >> 更多編程語言 >> Python

Pandas數據的導入與導出

編輯:Python
Excel格式數據導入
文件格式讀取方法Excel文件read_excel()CSV文件read_csv()txt文件read_table()Json文件read_json()MySQL文件read_sql_table()
  • 對於上述這些方法,只需要一行代碼就可以實現不同格式數據的導入,唯一區別在於他們擁有不同的參數
read_excel()
  • 不添加任何參數,會默認將Excel表格種的第一行識別為標題行

    df = pd.read_excel("表格.xlsx")
    df
    學號 姓名
    0 1 張三
    1 2 李四
    2 3 王五
    
  • sheet_name參數,在一個Excel表格中,可能會有一個或多個Sheet,設置了sheet_name="Sheet1"表示我們想要讀取Sheet1這個表格

    df = pd.read_excel('表格.xlsx',sheet_name='Sheet1')
    df
    學號 姓名
    0 1 張三
    1 2 李四
    2 3 王五
    
  • index_col參數,指定將Excel表格的第幾列當作行索引。設置為0時,表示將Excel表格種的學號列設置為了行索引,原始索引被替換

    df = pd.read_excel("表格.xlsx",index_col=0)
    df
    學號 姓名
    1 張三
    2 李四
    3 王五
    
  • header參數,將指定表格的第幾行當作標題行

    • 利用read_excel()讀取excel表格,總是默認將第一行數據識別為標題行,由於表格Sheet1自帶標題行,我們可以不用做任何設置。但是Sheet2表格沒有標題行,我們需要設置header=None,告訴Python程序該表格沒有標題行
    df = pd.read_excel('表格.xlsx',sheet_name='Sheet1')
    df
    學號 姓名
    0 1 張三
    1 2 李四
    2 3 王五
    df = pd.read_excel('表格.xlsx',sheet_name='Sheet2',header=None)
    df
    0 1
    0 1 張三
    1 2 李四
    2 3 王五
    
  • usecols參數,指定導入Excel表格中的哪幾列

    df = pd.read_excel("表格.xlsx",usecols=["姓名","語文"])
    df
    姓名 語文
    0 張三 99
    1 李四 88
    2 王五 77
    
Excel格式數據的導出
  • 在Pandas模塊中,利用to_excel()方法可以將數據導出為Excel文件,利用to_csv()方法可以將數據導出為CSV文件

    df = pd.read_excel("表格.xlsx")
    df
    學號 姓名 語文 數學
    0 1 張三 88 99
    1 2 李四 77 88
    2 3 王五 66 90
    df.to_excel(
    excel_writer="導出.xlsx",
    index=False,
    sheet_name="成績表",
    columns=["姓名","語文","數學"],
    na_rep=0,
    encoding="gbk"
    )
    
    • excel_writer參數用於指明文件的保存路徑
    • index參數為False表示隱藏序列號,否則會自動生成一個序列號
    • sheet_name用於設置表格的名稱
    • columns參數可以指定導出哪些列
    • **na_rep**參數可以將表格中的缺失值用指定值填充
    • encoding參數用於設置文件編碼,一般根據自己的系統環境來設置

  1. 上一篇文章:
  2. 下一篇文章:
Copyright © 程式師世界 All Rights Reserved