程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
您现在的位置: 程式師世界 >> 編程語言 >  >> 更多編程語言 >> Python

pandas各種折騰

編輯:Python

想不到好的題目,就湊合吧,反正是pandas各種折騰數據

data = pd.read_csv('new_jn_data.csv')
data['date'] = data['ctime'].str.split(' ',1).apply(lambda x:x[0])
data['date'] = data['date'].str.replace('/','-')
data['date'] = pd.to_datetime(data['date'])
data['data'] = data['data'].str.replace(',','').astype(float)
data['start_time']=data['ctime'].str.split(' ',1).apply(lambda x:x[1].split(':',1)[0]).astype(int)
#為了方便排序序列,先按cell從小到大,然後按照日期排,都是遞增的順序
data = data[['date','start_time','cell','enodeb','data','sub_net','ne']].sort_values(by='date').sort_values(by='cell')
#索引重排列
data = data.reset_index(drop=True)
#保存數據
# data.to_csv('new_jn_data_with_nan.csv',index=0)
#去掉含有nan的行。
data2 = data.dropna(axis=0,how='any')
#保存數據,不過這個索引還是data的索引,如果想重新建立索引可以:data2 = data.dropna(axis=0,how='any').reset_index(drop=True)
# data2.to_csv('new_jn_data_exclude_nan.csv',index=0)

 


  1. 上一篇文章:
  2. 下一篇文章:
Copyright © 程式師世界 All Rights Reserved