import pandas as pd In [15]: df_2=pd.DataFrame(data=['a','b','c'])
In [16]: df_2 Out[16]: 0 0 a 1 b 2 c 用上述方式创建的时候是不需要指定index的,但是用标量创建的时候是需要指定index的: pd.DataFrame({'a':'A','b':'B'}) ValueError: If using all scalar values, you must pass an index
基本实例:
读取北京2017年07月01日的空气质量情况:
1 2 3 4 5 6 7 8 9 10 11 12 13
df_20170101 =pd.read_csv(path,sep=',',decimal=',',usecols=[0,1,2,3,4,5,6,7,8,9]) #path是我的文件地址 date hour type dongfour 天坛 官园 万寿西宫 奥体中心 农展馆 万柳 02017010122 PM2.5469357476416453398468 12017010122 PM2.5_24h NaN NaN NaN NaN NaN NaN NaN 22017010122 PM10594449548474467469518 32017010122 PM10_24h NaN NaN NaN NaN NaN NaN NaN 42017010122 AQI 494405484444469432479 52017010123 PM2.5470351500403417392459 62017010123 PM2.5_24h NaN NaN NaN NaN NaN NaN NaN 72017010123 PM10558467583469443480529 82017010123 PM10_24h NaN NaN NaN NaN NaN NaN NaN 92017010123 AQI 480401500435445428473
假设需要获取天坛的22点到23点情况,那么只需要使用df_20170101[‘天坛’]:
1 2 3 4 5 6 7 8 9 10
0 357 1 NaN 2 449 3 NaN 4 405 5 351 6 NaN 7 467 8 NaN 9 401