Python2.7使用Pandas连接数据库
今天遇到一个需求,需要将Excel中的一些数据导入到mysql中,由于之前接触到了Python的Pandas,所以这个时候便想到了Python,但是连接数据库的时候出现了问题,所以便写一个文章记录下。
解决办法:
- 下载Mysql_Python的一个exe文件
- 注意
tosql
的这个方法使用的类。pd.io.sql.to_sql - 注意添加
index=False
防止出现出入的时候多了一个index
今天遇到一个需求,需要将Excel中的一些数据导入到mysql中,由于之前接触到了Python的Pandas,所以这个时候便想到了Python,但是连接数据库的时候出现了问题,所以便写一个文章记录下。
tosql
的这个方法使用的类。pd.io.sql.to_sqlindex=False
防止出现出入的时候多了一个indextransform是Pandas里面Groupby的一个方法,主要作用是对groupby之后的dataframe进行处理,接收的参数一个是一个Series
1 | In [18]: df = pd.DataFrame({'B': ['one', 'one', 'two', 'three','two', 'two', 'one', 'three'], |
那么需要对其groupby之后求C的平均值怎么办
1 | n [23]: df.groupby('B').transform(lambda x : x.mean()) |
在pandas读里面包含了几个函数分别用来读取csv或者excel文件:read_csv
方法用来读取一个csv文件一般常用参数是path
:用于指定一个文件及其目录sep
表示读取该csv文件的时候是以什么制表符读取的,一般是’,’usecols
表示需要读取csv的多少列,这是一个绝对索引,0代表的是第一列,参数为一个list
pandas经常使用的结构一般是dataframe和series,DataFrame类似于二维数组,或者sql里面的一张表,若在创建的时候为指定索引的话则默认从0开始一次递增为索引:
1 | import pandas as pd |