pandas数据预处理之dataframe的groupby操作方法-创新互联

在数据预处理过程中可能会遇到这样的问题,如下图:数据中某一个key有多组数据,如何分别对每个key进行相同的运算?

创新互联是一家专业的成都网站建设公司,我们专注成都做网站、网站制作、网络营销、企业网站建设,买链接一元广告为企业客户提供一站式建站解决方案,能带给客户新的互联网理念。从网站结构的规划UI设计到用户体验提高,创新互联力求做到尽善尽美。

pandas数据预处理之dataframe的groupby操作方法

dataframe里面给出了一个group by的一个操作,对于”group by”操作,我们通常是指以下一个或多个操作步骤:

l (Splitting)按照一些规则将数据分为不同的组;

l (Applying)对于每组数据分别执行一个函数;

l (Combining)将结果组合到一个数据结构中;

使用dataframe实现groupby的用法:

# -*- coding: UTF-8 -*-
import pandas as pd
df = pd.DataFrame([{'col1':'a', 'col2':1, 'col3':'aa'}, {'col1':'b', 'col2':2, 'col3':'bb'}, {'col1':'c', 'col2':3, 'col3':'cc'}, {'col1':'a', 'col2':44, 'col3':'aa'}])
print df
# 按col1分组并按col2求和
print df.groupby(by='col1').agg({'col2':sum}).reset_index()
# 按col1分组并按col2求最值
print df.groupby(by='col1').agg({'col2':['max', 'min']}).reset_index()
# 按col1 ,col3分组并按col2求和
print df.groupby(by=['col1', 'col3']).agg({'col2':sum}).reset_index()

名称栏目:pandas数据预处理之dataframe的groupby操作方法-创新互联
当前路径:http://bzwzjz.com/article/iohci.html

其他资讯

Copyright © 2007-2020 广东宝晨空调科技有限公司 All Rights Reserved 粤ICP备2022107769号
友情链接: 成都网站建设 温江网站设计 成都网站建设 成都网站制作 手机网站制作 成都网站建设 成都定制网站建设 网站制作 成都网站制作 响应式网站设计 成都网站设计 响应式网站设计 定制网站建设 app网站建设 成都商城网站建设 定制网站建设多少钱 成都网站建设公司 成都网站设计 网站设计制作 成都网站建设 成都网站制作 重庆外贸网站建设