千家信息网

Python中怎么实现组内排名

发表于:2025-02-01 作者:千家信息网编辑
千家信息网最后更新 2025年02月01日,今天就跟大家聊聊有关Python中怎么实现组内排名,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。1. 求组内的最大/最小/平均值import
千家信息网最后更新 2025年02月01日Python中怎么实现组内排名

今天就跟大家聊聊有关Python中怎么实现组内排名,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。

1. 求组内的最大/最小/平均值

import pandas as pddf = pd.read_excel(r"D:\Jupyter\data\组内排序.xlsx")df

# 赋值sale = df.groupby(["品类"])["销售额"]

# 求出不同品类的最大销售额sale_max = sale.max()sale_max

# 求出不同品类的最小销售额sale_min = sale.min()sale_min

# 求出不同品类的平均销售额sale_mean = sale.mean()sale_mean

2. 新增一个字段实现累计求和

import pandas as pddf1 = pd.read_excel(r"D:\Jupyter\data\组内排序.xlsx")df1

# 添加一个新字段,对销售额进行累计求和df1["累计销售额"] = df1["销售额"].cumsum()df1

3. 新增一个字段并实现组内累计求和

import pandas as pddf2 = pd.read_excel(r"D:\Jupyter\data\组内排序.xlsx")df2

df2["依据品类累计求和"] = df2.groupby(["品类"])["销售额"].cumsum()df2

4. 新增一列对销售额进行排名,单不改变其顺序(不排序)

import pandas as pddf3 = pd.read_excel(r"D:\Jupyter\data\组内排序.xlsx",sheet_name = 1)df3

df3["按销售额排升序"] = df3["销售额"].rank()df3

其它各种排名规则

df3["销售额_mean"] = df["销售额"].rank(method = "average")df3

df3["销售额_max"] = df["销售额"].rank(method = "max")df3

df3["销售额_min"] = df3["销售额"].rank(method = "min")df3

df3["销售额_first"] = df3["销售额"].rank(method = "first")df3

5. 依据品类对销售额进行实现组内排名

import pandas as pddf4 = pd.read_excel(r"D:\Jupyter\data\组内排序.xlsx",sheet_name = 1)df4

# 根据不同品类对销售额进行排名df4["品类_排名"] = df4.groupby(["品类"])["销售额"].rank()df4

注:

1. method : {'average', 'min', 'max', 'first', 'dense'}, default 'average' 主要用来当排序时存在相同值参数设置;

2. na_option : {'keep', 'top', 'bottom'}, default 'keep' 当排序数据中存在空值时,默认值设置为keep

看完上述内容,你们对Python中怎么实现组内排名有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注行业资讯频道,感谢大家的支持。

0