Python怎么解决新客人数、回购人数和总人数问题
发表于:2025-02-06 作者:千家信息网编辑
千家信息网最后更新 2025年02月06日,今天小编给大家分享一下Python怎么解决新客人数、回购人数和总人数问题的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有
千家信息网最后更新 2025年02月06日Python怎么解决新客人数、回购人数和总人数问题
今天小编给大家分享一下Python怎么解决新客人数、回购人数和总人数问题的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。
读取流水
saleflow= pd.read_csv('流水.csv',index_col=0)
筛选出合生元益生菌的流水
#处理字段 yyp_saleflow=saleflow[saleflow['cls']=='营养品'] yyp_saleflow=saleflow[saleflow['custype']=='vip'] ysj_saleflow = yyp_saleflow[yyp_saleflow['cls2']=='益生菌'] ysj_saleflow['pinpai'] =ysj_saleflow.apply(pinpai_class_new,axis=1) # print('益生菌流水数', ysj_saleflow.shape[0]) ysj_saleflow= ysj_saleflow[ysj_saleflow['pinpai']=='合生元'] # print('合生元益生菌流水数', ysj_saleflow.shape[0])
求每个会员第一次购买合生元益生菌的时间,从而筛选出某个季度的新客
# 会员第一次购买益生菌的时间
ysj_first =ysj_saleflow.groupby(['shopid_cardid']).oper_date.min().reset_index().rename(columns={'oper_date':'oper_date_first'})
ysj_first['oper_date_first']=pd.to_datetime(ysj_first['oper_date_first'])
# 各个季度的新客
ysj_new_Q1= ysj_first[(ysj_first['oper_date_first'] < pd.to_datetime('2020-04-01 00:00:00'))&(ysj_first['oper_date_first'] > pd.to_datetime('2020-01-01 00:00:00'))]
ysj_new_Q3= ysj_first[(ysj_first['oper_date_first'] < pd.to_datetime('2019-10-01 00:00:00'))&(ysj_first['oper_date_first'] > pd.to_datetime('2019-07-01 00:00:00'))]
ysj_new_Q4 = ysj_first[(ysj_first['oper_date_first'] < pd.to_datetime('2020-01-01 00:00:00'))&(ysj_first['oper_date_first'] > pd.to_datetime('2019-10-01 00:00:00'))]
比如 Q3的新客有
这样我们就有了各个季度的新客ID
再计算老客, 老客定义为第三季度和第二季度都买过合生元的会员,所有只用用第三季度的流水会员id和 第二季度的会员id 进行 inner join
ysj_saleflow2019=ysj_saleflow.query('year==2019')ysj_saleflow2019Q2_id=ysj_saleflow2019[ysj_saleflow2019.month.isin([4,5,6])][['shopid_cardid']]ysj_saleflow2019Q3_id=ysj_saleflow2019[ysj_saleflow2019.month.isin([7,8,9])][['shopid_cardid']]ysj_saleflow2019Q4_id=ysj_saleflow2019[ysj_saleflow2019.month.isin([10,11,12])][['shopid_cardid']]ysj_Q3_old_id= (ysj_saleflow2019Q2_id.merge(ysj_saleflow2019Q3_id)).drop_duplicates()
再计算 Q3 的新客有多少在Q4又购买了合生元益生菌, 即回购
思路是 拿Q4的会员id 与 Q3新客id inner join
#Q3 新客 在 年底回购人数
Q3new_to_Q4 =(ysj_saleflow2019Q4_id.merge(ysj_new_Q3)).shopid_cardid.nunique()
最后计算人数,并创建dataframe
# 新客人数Q3_new=ysj_new_Q3.shopid_cardid.nunique()# Q3 益生菌总人数Q3_YSJ_total= ysj_saleflow2019Q3_id.shopid_cardid.nunique()# 老客人数ysj_Q3_old_id= (ysj_saleflow2019Q2_id.merge(ysj_saleflow2019Q3_id)).drop_duplicates()Q3_old=ysj_Q3_old_id.shopid_cardid.nunique()#.reset_index() # Q3 老客人数#Q3 新客 在 年底回购人数Q3new_to_Q4 =(ysj_saleflow2019Q4_id.merge(ysj_new_Q3)).shopid_cardid.nunique()## 创建dataframedata = {'Q3益生菌总会员人数': [Q3_YSJ_total], 'Q3新客人数': [Q3_new], 'Q3老客人数': [Q3_old], 'Q3新客在年底回购的人数':[Q3new_to_Q4] , 'shopId':[shopId] }frame = pd.DataFrame(data, columns = ['Q3益生菌总人数', 'Q3新客人数', 'Q3老客人数', 'Q3新客在年底回购的人数','shopId'])
这里只计算了一个连锁,如果 计算多个连锁, 可以对 连锁列表进行循环
依次 df.append(). 具体做法是 在循环之前建立一个空的dataframe
df_empty =pd.DataFrame(columns=('Q3益生菌总会员人数','Q3新客人数','Q3老客人数','Q3新客在年底回购的人数','shopId'))
每循环一次 就让df_empty 新增一个连锁的数据,即
df_empty=df_empty.append(frame,ignore_index=True)
伪代码:
df_empty =pd.DataFrame(columns=('Q3益生菌总会员人数','Q3新客人数','Q3老客人数','Q3新客在年底回购的人数','shopId'))
for 某一个连锁 in 连锁列表:
计算某个连锁,得到frame
df_empty= df_empty.append(frame, ignore_index=True)
以上就是"Python怎么解决新客人数、回购人数和总人数问题"这篇文章的所有内容,感谢各位的阅读!相信大家阅读完这篇文章都有很大的收获,小编每天都会为大家更新不同的知识,如果还想学习更多的知识,请关注行业资讯频道。
人数
益生
会员
连锁
流水
合生
知识
篇文章
季度
循环
问题
二季度
内容
时间
第一次
选出
不同
很大
代码
做法
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
创建数据库并指定编码
重启服务器会影响客户机么
9.0测试服选哪个服务器
徐州软件开发优势
网络安全sbc
软件开发行业知识产权分析
美国向华为出售5G网络技术
我的世界离线版生存服务器
北京火莹网络技术有限公司
军职在线网络技术与应用心得
凤起网络技术有限公司
保密网络安全板报图片
查看数据库是否启用命令
数据库迁移回退方案
db2数据库没有激活
企业网络技术部员工自我鉴定
有没有软件开发兼职
安全模式pgsql备份数据库
数据库如何改值
软件开发技术的应用研究
网络安全学校专业
去吧皮卡丘服务器异常
数据库只读是怎么回事
sql数据库插入不了系统
软件开发项目的系统测试报告
西安供销联社软件开发
软件开发团队商城
服务器外设管理制度
魔兽世界查看服务器
网络安全的现状0