怎么使用Python的Pandas布尔索引
发表于:2025-02-23 作者:千家信息网编辑
千家信息网最后更新 2025年02月23日,这篇文章主要讲解了"怎么使用Python的Pandas布尔索引",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"怎么使用Python的Pandas布尔索引
千家信息网最后更新 2025年02月23日怎么使用Python的Pandas布尔索引
这篇文章主要讲解了"怎么使用Python的Pandas布尔索引",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"怎么使用Python的Pandas布尔索引"吧!
1.计算布尔值统计信息
import pandas as pd import numpy as np import matplotlib.pyplot as plt #读取movie,设定行索引是movie_title pd.options.display.max_columns = 50 movie = pd.read_csv("./data/movie.csv",index_col = 'movie_title')#判断电影时长是否超过两个小时 #Figure1movie_2_hours = movie['duration'] > 120#统计时长超过两小时的电影总数print(movie_2_hours.sum()) #result:1039#统计时长超过两小时的电影的比例print(movie_2_hours.mean())#统计False和True的比例 print(movie_2_hours.value_counts(normalize = True)) #比较同一个DataFrame中的两列actors = movie[['actor_1_facebook_likes','actor_2_facebook_likes']].dropna()print((actors['actor_1_facebook_likes'] > actors['actor_2_facebook_likes']).mean()) #Figure2
运行结果:
Figure1
Figure2
2. 构建多个布尔条件
import pandas as pd import numpy as np import matplotlib.pyplot as plt #读取movie,设定行索引是movie_title pd.options.display.max_columns = 50 movie = pd.read_csv("./data/movie.csv",index_col = 'movie_title')#创建多个布尔条件criteria1 = movie.imdb_score > 8criteria2 = movie.content_rating == "PG-13"criteria3 = (movie.title_year < 2000) | (movie.title_year >= 2010)"""print(criteria1.head())print(criteria2.head())print(criteria3.head())运行结果:Figure1"""#将多个布尔条件合并成一个criteria_final = criteria1 & criteria2 & criteria3 print(criteria_final.head())#运行结果:Figure2
运行结果:
Figure1
Figure2
3.用布尔索引过滤
import pandas as pd import numpy as np import matplotlib.pyplot as plt #读取movie,设定行索引是movie_title pd.options.display.max_columns = 50 movie = pd.read_csv("./data/movie.csv",index_col = 'movie_title')#创建第一个布尔条件crit_a1 = movie.imdb_score > 8 crit_a2 = movie.content_rating == 'PG-13'crit_a3 = (movie.title_year < 2000) | (movie.title_year > 2009)final_crit_a = crit_a1 & crit_a2 & crit_a3#创建第二个布尔条件crit_b1 = movie.imdb_score < 5crit_b2 = movie.content_rating == 'R'crit_b3 = (movie.title_year >= 2000) & (movie.title_year <= 2010)final_crit_b = crit_b1 & crit_b2 & crit_b3#将两个条件用或运算合并起来final_crit_all = final_crit_a | final_crit_bprint(final_crit_all.head()) #Figure 1 #用最终的布尔条件过滤数据print(movie[final_crit_all].head()) #Figure2
运行结果:
Figure1
Figure2
import pandas as pd import numpy as np import matplotlib.pyplot as plt #读取movie,设定行索引是movie_title pd.options.display.max_columns = 50 movie = pd.read_csv("./data/movie.csv",index_col = 'movie_title')#创建第一个布尔条件crit_a1 = movie.imdb_score > 8 crit_a2 = movie.content_rating == 'PG-13'crit_a3 = (movie.title_year < 2000) | (movie.title_year > 2009)final_crit_a = crit_a1 & crit_a2 & crit_a3#创建第二个布尔条件crit_b1 = movie.imdb_score < 5crit_b2 = movie.content_rating == 'R'crit_b3 = (movie.title_year >= 2000) & (movie.title_year <= 2010)final_crit_b = crit_b1 & crit_b2 & crit_b3#将两个条件用或运算合并起来final_crit_all = final_crit_a | final_crit_b#使用loc,对指定的列做过滤操作,可以清楚地看到过滤是否起作用cols = ['imdb_score','content_rating','title_year']movie_filtered = movie.loc[final_crit_all,cols]print(movie_filtered.head(10))
运行结果:
感谢各位的阅读,以上就是"怎么使用Python的Pandas布尔索引"的内容了,经过本文的学习后,相信大家对怎么使用Python的Pandas布尔索引这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是,小编将为大家推送更多相关知识点的文章,欢迎关注!
布尔
条件
索引
结果
运行
统计
两个
多个
小时
时长
电影
学习
内容
比例
运算
清楚
作用
信息
就是
思路
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
郑铁网络技术教科书
谷歌服务器通信请稍后重试
APP的服务器搭建
网站导航软件开发
浦东新区软件开发私人定做
用数据库写工资提高20%
长宁区项目数据库活动简介
阿里云 分布式数据库
网络安全等级保护测评流程和方法
学校网络安全架构图
单机游戏服务器关闭了还能玩吗
按键精灵链接远程数据库
科技互联网公司ceo企业家
杭州堆塔互联网科技有限公司
舟山软件开发公司
大陆软件开发流程
数据库亿条数据
钻石鉴定软件开发
oa系统请假数据库
奉节软件开发有限公司
上海楼盘小区数据库
车联网网络安全
互联网科技最新热点
软件开发会被ai代替么
服务器运维学习app
查询人数 数据库
数据库的运行控制包括什么
青海做安卓软件开发的公司
数据库运维主要看哪些东西
深圳微信红包软件开发