怎么使用Python的Pandas布尔索引
发表于:2025-01-19 作者:千家信息网编辑
千家信息网最后更新 2025年01月19日,这篇文章主要讲解了"怎么使用Python的Pandas布尔索引",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"怎么使用Python的Pandas布尔索引
千家信息网最后更新 2025年01月19日怎么使用Python的Pandas布尔索引
这篇文章主要讲解了"怎么使用Python的Pandas布尔索引",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"怎么使用Python的Pandas布尔索引"吧!
1.计算布尔值统计信息
import pandas as pd import numpy as np import matplotlib.pyplot as plt #读取movie,设定行索引是movie_title pd.options.display.max_columns = 50 movie = pd.read_csv("./data/movie.csv",index_col = 'movie_title')#判断电影时长是否超过两个小时 #Figure1movie_2_hours = movie['duration'] > 120#统计时长超过两小时的电影总数print(movie_2_hours.sum()) #result:1039#统计时长超过两小时的电影的比例print(movie_2_hours.mean())#统计False和True的比例 print(movie_2_hours.value_counts(normalize = True)) #比较同一个DataFrame中的两列actors = movie[['actor_1_facebook_likes','actor_2_facebook_likes']].dropna()print((actors['actor_1_facebook_likes'] > actors['actor_2_facebook_likes']).mean()) #Figure2
运行结果:
Figure1
Figure2
2. 构建多个布尔条件
import pandas as pd import numpy as np import matplotlib.pyplot as plt #读取movie,设定行索引是movie_title pd.options.display.max_columns = 50 movie = pd.read_csv("./data/movie.csv",index_col = 'movie_title')#创建多个布尔条件criteria1 = movie.imdb_score > 8criteria2 = movie.content_rating == "PG-13"criteria3 = (movie.title_year < 2000) | (movie.title_year >= 2010)"""print(criteria1.head())print(criteria2.head())print(criteria3.head())运行结果:Figure1"""#将多个布尔条件合并成一个criteria_final = criteria1 & criteria2 & criteria3 print(criteria_final.head())#运行结果:Figure2
运行结果:
Figure1
Figure2
3.用布尔索引过滤
import pandas as pd import numpy as np import matplotlib.pyplot as plt #读取movie,设定行索引是movie_title pd.options.display.max_columns = 50 movie = pd.read_csv("./data/movie.csv",index_col = 'movie_title')#创建第一个布尔条件crit_a1 = movie.imdb_score > 8 crit_a2 = movie.content_rating == 'PG-13'crit_a3 = (movie.title_year < 2000) | (movie.title_year > 2009)final_crit_a = crit_a1 & crit_a2 & crit_a3#创建第二个布尔条件crit_b1 = movie.imdb_score < 5crit_b2 = movie.content_rating == 'R'crit_b3 = (movie.title_year >= 2000) & (movie.title_year <= 2010)final_crit_b = crit_b1 & crit_b2 & crit_b3#将两个条件用或运算合并起来final_crit_all = final_crit_a | final_crit_bprint(final_crit_all.head()) #Figure 1 #用最终的布尔条件过滤数据print(movie[final_crit_all].head()) #Figure2
运行结果:
Figure1
Figure2
import pandas as pd import numpy as np import matplotlib.pyplot as plt #读取movie,设定行索引是movie_title pd.options.display.max_columns = 50 movie = pd.read_csv("./data/movie.csv",index_col = 'movie_title')#创建第一个布尔条件crit_a1 = movie.imdb_score > 8 crit_a2 = movie.content_rating == 'PG-13'crit_a3 = (movie.title_year < 2000) | (movie.title_year > 2009)final_crit_a = crit_a1 & crit_a2 & crit_a3#创建第二个布尔条件crit_b1 = movie.imdb_score < 5crit_b2 = movie.content_rating == 'R'crit_b3 = (movie.title_year >= 2000) & (movie.title_year <= 2010)final_crit_b = crit_b1 & crit_b2 & crit_b3#将两个条件用或运算合并起来final_crit_all = final_crit_a | final_crit_b#使用loc,对指定的列做过滤操作,可以清楚地看到过滤是否起作用cols = ['imdb_score','content_rating','title_year']movie_filtered = movie.loc[final_crit_all,cols]print(movie_filtered.head(10))
运行结果:
感谢各位的阅读,以上就是"怎么使用Python的Pandas布尔索引"的内容了,经过本文的学习后,相信大家对怎么使用Python的Pandas布尔索引这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是,小编将为大家推送更多相关知识点的文章,欢迎关注!
布尔
条件
索引
结果
运行
统计
两个
多个
小时
时长
电影
学习
内容
比例
运算
清楚
作用
信息
就是
思路
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
绿联存储服务器
小学校网络安全教育教案
315网络安全最新消息
淮南系统软件开发公司哪家好
油田网络安全与数字化转型
中国网络安全精英卡
安徽综合软件开发概念设计
网络安全大赛真
曙光服务器boot设置
服务器安全狗宝塔
网络安全研发的成本
数据库和数据表的叙述
个人如何发展网络安全
数据库索引的四种类型
热血江湖私服还原数据库
三大中文数据库都可以二次检索吗
联想软件开发 笔试
数据库数据备份与维护
cf端游是不是维护服务器呢
服务器装家里
山东钣金服务器机柜虚拟主机
国土网络安全
平安 网络安全
网络安全 党委
绍兴软件开发驻场哪里好
网络安全学科示范校
东莞咪房网络技术有限公司
网络安全研发的成本
建议不要改变服务器的
我的世界千之林服务器