Pandas使用小技巧有哪些
发表于:2025-02-01 作者:千家信息网编辑
千家信息网最后更新 2025年02月01日,这期内容当中小编将会给大家带来有关Pandas使用小技巧有哪些,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。对于动辄就几十或几百个 G 的数据,在读取的这么大数据的
千家信息网最后更新 2025年02月01日Pandas使用小技巧有哪些
这期内容当中小编将会给大家带来有关Pandas使用小技巧有哪些,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。
对于动辄就几十或几百个 G 的数据,在读取的这么大数据的时候,我们有没有办法随机选取一小部分数据,然后读入内存,快速了解数据和开展 EDA ?
使用 Pandas 的 skiprows 和 概率知识,就能做到。
下面解释具体怎么做。
如下所示,读取某 100 G 大小的 big_data.csv 数据
使用 skiprows 参数,
x > 0 确保首行读入,
np.random.rand() > 0.01 表示 99% 的数据都会被随机过滤掉
言外之意,只有全部数据的 1% 才有机会选入内存中。
import pandas as pd
import numpy as np
df = pd.read_csv("big_data.csv",
skiprows =
lambda x: x>0 and np.random.rand() > 0.01)
print("The shape of the df is {}.
It has been reduced 100 times!".format(df.shape))
使用这种方法,读取的数据量迅速缩减到原来的 1% ,对于迅速展开数据分析有一定的帮助。上述就是小编为大家分享的Pandas使用小技巧有哪些了,如果刚好有类似的疑惑,不妨参照上述分析进行理解。如果想知道更多相关知识,欢迎关注行业资讯频道。
数据
分析
技巧
内存
内容
知识
言外之意
专业
中小
内容丰富
办法
参数
只有
大小
就是
数据分析
文章
方法
时候
更多
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
面对对象软件开发思维导图
格家网络技术营业执照
河南软件开发技术
美国大学计算机网络安全排名
数据库服务器维护方案
斯坦福 数据库教材
攀枝花网络安全服务价格
创建修改和删除数据库的方法
参与国际网络安全治理
20年前的塔式服务器机箱
皮皮麻将软件开发
2021房产数据库营销
手机移动网络安全防护
处理上网与网络安全的关系
数据库在计算机领域的应用
湖北云温商互联网科技
饥荒怎么分享服务器mod
lenovo服务器保修电话
上海仓库管理应用软件开发
计算机网络技术名
深圳跑腿平台软件开发模板
学校的网络安全么
ih5数据库输出
宜君网络安全进校园
中国网络技术服务
网络安全色包括哪几种颜色
东西湖专业的软件开发公司
怎么治理网络安全
建行软件开发中心 改革
嘉兴集合点网络技术有限公司