Python如何处理中国地区信息
发表于:2025-01-16 作者:千家信息网编辑
千家信息网最后更新 2025年01月16日,本篇文章为大家展示了Python如何处理中国地区信息,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。1.1数据的爬取代码:import pandas as pd
千家信息网最后更新 2025年01月16日Python如何处理中国地区信息1.1数据的爬取
1.2检查重复数据
1.3检查缺失值
1.4 检查异常值
本篇文章为大家展示了Python如何处理中国地区信息,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。
1.1数据的爬取
代码:
import pandas as pddata=pd.read_csv("example_data.csv",header=1)print(data)data1=pd.read_csv("北京地区信息.csv",header=1,encoding='gbk')data2=pd.read_csv("天津地区信息.csv",encoding='gbk')print(data1)print(data2)
代码运行结果:
首先使用pandas
的read_csv()
方法进行数据的读取,然后就能够看到相应的表格信息。
1.2检查重复数据
dupnum=data.duplicated()print(dupnum)\# 对重复值进行处理caldup=data.drop_duplicates()print(caldup)
代码运行结果:
主要是是使用这个duplicated()
方法进行数据的查重,返回一个布尔序列,仅对唯一元素而言为True
。如果有重复的数据就会在该数值的部分返货Flase
。
然后我们就可以使用drop_duplicates()
进行重复值删除。
1.3检查缺失值
代码:
from pandas import Seriesfrom numpy import NAN\# import pandas as pd series_obj=Series([1,None])pd.notnull(series_obj)\# 上面做的是测试pd.notnull(data)pd.notnull(data1)pd.notnull(data2)
代码运行结果:
使用pd.notnull(data1)
进行非空数值的返回, 返回值是布尔型的矩阵,再取df[布尔型矩阵]返回的是id为非空的行。
1.4 检查异常值
import numpy as np\# 2.4 检查异常值def three_sig(ser1): mean_value=ser1.mean()\# 标准差 std_value=ser1.std()\# 位于3σ范围外的都是异常值\# 数值大于u+3σ小雨u-3σ rule=(mean_value-3*std_value>ser1)|(ser1.mean()+3*ser1.std()代码运行结果:
3σ原则又称为拉依达准则,该准则具体来说,就是先假设一组检测数据只含有随机误差,对原始数据进行计算处理得到标准差,然后按一定的概率确定一个区间,认为误差超过这个区间的就属于异常值。
通俗理解就是正态分布。
上述内容就是Python如何处理中国地区信息,你们学到知识或技能了吗?如果还想学到更多技能或者丰富自己的知识储备,欢迎关注行业资讯频道。
数据
代码
信息
地区
结果
检查
运行
就是
布尔
数值
中国
中国地区
内容
准则
区间
技能
方法
标准
知识
矩阵
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
江苏网络技术服务对象
级别设置软件开发岗位
小学网络安全教学
嘉博数据库
25网络安全审查坚持
数据库还能用吗
新思维网络技术
加强网络安全生产
软件开发程序的组成
山东瑞合软件开发有限公司简介
农村网络安全讲稿
软件开发 提供源代码
开封软件开发规定
数据库三级设计题的下划线
石油行业网络安全规定
mdf 怎么还原数据库
数据库使用索引
做软件开发转行的人想法
全文数据库luc
网络安全视频初中生
中船软件开发
如何设置sql数据库
电信无线网络安全吗
玉环青少年网络安全课
上海服务器应用线束生产厂家
网络安全监测绩效考核内容
太阳能服务器为什么跳闸
服务器托管维护协议
数据库crdit是什么意思
网络安全视频初中生