怎么用Python爬取王者荣耀皮肤
发表于:2025-01-25 作者:千家信息网编辑
千家信息网最后更新 2025年01月25日,本篇内容主要讲解"怎么用Python爬取王者荣耀皮肤",感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习"怎么用Python爬取王者荣耀皮肤"吧!基本开发环境Py
千家信息网最后更新 2025年01月25日怎么用Python爬取王者荣耀皮肤
本篇内容主要讲解"怎么用Python爬取王者荣耀皮肤",感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习"怎么用Python爬取王者荣耀皮肤"吧!
基本开发环境
Python 3.6
Pycharm
相关模块的使用
import requests # 第三方模块import parselimport time # 时间模块
安装Python并添加到环境变量,pip安装需要的相关模块即可。
一、确定目标需求
根据re、xpath或者css选择器 都是可以提取数据的,还是比较简单的。爬取IP主要是因为在使用爬虫频繁抓取数据的时候,某些网站是比较容易被封IP的。
虽然网站有很多关于免费的IP代理可以使用,但是基本上都是用不了的。
完整代码
import requests # 第三方模块import parselimport time # 时间模块def check_ip(proxies_list): """检测代理ip的可用性""" use_proxy = [] for ip in proxies_list: try: response = requests.get(url='https://www.baidu.com', proxies=ip, timeout=2) if response.status_code == 200: use_proxy.append(ip) except Exception as e: print('当前代理ip: ', ip, '请求超时, 检测不合格!!!') else: print('当前代理ip: ', ip, '检测通过') return use_proxyproxy_list = []for page in range(1, 11): time.sleep(0.5) print(f'==================正在抓取第{page}页数据================') # 1.确定数据所在地址(分析网页性质<静态网页\动态网页>) url = f'http://www.ip3366.net/?stype=1&page={page}' headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36'} # 2.发送网络请求 response = requests.get(url=url, headers=headers) html_data = response.text # str # print(html_data) # 3.解析数据 # 3.1 转换数据类型 selector = parsel.Selector(html_data) # 3.2 数据提取 trs = selector.xpath('//table[@class="table table-bordered table-striped"]/tbody/tr') # tr """ # 代理ip的结构 proxies_dict = { "http": "http://" + ip:端口, "https": "http://" + ip:端口, } """ for tr in trs: ip_num = tr.xpath('./td[1]/text()').get() ip_port = tr.xpath('./td[2]/text()').get() # print(ip_num, ip_port) ip_proxy = ip_num + ':' + ip_port # print(ip_proxy) proxies_dict = { 'http': "http://" + ip_proxy, 'https': "https://" + ip_proxy } # 4.数据的保存 proxy_list.append(proxies_dict) print('保存成功:', proxies_dict)print(proxy_list)print('获取到的代理ip数量: ', len(proxy_list))print('============================正在检测代理===================================')can_use = check_ip(proxy_list)print('可用代理:', can_use)print('可用代理数量:', len(can_use))
到此,相信大家对"怎么用Python爬取王者荣耀皮肤"有了更深的了解,不妨来实际操作一番吧!这里是网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!
代理
数据
模块
检测
王者
皮肤
荣耀
网站
内容
数量
时间
正在
环境
端口
第三方
学习
实用
更深
频繁
成功
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
淮南物业管理软件开发
qq安全连接到服务器
星享网络技术有限公司
软件开发的单机游戏
漳州商城分销软件开发
电商带货软件开发多少钱
软件开发费新旧会计准则
胡宗泉数据库
北京常见软件开发价钱
基础数据库用户不得超过
bs架构软件开发语言
辽宁乾包网络技术有限公司
上海分布式服务器价格
网络安全宣传教育周
网络技术规程 微盘
数据库主要检索技术
数据库应用技术考卷及答案
廊坊网络安全
成都市软件开发有哪些公司
邯郸应用软件开发服务
群辉服务器改装
花千骨手游服务器
fm21什么数据库开局不卡
征途网络技术怎么样
sql语句能分离数据库吗
3dm软件开发公司
ciw网络安全分析师
星兴网络技术
机械制图中常用的数据库
软件开发年终分红能赚到多少