Python怎么爬取高质量超清壁纸
发表于:2025-02-01 作者:千家信息网编辑
千家信息网最后更新 2025年02月01日,这篇文章主要介绍"Python怎么爬取高质量超清壁纸",在日常操作中,相信很多人在Python怎么爬取高质量超清壁纸问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答"Pyt
千家信息网最后更新 2025年02月01日Python怎么爬取高质量超清壁纸
这篇文章主要介绍"Python怎么爬取高质量超清壁纸",在日常操作中,相信很多人在Python怎么爬取高质量超清壁纸问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答"Python怎么爬取高质量超清壁纸"的疑惑有所帮助!接下来,请跟着小编一起来学习吧!
基本开发环境
Python 3.6
Pycharm
相关模块的使用
import requestsimport reimport os
安装Python并添加到环境变量,pip安装需要的相关模块即可。
一、明确需求
如图所示爬取里面的高清壁纸
二、网页数据分析
所以只需要获取这个链接就可以了爬取壁纸图片了。
返回列表的可以发现,网页是瀑布流加载方式,当你往下滑才会有数据出现。所以可以在下滑网页的前,先打开开发者工具,当下滑网页的时候新加载出来的数据会出现。
通过对比可以知道,这个数据包中包含了,壁纸图片下载的地址。
需要注意的就是这个数据链接是post请求,并不是get请求
需要提交的data参数,就是对应的页码。
三、代码实现
1、获取图片ID
for page in range(1, 11): url = 'https://wallpaper.wispx.cn/cat/%E5%8A%A8%E6%BC%AB' headers = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36', 'x-requested-with': 'XMLHttpRequest', } data = { 'page': page } response = requests.post(url=url, headers=headers) result = re.findall('detail(.*?)target=', response.text) for index in result: image_id = index.replace('\\', '').replace('" ', '') page_url = f'https://wallpaper.wispx.cn/detail{image_id}'
2、获取壁纸url地址,并保存
def main(page_url): html_data = get_response(page_url).text image_url = re.findall('', html_data)[0] image_title = re.findall('(.*?) ', html_data)[0].split(' - ')[0] image_content = get_response(image_url).content path = 'images\\' if not os.path.exists(path): os.makedirs(path) with open(path + image_title + '.jpg', mode='wb') as f: f.write(image_content) print('正在保存:', image_title)
需要注意的点:
请求头里面要防盗链,不然就下载不了。
def get_response(html_url): header = { 'referer': 'https://wallpaper.wispx.cn/detail/1206', 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36' } resp = requests.get(url=html_url, headers=header) return resp
四、实现效果
到此,关于"Python怎么爬取高质量超清壁纸"的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注网站,小编会继续努力为大家带来更多实用的文章!
壁纸
数据
高质量
网页
学习
图片
地址
壁纸图片
就是
更多
模块
环境
帮助
开发
实用
接下来
代码
参数
变量
工具
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
服务器组策略管理
数据库的并发控制引入的机制
亚马逊存储中的数据库
做网络安全挣钱吗
网络安全知识童谣
为什么车代码不对上传不了服务器
水晶易表 数据库
SQL附加数据库异常
深圳市彩帛网络技术有限公司
山东工控软件开发哪家实惠
删除所创建的数据库语句
崇明区新能源软件开发要多少钱
软件开发如何做自由职业
网络安全行业期刊
互联网 湖南科技大学
医院网络安全管理
csgo杭州服务器链接失败
计算机网络技术类论文
和谐校园 网络安全班会
软件开发干系人列表
db2数据库字符串是否为空判断
怎么复制数据库的源文件
sun服务器如何修改主板时间
域名和服务器怎么收费
一千并发需要集群服务器
计算机网络技术的教学方法
公司网络安全流程图
电脑网络安全秘钥匹配不了
家里的宽带能不能放服务器
软件开发的发票