千家信息网

Python爬虫入门案例之实现回车桌面壁纸网美女图片采集

发表于:2025-02-02 作者:千家信息网编辑
千家信息网最后更新 2025年02月02日,本篇内容主要讲解"Python爬虫入门案例之实现回车桌面壁纸网美女图片采集",感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习"Python爬虫入门案例之实现回车
千家信息网最后更新 2025年02月02日Python爬虫入门案例之实现回车桌面壁纸网美女图片采集

本篇内容主要讲解"Python爬虫入门案例之实现回车桌面壁纸网美女图片采集",感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习"Python爬虫入门案例之实现回车桌面壁纸网美女图片采集"吧!

目录
  • 知识点

  • 环境

  • 目标网址:

  • 爬虫代码

    • 导入模块

    • 发送网络请求

    • 获取网页源代码

    • 提取每个相册的详情页链接地址

    • 替换所有的图片链接 换成大图

    • 保存图片 图片名字

    • 翻页

    • 爬取结果

知识点

  • requests

  • parsel

  • re

  • os

环境

  • python3.8

  • pycharm2021

目标网址:

https://mm.enterdesk.com/bizhi/63899-347866.html

【付费VIP完整版】只要看了就能学会的教程,80集Python基础入门视频教学

点这里即可免费在线观看

注意: 在我们查看网页源代码的时候 (1. 控制台为准 2. 以右键查看网页源代码 3. 元素面板)

  • 发送网络请求

  • 获取网页源代码

  • 提取想要的图片链接 css样式提取 xpath re正则表达式 bs4

  • 替换所有的图片链接 换成大图

  • 保存图片

爬虫代码

导入模块

import requests     # 第三方库 pip install requestsimport parsel       # 第三方库 pip install parselimport os           # 新建文件夹

发送网络请求

response = requests.get('https://mm.enterdesk.com/bizhi/64011-348522.html')

获取网页源代码

data_html = response_1.text

提取每个相册的详情页链接地址

selector_1 = parsel.Selector(data_html)photo_url_list = selector_1.css('.egeli_pic_dl dd a::attr(href)').getall()title_list = selector_1.css('.egeli_pic_dl dd a img::attr(title)').getall()for photo_url, title in zip(photo_url_list, title_list):    print(f'*****************正在爬取{title}*****************')    response = requests.get(photo_url)    # : 请求成功的标识    selector = parsel.Selector(response.text)    # 提取想要的图片链接[第一个链接, 第二个链接,....]    img_src_list = selector.css('.swiper-wrapper a img::attr(src)').getall()    # 新建一个文件夹    if not os.path.exists('img/' + title):        os.mkdir('img/' + title)

替换所有的图片链接 换成大图

for img_src in img_src_list:    # 字符串的替换    img_url = img_src.replace('_360_360', '_source')

保存图片 图片名字

# 图片 音频 视频 二进制数据contentimg_data = requests.get(img_url).content# 图片名称 字符串分割# 分割完之后 会给我们返回一个列表img_title = img_url.split('/')[-1]with open(f'img/{title}/{img_title}', mode='wb') as f:    f.write(img_data)print(img_title, '保存成功!!!')

翻页

page_html = requests.get('https://mm.enterdesk.com/').textcounts = parsel.Selector(page_html).css('.wrap.no_a::attr(href)').get().split('/')[-1].split('.')[0]for page in range(1, int(counts) + 1):    print(f'------------------------------------正在爬取第{page}页------------------------------------')    发送网络请求    response_1 = requests.get(f'https://mm.enterdesk.com/{page}.html')

爬取结果

到此,相信大家对"Python爬虫入门案例之实现回车桌面壁纸网美女图片采集"有了更深的了解,不妨来实际操作一番吧!这里是网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!

图片 链接 爬虫 源代码 网页 网络 壁纸 案例 桌面 桌面壁纸 美女 美女图片 大图 成功 代码 内容 名字 地址 字符 字符串 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 互联网科技服务类企业 简单的服务器部署需要多少费用 长沙斗牛软件开发 公司服务器连接不上电脑 娄底网络安全宣传周主题党日 数据库技术教程视频 力控数据库变量时间 计算机网络安全受损的危害 软件开发项目利润计算表 苹果软件开发者授权 编写数据库系统需求分析说明书 100字网络安全小建议 网络安全可视化平台 管理群 群数据库设计 车载网络技术发展趋势是 哪项不是锁定的类型 数据库 中国近代报刊数据库南开大学 达梦数据库加个字段的命令 提高网络技术app排行榜 华为手机软件开发自学hms 华为服务器平均无故障工作时间 宏脉连接服务器失败 mib数据库表间关系 一起来飞车各个服务器 c 数据库联合查询系统 微软163服务器连接不上 服务器怎么不能从硬盘启动了 数据库应用技术怎么打开 手机登录服务器出现错误 有关疫情的网络安全教育
0