怎么用python爬取一组小姐姐图片
发表于:2025-02-23 作者:千家信息网编辑
千家信息网最后更新 2025年02月23日,本篇内容主要讲解"怎么用python爬取一组小姐姐图片",感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习"怎么用python爬取一组小姐姐图片"吧!引入库imp
千家信息网最后更新 2025年02月23日怎么用python爬取一组小姐姐图片
本篇内容主要讲解"怎么用python爬取一组小姐姐图片",感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习"怎么用python爬取一组小姐姐图片"吧!
引入库
import timeimport requestsfrom lxml import etree
这三个库是为了让我们在请求别人网站的时候,让程序休息一会,避免别人的网站会拦截或者崩溃和将得到的页面源代码进行解析。
网页分析
利用浏览器的开发者模式,对页面进行分析,找出我们所需要的每个图片封面url
href = tree.xpath('//*[@id="features"]/div/div[1]/div/div[1]/a/@href')
我们得到了封面的url后,但这还不是我们所需要的,我们所需要的是超链接里面的图片
我们进入后,发现每张图片都在
里面,如何我们利用循环得到每张图片的url地址for url_img in href: img_url = requests.get(url_img,headers=head) # print(img_url.text) time.sleep(1) t = etree.HTML(img_url.text) url_list = t.xpath("/html/body/section/div/div/div[1]/div[2]/p[2]/img/@src")
剩下的就很简单了,我们只需对文件进行保存就得到我们想要的结果了。
with open(f"./img/{name}",mode="wb") as f: f.write(download_img.content) print("正在下载:" +name) time.sleep(1)
完整代码
import timeimport requestsfrom lxml import etree def get_page_url(): for i in range(1, 4): # 循环3页 url = f"https://mm.tvv.tw/category/xinggan/{i}/" # 请求页面得到源代码 res = requests.get(url,headers=head) # 对源代码进行解析 tree = etree.HTML(res.text) # 得到每个图片的封面url(href) href = tree.xpath('//*[@id="features"]/div/div[1]/div/div[1]/a/@href') # print("-------------------------------------------------------") time.sleep(3) for url_img in href: img_url = requests.get(url_img,headers=head) # print(img_url.text) time.sleep(1) t = etree.HTML(img_url.text) url_list = t.xpath("/html/body/section/div/div/div[1]/div[2]/p[2]/img/@src") # print(url_list) time.sleep(1) for url_src in url_list: get_img(url_src) def get_img(url): name = url.rsplit("/",1)[1] time.sleep(2) download_img = requests.get(url,headers=head) with open(f"./img/{name}",mode="wb") as f: f.write(download_img.content) print("正在下载:" +name) time.sleep(1) f.close() if __name__ == '__main__': head = {"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.36"} get_page_url()
到此,相信大家对"怎么用python爬取一组小姐姐图片"有了更深的了解,不妨来实际操作一番吧!这里是网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!
图片
姐姐
封面
源代码
网站
页面
内容
正在
分析
学习
循环
实用
更深
三个
代码
兴趣
只需
地址
实用性
实际
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
数据库技术是电子政务应用软件
不会英语可以学习网络技术吗
存储服务器外网可访问
数据库原理第二版
怎么看数据库系统时间
君临天下小说软件开发
抓鸡ftp服务器
石家庄铁路网络技术需要什么学历
网络安全 禁令
互联网 科技什么意思
甘孜网络技术参考价格
高职数据库第三章案例
sql 删除数据库所有表
芜湖软件开发app公司哪家强
微生物数据库查询
2017数据库工程师答案
软件测试和数据库运维哪个好
注册了账号怎么找不到服务器
minez服务器
校园网络安全论文总结报告
存储服务器外网可访问
福州惠杰网络技术有限公司
隆回一职中网络安全专业
架设tftp服务器
怎样查看数据库中的信息
软件开发二次承包
网络安全与网络规划设计
服务器能做主机玩游戏吗
最新工业网络技术
数据库高级查询