Python如何进行包图网免费付费素材爬取
发表于:2025-02-03 作者:千家信息网编辑
千家信息网最后更新 2025年02月03日,这期内容当中小编将会给大家带来有关Python如何进行包图网免费付费素材爬取,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。包图网大家都知道吧 集齐海量设计素材 十分
千家信息网最后更新 2025年02月03日Python如何进行包图网免费付费素材爬取
这期内容当中小编将会给大家带来有关Python如何进行包图网免费付费素材爬取,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。
包图网大家都知道吧 集齐海量设计素材 十分好用 可惜太贵了,今天就带大家使用Python-爬虫爬取这些素材并且保存到本地!
抓取一个网站的内容,我们需要从以下几方面入手:
1-如何抓取网站的下一页链接?
2-目标资源是静态还是动态(视频、图片等)
3-该网站的数据结构格式
源代码如下
import requestsfrom lxml import etreeimport threading class Spider(object): def __init__(self): self.headers = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36"} self.offset = 1 def start_work(self, url): print("正在爬取第 %d 页......" % self.offset) self.offset += 1 response = requests.get(url=url,headers=self.headers) html = response.content.decode() html = etree.HTML(html) video_src = html.xpath('//div[@class="video-play"]/video/@src') video_title = html.xpath('//span[@class="video-title"]/text()') next_page = "http:" + html.xpath('//a[@class="next"]/@href')[0] # 爬取完毕... if next_page == "http:": return self.write_file(video_src, video_title) self.start_work(next_page) def write_file(self, video_src, video_title): for src, title in zip(video_src, video_title): response = requests.get("http:"+ src, headers=self.headers) file_name = title + ".mp4" file_name = "".join(file_name.split("/")) print("正在抓取%s" % file_name) with open('E://python//demo//mp4//'+file_name, "wb") as f: f.write(response.content) if __name__ == "__main__": spider = Spider() for i in range(0,3): # spider.start_work(url="https://ibaotu.com/shipin/7-0-0-0-"+ str(i) +"-1.html") t = threading.Thread(target=spider.start_work, args=("https://ibaotu.com/shipin/7-0-0-0-"+ str(i) +"-1.html",)) t.start()
效果展示
上述就是小编为大家分享的Python如何进行包图网免费付费素材爬取了,如果刚好有类似的疑惑,不妨参照上述分析进行理解。如果想知道更多相关知识,欢迎关注行业资讯频道。
素材
内容
网站
正在
分析
专业
中小
内容丰富
动态
图片
就是
效果
数据
数据结构
文章
方面
更多
格式
源代码
爬虫
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
网络安全与技术专业的就业前景
计算机网络技术专业培训机构
背叛炉石传说数据库
香港服务器线路
平湖软件开发哪家服务好
nacos内置数据库是什么
上海软件开发设计规范
数据库配置安装路径的文件是哪个
网络安全专业海南大学
节目数据库主要提供的是几次信息
电脑显示安全模式和网络安全模式
交通银行软件开发中心子公司
网络安全出现问题的原因
浙江在线网络技术开发计划表
通达oa的数据库
手游梦幻西游服务器
网络安全新形势下载
软件开发者模式如何打开
金麒麟软件开发
部门网络安全员培训
本地服务器软件哪个好
火车站赛弗网络安全么
创建商品数据库在采购中作用
php 监听数据库
游戏软件开发能自学吗
服务器机箱电源不能自动供电
同步块和数据库锁
广东湛江网络安全形势
oracle部署哪种服务器
筑牢网络安全防线作文