导航：首页 > 互联网科技 >

Python怎么爬取漫画图片

发表于：2025-01-31 作者：千家信息网编辑

千家信息网最后更新 2025年01月31日，这篇文章主要介绍了Python怎么爬取漫画图片，具有一定借鉴价值，感兴趣的朋友可以参考下，希望大家阅读完这篇文章之后大有收获，下面让小编带着大家一起了解一下。开发环境：Python 3.6Pychar

千家信息网最后更新 2025年01月31日Python怎么爬取漫画图片

这篇文章主要介绍了Python怎么爬取漫画图片，具有一定借鉴价值，感兴趣的朋友可以参考下，希望大家阅读完这篇文章之后大有收获，下面让小编带着大家一起了解一下。

开发环境：

Python 3.6
Pycharm

目标地址

https://www.dmzj.com/info/yaoshenji.html

代码

导入工具

import requestsimport osimport refrom bs4 import BeautifulSoupfrom contextlib import closingfrom tqdm import tqdmimport time

获取动漫章节链接和章节名

r = requests.get(url=target_url)bs = BeautifulSoup(r.text, 'lxml')list_con_li = bs.find('ul', class_="list_con_li")cartoon_list = list_con_li.find_all('a')chapter_names = []chapter_urls = []for cartoon in cartoon_list:    href = cartoon.get('href')    name = cartoon.text    chapter_names.insert(0, name)    chapter_urls.insert(0, href)print(chapter_urls)

下载漫画

for i, url in enumerate(tqdm(chapter_urls)):    print(i,url)    download_header = {        'Referer':url,        'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36'    }    name = chapter_names[i]    # 去掉.    while '.' in name:        name = name.replace('.', '')    chapter_save_dir = os.path.join(save_dir, name)    if name not in os.listdir(save_dir):        os.mkdir(chapter_save_dir)    r = requests.get(url=url)    html = BeautifulSoup(r.text, 'lxml')    script_info = html.script    pics = re.findall('\d{13,14}', str(script_info))    for j, pic in enumerate(pics):        if len(pic) == 13:            pics[j] = pic + '0'    pics = sorted(pics, key=lambda x: int(x))    chapterpic_hou = re.findall('\|(\d{5})\|', str(script_info))[0]    chapterpic_qian = re.findall('\|(\d{4})\|', str(script_info))[0]    for idx, pic in enumerate(pics):        if pic[-1] == '0':            url = 'https://images.dmzj.com/img/chapterpic/' + chapterpic_qian + '/' + chapterpic_hou + '/' + pic[                                                                                                             :-1] + '.jpg'        else:            url = 'https://images.dmzj.com/img/chapterpic/' + chapterpic_qian + '/' + chapterpic_hou + '/' + pic + '.jpg'        pic_name = 'd.jpg' % (idx + 1)        pic_save_path = os.path.join(chapter_save_dir, pic_name)        print(url)        response = requests.get(url,headers=download_header)        # with closing(requests.get(url, headers=download_header, stream=True)) as response:            # chunk_size = 1024            # content_size = int(response.headers['content-length'])        print(response)        if response.status_code == 200:            with open(pic_save_path, "wb") as file:                # for data in response.iter_content(chunk_size=chunk_size):                    file.write(response.content)        else:            print('链接异常')    time.sleep(2)

创建保存目录

save_dir = '妖神记'if save_dir not in os.listdir('./'):    os.mkdir(save_dir)target_url = "https://www.dmzj.com/info/yaoshenji.html"

感谢你能够认真阅读完这篇文章，希望小编分享的"Python怎么爬取漫画图片"这篇文章对大家有帮助，同时也希望大家多多支持，关注行业资讯频道，更多相关知识等着你来学习!

很赞哦！

篇文章漫画图片漫画图片章节链接代码价值兴趣动漫同时地址工具更多朋友环境目录目标知识编带数据库的安全要保护哪些东西数据库安全各自的含义是什么生产安全数据库录入数据库的安全性及管理数据库安全策略包含哪些海淀数据库安全审计系统建立农村房屋安全信息数据库易用的数据库客户端支持安全管理连接数据库失败ssl安全错误数据库的锁怎样保障安全数据库日常巡检箱网状数据库典型代表瑞星杀毒服务器怎么组装服务器网络网络安全法颁布的日期是游戏与服务器连接失败该怎么样数据库的端口是用来干什么的山西网络安全和信息化专家名单免费云服务器管理 sql数据库如何做选课表多台服务器能直接堆叠吗我的世界如何卸载服务器同江市委网络安全委员会软件开发培训学校驾考宝典有哪些ip网络技术软件开发面试产品经理面向对象型数据库的特点我的世界服务器怎么开网易版免费服务器进行ghost备份和恢复惠普服务器管理员账户网络安全训练营怎么登录软件开发薪酬设计通达信哪个服务器最快网页设计连接数据库连接不成功翼和沃南京网络技术有限公司东莞微信软件开发设计数据库留痕是啥意思网络安全方面的文献综述数据库覆盖锁联想服务器管理口ip地址

千家信息网

千家信息网

Python怎么爬取漫画图片

软件设计师应该知道的几条法则

怎么使用dig命令挖掘域名解析信息

相关文章