怎么用Python看一看最近有什么刚上映的电影
发表于:2025-01-19 作者:千家信息网编辑
千家信息网最后更新 2025年01月19日,本篇内容介绍了"怎么用Python看一看最近有什么刚上映的电影"的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学
千家信息网最后更新 2025年01月19日怎么用Python看一看最近有什么刚上映的电影
本篇内容介绍了"怎么用Python看一看最近有什么刚上映的电影"的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!
项目目标
获取猫眼电影的即将上映的电影详情。
项目准备
软件:PyCharm
需要的库:requests、lxml、random、time
插件:Xpath
网站如下:
https://maoyan.com/films?showType=2&offset={}
点击下一页的按钮,观察到网站的变化分别如下:
https://maoyan.com/films?showType=2&offset=30https://maoyan.com/films?showType=2&offset=60https://maoyan.com/films?showType=2&offset=90
点击下一页时,页面每增加一页offset=()每次增加30,所以可以用{}代替变换的变量,再用for循环遍历这网址,实现多个网址请求。
项目实现
1、定义一个class类继承object,定义init方法继承self,主函数main继承self。导入需要的库和网址,代码如下所示。
import requestsfrom lxml import etreeimport timeimport randomclass MaoyanSpider(object): def __init__(self): self.url = "https://maoyan.com/films?showType=2&offset={}" def main(self): passif __name__ == '__main__': spider = MaoyanSpider() spider.main()
2、随机产生UserAgent。
for i in range(1, 50): # ua.random,一定要写在这里,每次请求都会随机选择。 self.headers = { 'User-Agent': ua.random, }
3、发送请求,获取页面响应。
def get_page(self, url): # random.choice一定要写在这里,每次请求都会随机选择 res = requests.get(url, headers=self.headers) res.encoding = 'utf-8' html = res.text self.parse_page(html)
4、xpath解析一级页面数据,获取页面信息。
1)基准xpath节点对象列表。
# 创建解析对象parse_html = etree.HTML(html)# 基准xpath节点对象列表dd_list = parse_html.xpath('//dl[@class="movie-list"]//dd')
2)依次遍历每个节点对象,提取数据。
for dd in dd_list: name = dd.xpath('.//div[@class="movie-hover-title"]//span[@class="name noscore"]/text()')[0].strip() star = dd.xpath('.//div[@class="movie-hover-info"]//div[@class="movie-hover-title"][3]/text()')[1].strip() type = dd.xpath('.//div[@class="movie-hover-info"]//div[@class="movie-hover-title"][2]/text()')[1].strip() dowld=dd.xpath('.//div[@class="movie-item-hover"]/a/@href')[0].strip() # print(movie_dict) movie = '''【即将上映】
5、定义movie,保存打印数据。
movie = '''【即将上映】 电影名字: %s主演:%s类型:%s详情链接:https://maoyan.com%s========================================================= ''' % (name, star, type,dowld)print( movie)
6、random.randint()方法,设置时间延时。
time.sleep(random.randint(1, 3))
7、调用方法,实现功能。
html = self.get_page(url)self.parse_page(html)
效果展示
1、点击绿色小三角运行输入起始页,终止页。
2、运行程序后,结果显示在控制台。
3、点击蓝色下载链接, 网络查看详情。
"怎么用Python看一看最近有什么刚上映的电影"的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注网站,小编将为大家输出更多高质量的实用文章!
电影
对象
页面
数据
方法
网址
网站
节点
详情
项目
内容
基准
更多
知识
链接
运行
选择
学有所成
接下来
函数
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
计算机网络技术就业地域分析
批量更新数据库一个字段
unity服务器接线
服务器虚拟化平台搭建
上海欣腾互联网科技有限公司
金山云网络技术有限公司审计
万年历代码软件开发
服务器电源改成普通电源
jsp读取数据库显示
财务税务会用到服务器吗
上海ar眼镜软件开发
ddos攻击网络安全
服务器配置与并发数量
巨杉数据库图片大全
概念模式是数据库三级模式
3列数据找出相同的数据库
1u服务器立着放
一万并发需要什么服务器
app数据库同名
数据库中查看所有学生分数的命令
省市区身份证数据库
中国专利产权数据库
怎么本地连接远程数据库
网络安全进基层宣传周
软件开发科目
海淀区什么网络技术服务至上
在网络安全管理中ca
数据库rac集群启停
学计算机网络技术遇到问题
2003服务器搭建