爬虫中正则表达式怎么用
发表于:2025-02-03 作者:千家信息网编辑
千家信息网最后更新 2025年02月03日,这篇文章给大家分享的是有关爬虫中正则表达式怎么用的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。1、正则表达式:学会正则表达式的常用符号2、re模块:学会python中re模
千家信息网最后更新 2025年02月03日爬虫中正则表达式怎么用
这篇文章给大家分享的是有关爬虫中正则表达式怎么用的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。
1、正则表达式:学会正则表达式的常用符号
2、re模块:学会python中re模块的使用方法
3、Requests和re模块的组合应用:案例说明
正则表达式:
一般字符:
预定义字符:
数量词:
边界匹配:
(.?)括号内容返回结果,.?匹配任意字符
import re
a = 'xxIxxmexxlovexxsffaxxpythonxx'
infos = re.findall('xx(.*?)xx',a)
print(infos)
输出结果:I,love, python
re模块及其方法
search()函数:匹配并提取第一个符合规律的内容,返回一个正则表达式对象
re.match(pattern,string,flags=0)
其中:
(1)pattern为匹配的正则表达式
(2)string为要匹配的字符串
(3)flags为标志位,用于控制正则表达式的匹配方式,如是否区分大小写,多行匹配等
import re
a='one1two2three3'
infos=re.search('\d+',a)
print(infos)
输出:
import re
a='one1two2three3'
infos=re.search('\d+',a)
print(infos.group())
输出:1
sub()函数:用于替换字符串中的匹配项
re.sub(pattern,repl,string,count=0,flags=0)
其中:
(1)pattern为匹配的正则表达式
(2)repl为替换的字符串
(3)string为要被查找替换的原始字符串
(4)counts为模式匹配后替换的最大次数,默认0表示替换所有的匹配
(5)flags为标志位,用于控制正则表达式的匹配方式,如是否区分大小写,多行匹配等
import re
phone='123-456-789'
new_phone=re.sub('\D','',phone)
print(new_phone)
输出:123456789
findall()函数:匹配所有符合规律的内容,并以列表的形式返回结果。
import re
a='one1two2three3'
infos2=re.findall('\d+',a)
print(infos2)
输出:['1', '2', '3']
import re
a ='''指数
'''
word = re.findall('(.*?)', a, re.S)
print(word[0].strip())
输出:指数
感谢各位的阅读!关于"爬虫中正则表达式怎么用"这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!
正则
表达式
字符
输出
内容
字符串
模块
函数
结果
爬虫
大小
指数
方式
方法
更多
标志
篇文章
规律
多行
控制
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
王者哪个服务器送皮肤
bmob云数据库
海维软件开发PL
电控软件开发主要是做什么的
超级账本默认数据库
青岛app小程序软件开发公司
网络安全法律课程
bim数据库服务平台
iphone代软件开发
腾讯云设置服务器白名单
比较好用的服务器管理软件
服务器是几个u的
郑州警示教育基地软件开发
ipad连接电影显示服务器异常
小学生开展网络安全ppt
北方工业大学 数据库
社工库银行数据库
企业app软件开发的前景
国三网络技术综合题
软件开发企业的税收疑点
vb top 数据库 读写
东西湖网络安全学院怎么招生
数据库引擎优化顾问如何使用
中国长城网络安全地位
软件开发公司需要学什么
手表软件开发
数据库快照
广东华为服务器虚拟化部署
服务器开机自检是什么原因
服务器安全基线文档