怎样在python中使用正则表达式
发表于:2024-09-24 作者:千家信息网编辑
千家信息网最后更新 2024年09月24日,本篇文章为大家展示了怎样在python中使用正则表达式,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字
千家信息网最后更新 2024年09月24日怎样在python中使用正则表达式
本篇文章为大家展示了怎样在python中使用正则表达式,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。
正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。
Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式。
re 模块使 Python 语言拥有全部的正则表达式功能。
compile 函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换。
re 模块也提供了与这些方法功能完全一致的函数,这些函数使用一个模式字符串做为它们的第一个参数。
python正则表达式的使用(实验代码),具体代码如下所示:
import redata='''12345 2019-05-20 13:30:04,102 E:/PythonProject/accountReport-20190520/createReport_20190520.py(164): [INFO]start=24h-ago&m=sum:zscore.keys{compared=week,redis=6380,endpoint=192.168.8.11_Redis-b}2019-05-20 13:30:04,133 E:/PythonProject/accountReport-20190520/createReport_20190520.py(164): [INFO]start=24h-ago&m=sum:keys{redis=6380,endpoint=192.168.8.120_Redis-sac-a}'''# 1.1)非编译正则表达式的使用def re_nocompile(): pattern="report" #匹配时间格式 r=re.findall(pattern,data,flags=re.IGNORECASE) # findall方法 返回字符串 print(r)# 1.2) 编译的正则表达式的使用(效率高)def re_compile(): pattern = "[0-9]{1,2}\:[0-9]{1,2}\:[0-9]{1,2}" # 匹配时间格式 re_obj=re.compile(pattern) #创建一个对象 r=re_obj.findall(data) # findall方法 返回字符串 print(r)# 2.1)"匹配" 类函数的使用 findall、 match、search、finditerdef re_match(): pattern = "\d+" # 匹配数字 r=re.match(pattern,data) #match 函数是匹配字符串的开头,类似startwith if r: # 使用match匹配成功后,返回SRE_MATCH类型的对象,该对象包含了相关模式和原始字符串,包括起始位置和结束位置 print(r) print(r.start()) print(r.end()) print(r.string) print(r.group()) # group()用来提出分组截获的字符串。group() 同group(0)就是匹配正则表达式整体结果。 # group(1) 列出第一个括号匹配部分,group(2) 列出第二个括号匹配部分,group(3) 列出第三个括号匹配部分。 # 当然正则表达式中没有括号,group(1)肯定不对了 print(r.re) else: # match如果匹配不到,返回None print("False")def re_search(): pattern = "[0-9]{1,2}\:[0-9]{1,2}\:[0-9]{1,2}" # 匹配时间格式 r=re.search(pattern,data) # search方法是全部位置的匹配,返回SRE_MATCH对象 print(r) print(r.start()) #起始位置 print(r.end()) #结束位置 # finditer返回一个迭代器def re_finditer(): pattern = "\d+" # 匹配数字 r=re.finditer(pattern,data) for i in r: print(i.group())# 贪婪匹配:总是匹配最长的那个字符串(默认)# 非贪婪匹配:总是匹配最短的那个字符串(在匹配字符串时加上?来实现)def re_find02(): r1=re.findall("Python.*\.",data) # 贪婪匹配 print(r1) r2 = re.findall("Python.*?\.", data) #非贪婪匹配 print(r2)if __name__=="__main__": re_nocompile() re_compile() re_match() re_search() re_finditer() re_find02()import reimport requestsdata='''12345 2019-05-20 13:30:04,102 E:/PythonProject/accountReport-20190520/createReport_20190520.py(164): [INFO]start=24h-ago&m=sum:zscore.keys{compared=week,redis=6380,endpoint=192.168.8.11_Redis-b}2019-05-20 13:30:04,133 E:/PythonProject/accountReport-20190520/createReport_20190520.py(164): [INFO]start=24h-ago&m=sum:keys{redis=6380,endpoint=192.168.8.120_Redis-sac-a}'''# 1)"修改类"函数# 1.1) sub函数进行匹配并替换,返回替换后的字符串def re_sub(): pattern = "[0-9]{1,2}\:[0-9]{1,2}\:[0-9]{1,2}" # 匹配时间格式 data01=re.sub(pattern,"timeString",data) print(data01)# 1.2)splite将字符串拆成子串列表,可以同时指定多个分隔符def re_split(): r=re.split(r"[:\-\=]",data.strip("'")) print(r)# 2)匹配html的一个例子def re_html(): r=requests.get("https://www.hao123.com/") print(r.content) try: web=re.findall("(https:.*?.com)",str(r.content)) print(web) except Exception as err: print(err)if __name__=="__main__": re_sub() re_split() re_html()
上述内容就是怎样在python中使用正则表达式,你们学到知识或技能了吗?如果还想学到更多技能或者丰富自己的知识储备,欢迎关注行业资讯频道。
字符
字符串
正则
表达式
函数
对象
位置
方法
模式
贪婪
括号
时间
格式
模块
部分
代码
内容
功能
参数
就是
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
澄海有做软件开发吗
服务器电脑都用什么主板
广东安卓软件开发咨询
服务器放置问题
石家庄新航帆网络技术
黑客网络攻防及网络安全实战
大华软件开发面试
徐州网络安全审计系统咨询品牌
汕头软件开发哪家强
asp 数据库 div
青岛适合从事软件开发工作吗
单县员工诚信积分管理软件开发
南丰软件开发项目管理在线咨询
微服务无法查询数据库的原因
js数据库签到表设计
Python转行网络安全
实时数据类数据库
软件开发一般问什么问题
西安 网络安全专业就业前景
中职计算机网络技术实验报告
数据库 非活动连接
腾讯云服务器和域名在哪里
资源池网络安全建设论文
刚开始怎么玩mc服务器
属于数据库管理软件的是
个人网络存储服务器软件
服务器配置网关生产厂家
数据库如何删除隐藏空间
软件开发驻场人员协议模板
腾讯云服务器宝塔协议