怎样在python中使用正则表达式
发表于:2025-02-13 作者:千家信息网编辑
千家信息网最后更新 2025年02月13日,本篇文章为大家展示了怎样在python中使用正则表达式,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字
千家信息网最后更新 2025年02月13日怎样在python中使用正则表达式
本篇文章为大家展示了怎样在python中使用正则表达式,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。
正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。
Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式。
re 模块使 Python 语言拥有全部的正则表达式功能。
compile 函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换。
re 模块也提供了与这些方法功能完全一致的函数,这些函数使用一个模式字符串做为它们的第一个参数。
python正则表达式的使用(实验代码),具体代码如下所示:
import redata='''12345 2019-05-20 13:30:04,102 E:/PythonProject/accountReport-20190520/createReport_20190520.py(164): [INFO]start=24h-ago&m=sum:zscore.keys{compared=week,redis=6380,endpoint=192.168.8.11_Redis-b}2019-05-20 13:30:04,133 E:/PythonProject/accountReport-20190520/createReport_20190520.py(164): [INFO]start=24h-ago&m=sum:keys{redis=6380,endpoint=192.168.8.120_Redis-sac-a}'''# 1.1)非编译正则表达式的使用def re_nocompile(): pattern="report" #匹配时间格式 r=re.findall(pattern,data,flags=re.IGNORECASE) # findall方法 返回字符串 print(r)# 1.2) 编译的正则表达式的使用(效率高)def re_compile(): pattern = "[0-9]{1,2}\:[0-9]{1,2}\:[0-9]{1,2}" # 匹配时间格式 re_obj=re.compile(pattern) #创建一个对象 r=re_obj.findall(data) # findall方法 返回字符串 print(r)# 2.1)"匹配" 类函数的使用 findall、 match、search、finditerdef re_match(): pattern = "\d+" # 匹配数字 r=re.match(pattern,data) #match 函数是匹配字符串的开头,类似startwith if r: # 使用match匹配成功后,返回SRE_MATCH类型的对象,该对象包含了相关模式和原始字符串,包括起始位置和结束位置 print(r) print(r.start()) print(r.end()) print(r.string) print(r.group()) # group()用来提出分组截获的字符串。group() 同group(0)就是匹配正则表达式整体结果。 # group(1) 列出第一个括号匹配部分,group(2) 列出第二个括号匹配部分,group(3) 列出第三个括号匹配部分。 # 当然正则表达式中没有括号,group(1)肯定不对了 print(r.re) else: # match如果匹配不到,返回None print("False")def re_search(): pattern = "[0-9]{1,2}\:[0-9]{1,2}\:[0-9]{1,2}" # 匹配时间格式 r=re.search(pattern,data) # search方法是全部位置的匹配,返回SRE_MATCH对象 print(r) print(r.start()) #起始位置 print(r.end()) #结束位置 # finditer返回一个迭代器def re_finditer(): pattern = "\d+" # 匹配数字 r=re.finditer(pattern,data) for i in r: print(i.group())# 贪婪匹配:总是匹配最长的那个字符串(默认)# 非贪婪匹配:总是匹配最短的那个字符串(在匹配字符串时加上?来实现)def re_find02(): r1=re.findall("Python.*\.",data) # 贪婪匹配 print(r1) r2 = re.findall("Python.*?\.", data) #非贪婪匹配 print(r2)if __name__=="__main__": re_nocompile() re_compile() re_match() re_search() re_finditer() re_find02()import reimport requestsdata='''12345 2019-05-20 13:30:04,102 E:/PythonProject/accountReport-20190520/createReport_20190520.py(164): [INFO]start=24h-ago&m=sum:zscore.keys{compared=week,redis=6380,endpoint=192.168.8.11_Redis-b}2019-05-20 13:30:04,133 E:/PythonProject/accountReport-20190520/createReport_20190520.py(164): [INFO]start=24h-ago&m=sum:keys{redis=6380,endpoint=192.168.8.120_Redis-sac-a}'''# 1)"修改类"函数# 1.1) sub函数进行匹配并替换,返回替换后的字符串def re_sub(): pattern = "[0-9]{1,2}\:[0-9]{1,2}\:[0-9]{1,2}" # 匹配时间格式 data01=re.sub(pattern,"timeString",data) print(data01)# 1.2)splite将字符串拆成子串列表,可以同时指定多个分隔符def re_split(): r=re.split(r"[:\-\=]",data.strip("'")) print(r)# 2)匹配html的一个例子def re_html(): r=requests.get("https://www.hao123.com/") print(r.content) try: web=re.findall("(https:.*?.com)",str(r.content)) print(web) except Exception as err: print(err)if __name__=="__main__": re_sub() re_split() re_html()
上述内容就是怎样在python中使用正则表达式,你们学到知识或技能了吗?如果还想学到更多技能或者丰富自己的知识储备,欢迎关注行业资讯频道。
字符
字符串
正则
表达式
函数
对象
位置
方法
模式
贪婪
括号
时间
格式
模块
部分
代码
内容
功能
参数
就是
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
网络安全共同
企业打印服务器
机械设计答案软件开发
RNA的数据库
宁波软件开发培训班哪家好
网络安全为人民小知识
荣耀体验服务器
网络技术计划的特点
横岗租房软件开发
如何给服务器加上队列
计算机初级网络技术课件
csgo连接到官方服务器失败
广州乐玩软件开发公司
四川销售软件开发
wifi控制软件开发
公司系统软件开发功能
电脑找不到ip服务器
数据库的文档
浙江省网络安全人才
数据库更新数据的指令
七日杀服务器越玩越卡
寻找软件开发商
睿牛网络技术有限公司
云主机和服务器
系统软件开发验收意见
数据库技术组成
地理数据库名称缩写代表的含义
观察现有数据库的逻辑结构
使用服务器管理器可以
杭州数字化智慧学校软件开发