千家信息网

正则表达式和grep

发表于:2024-10-01 作者:千家信息网编辑
千家信息网最后更新 2024年10月01日,正则表达式分为两类:基本正则表达式和扩展正则表达式。基本正则表达式元字符:字符匹配:.:匹配任意一个字符。[]:匹配[]中指定范围内的任意一个字符。[^]:指定范围外的任意一个字符;也可以得知,在[]
千家信息网最后更新 2024年10月01日正则表达式和grep

正则表达式分为两类:基本正则表达式和扩展正则表达式。


基本正则表达式元字符:

字符匹配:

.:匹配任意一个字符。

[]:匹配[]中指定范围内的任意一个字符。

[^]:指定范围外的任意一个字符;也可以得知,在[]括号内,^表示取反。


次数匹配:

*:其前面字符出现任意次。

\?:其前字符出现0或1次;

\{m,n}:其前字符出现最少m次,最多出现n次。如果没有上限,n可不写,若至少出现0次,m为0.既m不可省略。

.*:其前出现任意长度的任意字符。


字符牟定:

^:行首牟定。

&:行尾牟定。

\< 或 \b:牟定单词在行首

\> 或 \b:牟定单词在行尾

\(\):用于分组。后向引用:\1,\2,\3 ...表示引用第n对小括号内的内容

grep:则支持使用基本正则表达式定义的模式来过滤文本的命令。

-i:忽略匹配字母的大小写;

-v:反向匹配,显示为匹配的内容

-o:只显示匹配到的内容

--color:颜色显示

-E=eprep:使用扩展正则进行匹配。

-A 数字、-B 数字、-C 数字:-A(after)表示不止显示匹配行,同时显示匹配到的后面N行。-B(before)表示同时显示匹配前N行,-C表示同时显示前N行和后N行

更多选项用man 进行查看。

说明一下,基本正则表达式工作在贪婪模式下。



扩展正则表达式

字符匹配,位置牟定:与基本正则相同

.

[]

[^]

次数匹配:

*:与基本正则相同,其前面字符出现任意次。

?:与基本正则相同,其前字符出现0或1次;

+:多了一个 + 表示匹配其前字符至少一次。相当于\{1,\} ?+=*

{m,n}:扩展正则中不需要使用\进行转意

分组与

():分组

\1,\2,\3 ... 后向引用

或者

| :|前后各为一个整体。例如 abc|dec:表示abc 或者 dec.可使用 egrep --color 进行验证。若要表示c 或者d 可是要(),ab(c|d)ec



0