正则表达式和grep
正则表达式分为两类:基本正则表达式和扩展正则表达式。
基本正则表达式元字符:
字符匹配:
.:匹配任意一个字符。
[]:匹配[]中指定范围内的任意一个字符。
[^]:指定范围外的任意一个字符;也可以得知,在[]括号内,^表示取反。
次数匹配:
*:其前面字符出现任意次。
\?:其前字符出现0或1次;
\{m,n}:其前字符出现最少m次,最多出现n次。如果没有上限,n可不写,若至少出现0次,m为0.既m不可省略。
.*:其前出现任意长度的任意字符。
字符牟定:
^:行首牟定。
&:行尾牟定。
\< 或 \b:牟定单词在行首
\> 或 \b:牟定单词在行尾
\(\):用于分组。后向引用:\1,\2,\3 ...表示引用第n对小括号内的内容
grep:则支持使用基本正则表达式定义的模式来过滤文本的命令。
-i:忽略匹配字母的大小写;
-v:反向匹配,显示为匹配的内容
-o:只显示匹配到的内容
--color:颜色显示
-E=eprep:使用扩展正则进行匹配。
-A 数字、-B 数字、-C 数字:-A(after)表示不止显示匹配行,同时显示匹配到的后面N行。-B(before)表示同时显示匹配前N行,-C表示同时显示前N行和后N行
更多选项用man 进行查看。
说明一下,基本正则表达式工作在贪婪模式下。
扩展正则表达式
字符匹配,位置牟定:与基本正则相同
.
[]
[^]
次数匹配:
*:与基本正则相同,其前面字符出现任意次。
?:与基本正则相同,其前字符出现0或1次;
+:多了一个 + 表示匹配其前字符至少一次。相当于\{1,\} ?+=*
{m,n}:扩展正则中不需要使用\进行转意
分组与
():分组
\1,\2,\3 ... 后向引用
或者
| :|前后各为一个整体。例如 abc|dec:表示abc 或者 dec.可使用 egrep --color 进行验证。若要表示c 或者d 可是要(),ab(c|d)ec