shell正则表达式
Shell脚本扩展
一 正确表达式
正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。
1. 支持的命令:
grep、vim、find、awk、sed等。
1、.代表任意单个字符, 如:/l..e/与包含一个l,后跟两个字符,然后跟一个e的行相匹配
检索wang.txt文件中匹配s字符的。
2、^代表行的开始。 ^love 如:与所有love开头的行匹配
检索wang.txt文件中以N开头的。
3、$代表行的结束。love$ 如:与所有love结尾的行匹配
那么'^$' 就表示空行
通配符
检索wang.txt文件中匹配小写字母a到z之间的。
注意:
[abc]表示匹配单个字符a或b或c
[123]表示匹配单个字符1或2或3
[A-Z]表示匹配大写字母A-Z之间一个
[^a]表示取反,匹配除去小写字母a的。
5、* 用于修饰前导字符,表示前导字符出现0次或任意多次
检索wang.txt文件中出现0次或多次T的
6、\? 用于修饰前导字符,表示前导字符出现0或1次
7、\+ 用于修饰前导字符,表示前导字符出现1或多次
8、\{n,m\} 用于修饰前导字符,表示前导字符出现n至m次 (n和m都是整数,且n
表示前导字符出现n至m次;
n/m为整数,并且m>n;
其他形式:
\{n\}连续的n个前导字符;
\{n,\}连续的至少n个前导字符;
检索wang.txt文件中出现2至4个n的
9、\ 用于转义紧跟其后的单个特殊字符,使该特殊字符成为普通字符
检索wang.txt文件中含有.的。
10、|表示或 如: a|b|c 匹配a或b或c。如:grep|sed匹配grep或sed
检索wang.txt文件中含有a或b的。
11、(),将部分内容合成一个单位组,比如 要搜索 glad 或 good 可以如下 'g(la|oo)d'
二、grep命令的用法
参数:
1. -A NUM,--after-context=NUM 除了列出符合行之外,并且列出后NUM行。
列出chai.txt文件中Tom行与后俩行
2. -B NUM,--before-context=NUM 与 -A NUM 相对,但这此参数是显示除符合行之外并显示在它之前的NUM行。
列出chai.txt文件中Tom行与前俩行。
3、 -C [NUM], -NUM, --context[=NUM] 列出符合行之外并列出上下各NUM行,默认值是2。
列出chai.txt文件中Tom行与前后俩行。
4、 -c, --count 不显示符合样式行,只显示符合的总行数。若再加上-v,--invert-match,参数显示不符合的总行数
列出chai.txt文件中含有Tom的行数;
列出chai.txt文件中不含有Tom的行数。
5、-i,--ignore-case 忽略大小写差别
列出chai.txt文件中含有tom(大小写)的行。
6、-n,--line-number 在匹配的行前面打印行号
列出chai.txt文件中含有tom(大小写)的行,并且打印出行号。
7、-v,--revert-match 反检索,只显示不匹配的行
列出chai.txt文件中不含有tom的行。
8、精确匹配:
例如在抽取字符串" 48",返回结果包含诸如484和483等包含"48"的其他字符串,实际上应精确抽取只包含48的各行。
精确列出chai.txt文件中含有30的行。
9、-s 不显示不存在或无匹配文本的错误信
xin.txt文件不存在,检索时候提示搜索不到的错误信息,
如果不要错误信息提示,则加上-s。
三、sed命令的用法
1sed是一种在线编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,称为"模式空间"(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。
2把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。
3文件内容并没有改变,除非你使用重定向存储输出。
1.替换: s命令
1.1 基本用法
把chai.txt中The替换成chai,输出到aaa.txt文件中。
sed 替换命令
/../../分隔符(可以用其他符合代替)
The 搜索的字符串
chai 替换的字符串
<chai.txt> 搜索的文件
aaa.txt 输出到的文件
1.2 用 & 表示匹配的字符串
有时可能会想在匹配到的字符串周围或附近加上一些字符 .
如: sed 's/abc/(abc)/'
sed 默认只替换搜索字符串的第一次出现 , 利用 /g 可以替换搜索字符串所有
如果需要对同一文件或行作多次修改,可以使用 "-e" 选项
3.删除行:d命令
从某文件中删除包含 "how" 的所有行
将passwd内容显示并打印行号,同时删除2到5行。
nl命令在linux系统中用来计算文件中行号。nl 可以将输出的文件内容自动的加上行号。
4.增加行:a命令(在指定的行后新增)或i命令(在指定的行前新增)
a的后面可以接字符串,而这些字符串会在新的一行出现
在/etc/passwd的第二行后增加"XXXXX"字样的新行
将passwd内容显示并打印行号,同时在第二行后新增hello。
将passwd内容显示并打印行号,同时在第二行前新增hello。
如果要同时新增多行,则每行之间要用反斜杠\来进行新行的添加
5、取代行:c命令
c的后面可以接字符串,这些字符串可以取代n1,n2之间的行
取代行
将passwd内容显示并打印行号,同时取代2到5行间内容。
6、打印:p命令
sed '/north/p' datafile 默认输出所有行,找到north的行重复打印
仅列出passwd文件中的第5到7行内容。
sed 的-i选项可以直接修改文件中的内容
6.扩展:
调用sed有三种方式:
l 在命令行键入命令
l 将sed命令插入脚本文件,然后调用sed
l 将sed命令插入脚本文件,并使sed脚本可执行。
A、 使用sed命令行格式为:
sed [选项] sed命令 输入文件。
记住在命令行使用sed命令时,实际命令要加单引号。sed也允许加双引号。
B、使用sed脚本文件,格式为:
sed [选项] -f sed脚本文件 输入文件
C、要使用第一行具有sed命令解释器的sed脚本文件,其格式为:
sed脚本文件 [选项] 输入文件
第一行是sed命令解释行。脚本在这一行查找sed以运行命令,这里定位在/bin。
第二行以/company/开始,这是附加操作起始位置。a\通知sed
是一个附加操作,首先应插入二个新行。
第三、四行是附加操作要加入到拷贝的实际文本。