千家信息网

正则sed/awk的用法

发表于:2024-11-27 作者:千家信息网编辑
千家信息网最后更新 2024年11月27日,*sed可以实现一些grep的功能,但是稍微麻烦了一些,sed的强项在于删除文件中的内容和替换sed实现grep检索功能:1.根据关键字检索:[root@localhost ~]# sed -n '/
千家信息网最后更新 2024年11月27日正则sed/awk的用法

*sed可以实现一些grep的功能,但是稍微麻烦了一些,sed的强项在于删除文件中的内容和替换

sed实现grep检索功能:

1.根据关键字检索:

[root@localhost ~]# sed -n '/root/'p passwd.txt 

*使用sed检索时需要在关键字前加-n参数,关键字后加p,关键词还需要用 // 包括起来

2.关键字有特殊符号时加上 -r 参数或使用脱义符

[root@localhost ~]# sed -nr '/o+t/'p passwd.txt 

3.打印指定行:(打印指定行时直接写行号即可,不需要加//符号括起来)

[root@localhost ~]# sed -n '5'p passwd.txt [root@localhost ~]# sed -n '5,$'p passwd.txt   #打印第五行至最后一行

4.-e 参数:使用多个表达式:

[root@localhost ~]# sed -e '1'p -e '/root/'p -n passwd.txt 

*打印第一行内容并检索包含root的行,如果第一行同时包含root,那么第一行会被打印两次

5.不区分大小写:(加上大写的i)

[root@localhost ~]# sed -n '/testword/'Ip passwd.txt 

sed删除功能:

1.删除打印结果中指定的行:

[root@localhost ~]# wc -l passwd.txt 22 passwd.txt#查看文件行数[root@localhost ~]# sed '1,20'd passwd.txt chrony:x:998:996::/var/lib/chrony:/sbin/nologinlinux01:x:1000:1000::/home/linux01:/bin/bash#删除第1-20行,打印剩余的行[root@localhost ~]# wc -l passwd.txt 22 passwd.txt#该操作不会真实删除文件内容,只是删除打印结果

2.-i 参数:删除文件中指定的行(加上 -i参数后会真实删除文件内容)

[root@localhost ~]# wc -l passwd.txt 22 passwd.txt[root@localhost ~]# sed -i '1,20'd passwd.txt [root@localhost ~]# wc -l passwd.txt 2 passwd.txt

*用于在删除大日志文件内容时比较常用

sed替换功能:

1.根据关键字替换:

[root@localhost ~]# cat passwd.txt chrony:x:998:996::/var/lib/chrony:/sbin/nologinlinux01:x:1000:1000::/home/linux01:/bin/bash[root@localhost ~]# sed 's/chrony/sed_test/g' passwd.txt sed_test:x:998:996::/var/lib/sed_test:/sbin/nologinlinux01:x:1000:1000::/home/linux01:/bin/bash

*格式: 's/ 被替换关键字 / 替换内容 /g'

2.特殊符号匹配时加 -r 参数:

[root@localhost ~]# cat passwd.txt nnnnny:x:998:996::/var/lib/chronwy:/sbin/nologinlinux01:x:1000:1000::/home/linux01:/bin/bash[root@localhost ~]# sed -r 's/n+y/sed_test/g' passwd.txt sed_test:x:998:996::/var/lib/chronwy:/sbin/nologinlinux01:x:1000:1000::/home/linux01:/bin/bash

3.分段替换位置:

[root@localhost ~]# cat passwd.txt nnnnny:x:998:996::/var/lib/chronwy:/sbin/nologinlinux01:x:1000:1000::/home/linux01:/bin/bash[root@localhost ~]# sed -r 's/([^:]+):(.*):([^:]+)/\3:\2:\1/g' passwd.txt /sbin/nologin:x:998:996::/var/lib/chronwy:nnnnny/bin/bash:x:1000:1000::/home/linux01:linux01

*使用冒号分割为3段,将第三段和第一段位置互换

4.配置关键词为目录路径时加上脱义符或使用其他替换符号:

[root@localhost ~]# cat passwd.txt nnnnny:x:998:996::/var/lib/chronwy:/sbin/nologinlinux01:x:1000:1000::/home/linux01:/bin/bash[root@localhost ~]# sed 's/\/bin\/bash/AAAAAAA/g' passwd.txt nnnnny:x:998:996::/var/lib/chronwy:/sbin/nologinlinux01:x:1000:1000::/home/linux01:AAAAAAA[root@localhost ~]# sed 's#/bin/bash#AAAAAAA#g' passwd.txt nnnnny:x:998:996::/var/lib/chronwy:/sbin/nologinlinux01:x:1000:1000::/home/linux01:AAAAAAA

5.删除所有字母:

[root@localhost ~]# cat passwd.txt nnnnny:x:998:996::/var/lib/chronwy:/sbin/nologinlinux01:x:1000:1000::/home/linux01:/bin/bash[root@localhost ~]# sed 's/[a-zA-Z]//g' passwd.txt ::998:996::///://01::1000:1000:://01://

6.在每行前添加内容:

[root@localhost ~]# cat passwd.txt nnnnny:x:998:996::/var/lib/chronwy:/sbin/nologinlinux01:x:1000:1000::/home/linux01:/bin/bash[root@localhost ~]# sed -r 's/.*/sed_test:&/g' passwd.txt sed_test:nnnnny:x:998:996::/var/lib/chronwy:/sbin/nologinsed_test:linux01:x:1000:1000::/home/linux01:/bin/bash

*匹配每行所有内容:.*,&符号代表.*的内容

7.真实替换文件中的内容:-i 参数(以上6条示例都不会实际更改文件内容,只更改替换完成的打印输出结果)

[root@localhost ~]# cat passwd.txt nnnnny:x:998:996::/var/lib/chronwy:/sbin/nologinlinux01:x:1000:1000::/home/linux01:/bin/bash[root@localhost ~]# sed -i 's/.*/sed_test:&/g' passwd.txt [root@localhost ~]# cat passwd.txt sed_test:nnnnny:x:998:996::/var/lib/chronwy:/sbin/nologinsed_test:linux01:x:1000:1000::/home/linux01:/bin/bash

补充:
把每个单词的第一个小写字母变大写:
sed 's/\b[a-z]/\u&/g' filename

把所有小写变大写:
sed 's/[a-z]/\u&/g' filename

大写变小写:
sed 's/[A-Z]/\l&/g' filename

sed在某一行最后添加一个数字
sed -r 's/(^a.*)/\1 12/' test
sed -r 's/^a.*/& 12/' test

打印1到100行含某个字符串的行
sed -n '1,100{/abc/p}' 1.txt


*awk相比grep/egrep/sed的功能更加强大,默认支持拓展正则表达式,grep需要加 -E 参数,sed需要加 -r 参数

1.分割文件内容打印指定段数:

[root@localhost ~]# cat test.txt zhangsan 100lisi     92wangwu   95user1    88user2    93[root@localhost ~]# awk '{print $1}' test.txt zhangsanlisiwangwuuser1user2

*默认以空格为分隔符,$指定打印的段数

2.-F参数:指定分隔符:

[root@localhost ~]# cat passwd.txt AAAA:sed_test:nnnnny:x:998:996::/var/lib/chronwy:/sbin/nologinAAAA:sed_test:linux01:x:1000:1000::/home/linux01:/bin/bash[root@localhost ~]# awk -F ':' '{print $3}' passwd.txt nnnnnylinux01#打印多段时用逗号区分[root@localhost ~]# awk -F ':' '{print $1,$3}' passwd.txt AAAA nnnnnyAAAA linux01#指定打印结果中段与段的分割符号[root@localhost ~]# awk -F ':' '{print $1"-->"$3}' passwd.txt AAAA-->nnnnnyAAAA-->linux01

*awk {print $0}表示打印所有,相当于cat

3.awk检索:(相当于grep)

[root@localhost ~]# cat passwd.txt AAAA:sed_test:nnnnny:x:998:996::/var/lib/chronwy:/sbin/nologinAAAA:sed_test:linux01:x:1000:1000::/home/linux01:/bin/bash[root@localhost ~]# awk '/nnn/' passwd.txt AAAA:sed_test:nnnnny:x:998:996::/var/lib/chronwy:/sbin/nologin

4.检索指定段中包含关键字的行:

[root@localhost ~]# cat passwd.txt ABCD:sed_test:nnnnny:x:998:996::/var/lib/chronwy:/sbin/nologinAAAA:sed_test:linux01:x:1000:1000::/home/linux01:/bin/bash[root@localhost ~]# awk -F ':' '$1 ~/AAA/' passwd.txt AAAA:sed_test:linux01:x:1000:1000::/home/linux01:/bin/bash

5.多个表达式组合使用:

[root@localhost ~]# cat passwd.txt ABCD:sed_test:nnnnny:x:998:996::/var/lib/chronwy:/sbin/nologinAAAA:sed_test:linux01:x:1000:1000::/home/linux01:/bin/bash[root@localhost ~]# awk -F ':' '/linux/ {print $1,$3} /nnn/ {print $2,$3}' passwd.txt sed_test nnnnnyAAAA linux01

*打印包含linux关键字的行的第1和第3段,打印包含nnn关键字的第2和第3段

6.检索多个关键词的行并指定打印段:

[root@localhost ~]# cat passwd.txt ABCD:sed_test:nnnnny:x:998:996::/var/lib/chronwy:/sbin/nologinAAAA:sed_test:linux01:x:1000:1000::/home/linux01:/bin/bash[root@localhost ~]# awk -F ':' '/linux|nnn/ {print $1}'  passwd.txt ABCDAAAA

7.通过运算符号检索:

[root@localhost ~]# cat passwd.txt ABCD:sed_test:nnnnny:x:998:996::/var/lib/chronwy:/sbin/nologinAAAA:sed_test:linux01:x:1000:1000::/home/linux01:/bin/bash[root@localhost ~]# awk -F ':' '$5==1000' passwd.txt AAAA:sed_test:linux01:x:1000:1000::/home/linux01:/bin/bash[root@localhost ~]# awk -F ':' '$5==1000 {print $1}' passwd.txt AAAA

8.针对数字判断时,不加双引号,否则判断条件会被当做字符串而不是数字(数字当做字符串判断时,根据ASCII码判断,998大于1000):

[root@localhost ~]# cat passwd.txt ABCD:sed_test:nnnnny:x:998:996::/var/lib/chronwy:/sbin/nologinAAAA:sed_test:linux01:x:1000:1000::/home/linux01:/bin/bash[root@localhost ~]# awk -F ':' '$5<1000' passwd.txt ABCD:sed_test:nnnnny:x:998:996::/var/lib/chronwy:/sbin/nologin#加上双引号后1000被当做了字符串,而不是数字[root@localhost ~]# awk -F ':' '$5<"1000"' passwd.txt [root@localhost ~]# 

9.字符串判断:(判断字符串时判断条件加上双引号)

[root@localhost ~]# cat passwd.txt ABCD:sed_test:nnnnny:x:998:996::/var/lib/chronwy:/sbin/nologinAAAA:sed_test:linux01:x:1000:1000::/home/linux01:/bin/bash[root@localhost ~]# awk -F ':' '$9!="/sbin/nologin"' passwd.txt AAAA:sed_test:linux01:x:1000:1000::/home/linux01:/bin/bash

10.两个字段之间比较和多个条件检索:

[root@localhost ~]# cat passwd.txt ABCD:sed_test:nnnnny:x:998:996::/var/lib/chronwy:/sbin/nologinAAAA:sed_test:linux01:x:1000:1000::/home/linux01:/bin/bash[root@localhost ~]# awk -F ':' '$5>$6' passwd.txt  ABCD:sed_test:nnnnny:x:998:996::/var/lib/chronwy:/sbin/nologin[root@localhost ~]# awk -F ':' '$5>$6 {print $5,$6}' passwd.txt  998 996[root@localhost ~]# awk -F ':' '$5>999' passwd.txt  AAAA:sed_test:linux01:x:1000:1000::/home/linux01:/bin/bash[root@localhost ~]# awk -F ':' '$5>900 && $6<999' passwd.txt  ABCD:sed_test:nnnnny:x:998:996::/var/lib/chronwy:/sbin/nologin[root@localhost ~]# awk -F ':' '$5>999 || $9=="/sbin/nologin"' passwd.txt  ABCD:sed_test:nnnnny:x:998:996::/var/lib/chronwy:/sbin/nologinAAAA:sed_test:linux01:x:1000:1000::/home/linux01:/bin/bash

*最后一种字符串判断除了用==符号还可以用~检索

11.OFS:指定打印结果分隔符:

[root@localhost ~]# cat passwd.txt ABCD:sed_test:nnnnny:x:998:996::/var/lib/chronwy:/sbin/nologinAAAA:sed_test:linux01:x:1000:1000::/home/linux01:/bin/bash[root@localhost ~]# awk -F ':' '{OFS="***"} {print $1,$2,$3}' passwd.txt  ABCD***sed_test***nnnnnyAAAA***sed_test***linux01[root@localhost ~]# awk -F ':' '{OFS="***"} $5<1000 {print $1,$2,$3}' passwd.txt  ABCD***sed_test***nnnnny

12.NR:在每行前面显示行数:

[root@localhost ~]# cat passwd.txt ABCD:sed_test:nnnnny:x:998:996::/var/lib/chronwy:/sbin/nologinAAAA:sed_test:linux01:x:1000:1000::/home/linux01:/bin/bash[root@localhost ~]# awk -F ':' '{print NR":" $0}' passwd.txt 1:ABCD:sed_test:nnnnny:x:998:996::/var/lib/chronwy:/sbin/nologin2:AAAA:sed_test:linux01:x:1000:1000::/home/linux01:/bin/bash

13.NF:在每行前面显示段数:

[root@localhost ~]# awk -F ':' '{print NF":" $0}' passwd.txt 9:ABCD:sed_test:nnnnny:x:998:996::/var/lib/chronwy:/sbin/nologin9:AAAA:sed_test:linux01:x:1000:1000::/home/linux01:/bin/bash

14.根据行数或者段数显示指定的行:
1)显示行号小于2的行:

[root@localhost ~]# awk -F ':' '{print NR":" $0}' passwd.txt 1:ABCD:sed_test:nnnnny:x:998:996::/var/lib/chronwy:/sbin/nologin2:AAAA:sed_test:linux01:x:1000:1000::/home/linux01:/bin/bash[root@localhost ~]# awk 'NR<2' passwd.txt ABCD:sed_test:nnnnny:x:998:996::/var/lib/chronwy:/sbin/nologin

2)显示前10行并且第一段为AAAA的行:

[root@localhost ~]# awk -F ':' 'NR<10 && $1 ~/AAAA/' passwd.txt AAAA:sed_test:linux01:x:1000:1000::/home/linux01:/bin/bash

15.=和==的区别:(==是匹配相等的数字或字符串,=是赋值)

[root@localhost ~]# cat passwd.txt ABCD:sed_test:nnnnny:x:998:996::/var/lib/chronwy:/sbin/nologinAAAA:sed_test:linux01:x:1000:1000::/home/linux01:/bin/bash[root@localhost ~]# awk -F ":" '$1=="ABCD"' passwd.txt ABCD:sed_test:nnnnny:x:998:996::/var/lib/chronwy:/sbin/nologin[root@localhost ~]# awk -F ":" '$1="hello"' passwd.txt hello sed_test nnnnny x 998 996  /var/lib/chronwy /sbin/nologinhello sed_test linux01 x 1000 1000  /home/linux01 /bin/bash

16.求和:

[root@localhost ~]# cat passwd.txt ABCD:sed_test:nnnnny:x:998:996::/var/lib/chronwy:/sbin/nologinAAAA:sed_test:linux01:x:1000:1000::/home/linux01:/bin/bash[root@localhost ~]# awk -F ':' '{(tot=tot+$5)}; END {print tot}' passwd.txt 1998

补充:

. 表示任意1个字符

* a b o 前面的这个字符有0或者多个
abc* ===> ab、abccc

.* 贪婪匹配

? 扩展正则 表示:?前面的字符有0个或1个
a1? ==> a or a1

+ 扩展正则 表示:+前面的字符有1个或多个

| 扩展正则 表示:或者
egrep 'abc|123' 1.txt

[ ] 表示方括号里面的1个字符
[a-zA-Z0-9] 表示所有大小写字母和数字
[abc] 表示a或b或c
[a|@] 表示a或|或@
[^] 表示非,取反

^ 表示开头

$ 表示结尾

{ } 表示范围
a{1,5} ===> a或aa或aaa或aaaa或aaaaa
b{3} ===> bbb

( ) 小括号里面的字符看成一个整体
(abc){2} ==》 abcabc
(abc)+ ==>abc或abcabc或abc*n
abc{2} ==> abcc

扩展正则符号: ? + | { } 使用时grep -E 、sed -r

字符 关键 内容 参数 检索 关键字 文件 符号 字符串 数字 多个 正则 一行 功能 结果 大写 关键词 分隔符 字母 小写 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 商品条形码数据库下载 河北回收服务器门店虚拟主机 北京房保互联网科技有限公司 数据库的4个特点阶段 密云区品牌网络技术推广排名靠前 广州番禺节能科技园互联网公司 指尖闽心网络技术有限公司 csgo怎么选上海服务器 软件开发能效度量指标 计算机应用跟网络技术差别 数据库技术总监 数据库实验三数据的更新实验报告 数据库技术调查报告 数据库考试 无锡软件开发培训班 灵武软件开发公司 科技创新是“互联网 ” 计算机网络技术示范特色 软件开发的面试评价 数据库怎么输入成绩均分 大数据软件开发工程师学费多少 方舟服务器不出来 vs无法连接sql数据库 英国好的电脑软件开发学校 上海农林软件开发 数据库查询教师表sql表示什么 计算机网络技术学习的内容 网络技术公司的证书 中国的网络技术现在的发展 计算机网络技术要做什么
0