导航：首页 > 服务器 >

Shell脚本三剑客——Grep（进阶版egrep）、Sed、Awk命令

发表于：2024-12-13 作者：千家信息网编辑

千家信息网最后更新 2024年12月13日，Grep命令1、基本正则表达式实例--查找特定字符这里我们就以存放本机所有用户的/etc/passwd文件做实例Demo1[root@localhost ~]# grep -n "root" /etc

千家信息网最后更新 2024年12月13日Shell脚本三剑客——Grep（进阶版egrep）、Sed、Awk命令

Grep命令

1、基本正则表达式实例--查找特定字符

这里我们就以存放本机所有用户的/etc/passwd文件做实例

Demo1

[root@localhost ~]# grep -n "root" /etc/passwd      //-n表示显示行号1:root:x:0:0:root:/root:/bin/bash10:operator:x:11:0:operator:/root:/sbin/nologin

2、基本正则表达式实例--查找集合字符

有重复的字符时，可使用"[ ]"来进行集合匹配，每次只匹配"[ ]"中的一个字符。

Demo2

[root@localhost ~]# grep -n "[fn]tp" /etc/passwd12:ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin27:ntp:x:38:38::/etc/ntp:/sbin/nologin

3、基本正则表达式实例--反向选择

在"[ ]"中括号中添加"^"表示进行反向选择（有一定的基础的朋友肯定知道"^[ ]"表示定位行首，这里"^"内外位置意思将完全不同。）

Demo3

[root@localhost ~]# grep -n "^[^root]" /etc/passwd       //匹配除了以root开头的所有选项2:bin:x:1:1:bin:/bin:/sbin/nologin3:daemon:x:2:2:daemon:/sbin:/sbin/nologin......42:named:x:25:25:Named:/var/named:/sbin/nologin

4、基本正则表达式实例--转义符

在正则表达式中一个元字符，所以在这里需要用转义字符"\"将具有特殊意义的字符转化成普通字符。

Demo4

[root@localhost ~]# grep -n '\.$' test.txt 1:he was short and fat.2:He was wearing a blue polo shirt with black pants. 3:The home of Football on BBC Sport online.5:google is the best tools for search keyword.

5、基本正则表达式实例--查找任一字符&查找重复字符

在正则表达式中小数点（.）也是一个元字符，代表任意一个字符。

Demo5-1

[root@localhost ~]# grep -n "r..t" /etc/passwd        //（.）小数点这里代表任一字符1:root:x:0:0:root:/root:/bin/bash10:operator:x:11:0:operator:/root:/sbin/nologin12:ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin

在上述结果中，"root"字符串"r..t"匹配规则。若想要查询 oo、ooo、ooooo 等资料，则需要使用星号（*）元字符。但需要注意的是，"*"代表的是重复零个或多个前面的单字符。"o*"表示拥有零个（即为空字符）或大于等于一个"o"的字符

Demo5-2

[root@localhost ~]# grep -n "oo*" /etc/passwd1:root:x:0:0:root:/root:/bin/bash2:bin:x:1:1:bin:/bin:/sbin/nologin3:daemon:x:2:2:daemon:/sbin:/sbin/nologin4:adm:x:3:4:adm:/var/adm:/sbin/nologin5:lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin......

6、基本正则表达式实例--查找连续字符范围

例如，查找三到五个 o 的连续字符，这个时候就需要使用基础正则表达式中的限定范围的字符"{ }"。因为"{ }"在 Shell 中具有特殊意义，所以在使用"{ }"字符时，需要利用转义字符"\"，将"{ }"字符转换成普通字符。

Demo6

[root@localhost ~]# grep -n "0\{2,\}" /etc/passwd       //表示中间包含2以上o的字符串11:games:x:12:100:games:/usr/games:/sbin/nologin41:zhy:x:1000:1000:zhy:/home/zhy:/bin/bash

Egrep命令

此外，grep 命令仅支持基础正则表达式，如果使用扩展正则表达式，需要使用 egrep 或 awk 命令。awk 命令在后面的进行讲解，这里我们直接使用 egrep 命令。egrep 命令与 grep 命令的用法基本相似。（grep命令能用的egrep命令同样能够使用）

扩展正则表达式元字符	作用
+	作用：重复一个或者一个以上的前一个字符
？	作用：零个或者一个的前一个字符
\|	作用：使用或者（or）的方式找出多个字符
（）	作用：查找"组"字符串
（）+	作用：辨别多个重复的组

Demo演示

[root@localhost ~]# egrep -n "10+" /etc/passwd             //使用"+"扩展元字符11:games:x:12:100:games:/usr/games:/sbin/nologin31:qemu:x:107:107:qemu user:/:/sbin/nologin41:zhy:x:1000:1000:zhy:/home/zhy:/bin/bash[root@localhost ~]# egrep -n "10?" /etc/passwd             //使用"？"扩展元字符2:bin:x:1:1:bin:/bin:/sbin/nologin9:mail:x:8:12:mail:/var/spool/mail:/sbin/nologin10:operator:x:11:0:operator:/root:/sbin/nologin11:games:x:12:100:games:/usr/games:/sbin/nologin[root@localhost ~]# egrep -n 'root|zhy' /etc/passwd        //使用"|"扩展元字符1:root:x:0:0:root:/root:/bin/bash10:operator:x:11:0:operator:/root:/sbin/nologin41:zhy:x:1000:1000:zhy:/home/zhy:/bin/bash[root@localhost ~]# egrep -n '(f|n)tp' /etc/passwd        //使用"（）"扩展元字符，可与"|"一起使用12:ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin27:ntp:x:38:38::/etc/ntp:/sbin/nologin

Sed命令

sed是一个很好的文件处理工具，本身是一个管道命令，主要是以行为单位进行处理，可以将数据行进行替换、删除、新增、选取等特定工作

sed 的工作流程主要包括读取、执行和显示三个过程。

Ø 读取：sed 从输入流（文件、管道、标准输入）中读取一行内容并存储到临时的缓

冲区中（又称模式空间，pattern space）。

Ø 执行：默认情况下，所有的 sed 命令都在模式空间中顺序地执行，除非指定了行的地址，否则 sed 命令将会在所有的行上依次执行。

Ø 显示：发送修改后的内容到输出流。再发送数据后，模式空间将会被清空。

在所有的文件内容都被处理完成之前，上述过程将重复执行，直至所有内容被处理完。

注意： 默认情况下，所有的sed命令都是在模式空间中进行，并不会进行保存。

Sed命令格式

sed [选项] '操作' 参数
sed [选项] -f scriptfile 参数 // scriptfile 表示脚本文件

常用选项

-e ：表示用指定命令或者脚本来处理输入的文本文件。
-f ：表示用指定的脚本文件来处理输入的文本文件。
-h ：显示帮助。
-n：表示仅显示处理后的结果。
-i：直接编辑文本文件。

常用的"操作"参数

a：增加，在当前行下面增加一行指定内容。
c：替换，将选定行替换为指定内容。
d：删除，删除选定的行
i：插入，在选定行上面插入一行指定内容。
p：打印，其通常与"-n"选项一起使用
s：替换，替换指定字符。
y：字符转换。

基本用法实例：

输出所有，效果等同cat命令

[root@localhost ~]# sed -n 'p' /etc/passwd                //效果等同cat命令root:x:0:0:root:/root:/bin/bashbin:x:1:1:bin:/bin:/sbin/nologindaemon:x:2:2:daemon:/sbin:/sbin/nologinadm:x:3:4:adm:/var/adm:/sbin/nologin......

输出某一特定行，或者某一段行

[root@localhost ~]# sed -n '10p' /etc/passwd                   //输出第10行内容operator:x:11:0:operator:/root:/sbin/nologin[root@localhost ~]# sed -n '2,4p' /etc/passwd                 //输出2~4行内容bin:x:1:1:bin:/bin:/sbin/nologindaemon:x:2:2:daemon:/sbin:/sbin/nologinadm:x:3:4:adm:/var/adm:/sbin/nologin

输出所有奇数行

[root@localhost ~]# sed -n 'n;p' /etc/passwd                //输出奇数行，偶数行为p;nbin:x:1:1:bin:/bin:/sbin/nologinadm:x:3:4:adm:/var/adm:/sbin/nologinsync:x:5:0:sync:/sbin:/bin/synchalt:x:7:0:halt:/sbin:/sbin/halt......

同样，除了基本的使用方法，sed命令也可以结合正则表达式进行使用

输出包含特定内容的行（和grep命令一样，可以使用^、$来定位行首、行尾）

[root@localhost ~]# sed -n '/root/p' /etc/passwdroot:x:0:0:root:/root:/bin/bashoperator:x:11:0:operator:/root:/sbin/nologin

输出包含特定单词的行

[root@localhost ~]# sed -n '/\/p' /etc/passwd           //\<  \>代表单词边界root:x:0:0:root:/root:/bin/bashoperator:x:11:0:operator:/root:/sbin/nologin

替换符合条件的文本

sed 's/the/THE/' test.txt //将每行中的第一个the 替换为 THE
sed 's/l/L/3' test.txt //将每行中的第 3 个l 替换为L
sed 's/the/THE/g' test.txt //将文件中的所有the 替换为THE
sed 's/o//g' test.txt //将文件中的所有o 删除(替换为空串)
sed 's/^/#/' test.txt //在每行行首插入#：号
sed '/the/s/^/#/' test.txt //在包含the 的每行行首插入#号
sed 's/$/EOF/' test.txt //在每行行尾插入字符串EOF
sed '3,5s/the/THE/g' test.txt //将第 3~5 行中的所有the 替换为 THE
sed '/the/s/o/O/g' test.txt //将包含the 的所有行中的o 都替换为 O

将文本进行迁移

sed '/the/{H;d};$G' test.txt //将包含the 的行迁移至文件末尾,{;}用于多个操作
sed '1,5{H;d};17G' test.txt //将第 1~5 行内容转移至第 17 行后
sed '/the/w out.file' test.txt //将包含the 的行另存为文件out.file
sed '/the/r /etc/hostname' test.txt //将文件/etc/hostname 的内容添加到包含the 的每行以后
sed '3aNew' test.txt //在第 3 行后插入一个新行,内容为 New
sed '/the/aNew' test.txt //在包含the 的每行后插入一个新行,内容为 New
sed '3aNew1\nNew2' test.txt //在第 3 行后插入多行内容,中间的\n 表示换行

AWK命令

AWK 是一种用于处理文本的编程语言工具。AWK 在很多方面类似于 shell 编程语言，尽管 AWK 具有完全属于其本身的语法，是任何环境中现有的功能最强大的数据处理引擎之一。

基本结构

awk [选项] '模式或条件 {编辑命令}' 文件1 文件2 //过滤并输出匹配内容
awk -f 脚本文件文件1 文件2 //从脚本中调用，并输出

基本使用实例

[root@localhost ~]# awk -F: '{print $1,$3}' /etc/passwd//以":"作为分隔符，筛选出第一列和第三列的内容，并输出（默认情况下字段的分隔符为空格或者 tab 键）root 0bin 1daemon 2adm 3......

特殊的内建变量（可直接引入使用）

FS：指定每行文本的字段分隔符，默认为空格或制表位。
NF：当前处理的行的字段个数。
NR：当前处理的行的行号（序数）。
$0：当前处理的行的整行内容。
$n：当前处理行的第 n 个字段（第 n 列）。
FILENAME：被处理的文件名。
RS：数据记录分隔，默认为\n，即每行为一条记录。

按行对文本进行输出

[root@localhost ~]# awk 'NR==2,NR==4{print}' /etc/passwd       //输出第二行到第四行文本内容bin:x:1:1:bin:/bin:/sbin/nologindaemon:x:2:2:daemon:/sbin:/sbin/nologinadm:x:3:4:adm:/var/adm:/sbin/nologin[root@localhost ~]# awk -F ":" 'NR==2,NR==4{print $1,$3}' /etc/passwd//输出第二行到第四行的第一列和第三列内容bin 1daemon 2adm 3[root@localhost ~]# awk '(NR==1)||(NR==4){print}' /etc/passwd//输出第一行和第四行内容root:x:0:0:root:/root:/bin/bashadm:x:3:4:adm:/var/adm:/sbin/nologin

输出奇、偶行（在awk中可以使用逻辑操作符"&&"，表示"与"， "||"表示"或"，"！"表示"非"；还可以进行简单的数学运算，如+、-、*、/、%、^分别表示加、减、乘、除、取余和乘方）

[root@localhost ~]# awk 'NR%2==1{print}' /etc/passwd        //输出奇数行root:x:0:0:root:/root:/bin/bashdaemon:x:2:2:daemon:/sbin:/sbin/nologinlp:x:4:7:lp:/var/spool/lpd:/sbin/nologinshutdown:x:6:0:shutdown:/sbin:/sbin/shutdown......[root@localhost ~]# awk 'NR%2==0{print}' /etc/passwd       //输出偶数行bin:x:1:1:bin:/bin:/sbin/nologinadm:x:3:4:adm:/var/adm:/sbin/nologinsync:x:5:0:sync:/sbin:/bin/synchalt:x:7:0:halt:/sbin:/sbin/halt......

输出以root开头的行

[root@localhost ~]# awk '/^root/{print}' /etc/passwdroot:x:0:0:root:/root:/bin/bash

统计以/bin/bash结尾的行数

[root@localhost ~]# awk 'BEGIN {x=0} ; /\/bin\/bash$/{x++};END {print x}' /etc/passwd2

统计以空行分隔的文本段落数：

[root@localhost opt]# vim name.txtzhangsan:lisi:wangwuzhaoliu:liuliuheiba:heihei[root@localhost opt]# awk 'BEGIN{RS=":"};END{print NR}' /opt/name.txt5//统计规则：遇到关键符号，折行

调用w 命令,并用来统计在线用户数：

[root@localhost opt]# awk 'BEGIN {while ("w" | getline) n++;{print n-2}}'1

很赞哦！

字符命令内容文件输出处理正则表达式文本实例元字符作用脚本模式一行代表多个字段字符串数据数据库的安全要保护哪些东西数据库安全各自的含义是什么生产安全数据库录入数据库的安全性及管理数据库安全策略包含哪些海淀数据库安全审计系统建立农村房屋安全信息数据库易用的数据库客户端支持安全管理连接数据库失败ssl安全错误数据库的锁怎样保障安全统一软件开发总结罗布乐思国际服好玩的服务器中国授时服务器软件开发apqp 幼儿园防范网络安全视频 wifi显示服务器连接失败网络安全宣传片手抄报内容数据库的技术的根本目标数据库的课程属性有什么文件服务器哪种好我的世界服务器金币 vpn基于什么网络安全大学生自学网络安全课程苍穹小豪的服务器四川成都网络安全战写一篇关于网络安全的博文科技幼儿园互联网网络安全论坛在浙江乌镇吉林软件开发中心海康服务器81端口数据库最低安全级别滨州招商网络安全公司网络安全厂家排名100 软件正版化数据库北京易拍网络技术有限公司电话 vpn基于什么网络安全贵广网络技术支持工资网络安全服务公司证书廉价的云服务器十年无人管理的服务器

千家信息网