grep &&正则表达式&&通配,元字,转义符

grep 基于正则表达式的查询

1正则表达式: 正则表达式是通过使用特殊的字符所编写的模式,一些字符不表示字符的表面意思,具有控制和通配的功能.

使用正则表达式进行匹配具有两种方法:一是通过使用特殊的元字符进行字符匹配;二是使用次数匹配。

一, 正则表达式的特殊字符(元字符) : 

#建议再温习一下之前所学的统通配符,对比一下,防止混淆。

(1)元字符(正则表达式:字符匹配) :元字符不表示本身的含义,用于额外功能的描述。

.  :匹配任意单个字符       #注意是单个字符

[] :指定范围内的任意单个字符。 #注意是单个字符

[^] :匹配在指定范围外的任意单个字符。 ^ 托字符在括号之外的含义是锚定行首。

[] 中可以使用这样的方式(这个和通配符的含义是一样的):

[:digit:] :指所有的数字

[:lowwer:]  :指所有的小写字母

[:upper:] :指所有的大写字母

[:alpha:] :指所有的字母(不区分大小写)

[:alnum:] :指所有的数字和字母

[:punct:] :指所有的标点符号

[:space:] :指所有的空白字符(tab键还有空格都属于space)

次数匹配:用于在指定次数的字符后面,用于指定前面的字符要出现的次数

* :匹配前面的字符任意次 ;注意的是默认情况下,正则表达式是在贪婪模式下,就是尽可能的多进行匹配。

          元字符1.png  

        位置匹配:对特定位置进行定位

                ^ :行首锚定 ,用于模式的最前面

                $ :行尾锚定,用于模式的最后面

                ^PATTERN$ :用于匹配整行内容。

                \<或者\b:用于词首锚定 #注意是整个词的锚定

                \>或者\b:用于词尾锚定

(2) 通配符(作为对比和温习)

* :匹配0个或者多个字符

:匹配任何单个字符

~ :当前用户的家目录

~+ :当前工作目录

~- :前一个工作目录

[0-9] :匹配一个数字范围

[a-z] :匹配大写和小写字母 比如[a-c] a , A ,b ,B ,c 

[A-Z] :匹配大写字母

[wxc] :匹配列表中任何一个字符

[^wxc] :匹配列表之外任何一个字符

[:digit:] :指所有的数字

[:lowwer:]  :指所有的小写字母

[:upper:] :指所有的大写字母

[:alpha:] :指所有的字母(不区分大小写)

[:alnum:] :指所有的数字和字母

[:punct:] :指所有的标点符号

[:space:] :指所有的空白字符(tab键还有空格都属于space)

(3)转义符

有时候,我们想让 通配符,或者元字符 变成普通字符,不需要使用它。那么这里我们就需要用到转义符了。

shell提供转义符有三种。

‘’(单引号) 又叫硬转义,其内部所有的shell 元字符、通配符都会被关掉。注意,硬转义中不允许出现’(单引号)。

“”(双引号) 又叫软转义,其内部只允许出现特定的shell 元字符:$用于参数代换 `用于命令代替

\(反斜杠)  又叫转义,去除其后紧跟的元字符或通配符的特殊意义。

!!!文本和文件是不支持正则表达式!!!

grep 是一种文本的过滤器,它是根据指定的模式(就是所谓的正则表达式限定)进行对文本逐行的进行查询,而后显示出匹配的行。

格式:grep [OPTION] PATTERN [FILE]

–COLOR 高亮显示匹配到的字符。

-v 显示不能被pattern匹配到的行,相当于取反。

-i 忽略字符的大小写

-o 只显示被匹配到的字符串

-q 静默模式,不输出任何信息 #可以使用echo $? 查看上条命令的执行是否成功。

-n 显示匹配到的内容在第几行

-A :显示匹配内容的后面#行

-B 显示匹配内容的前面的几行,如果匹配到的为第一行,则前面的为空。

-C 相当于-AB,显示匹配内容的前后#行

-E 相当与egrep,支持扩展正则表达式

grep选项.png


附 :cut ,head ,tail的用法

        

之所以附这三个命令的用法是因为这三个命令和grep时常一起使用,用于对grep文本过滤的后的取舍。

    cut :是文本切割的命令,用某种分隔符进行切割,按照列进行取其内容。 # 某种分隔符 :比如说 /etc/passwd 下的文件 ,user:UID:GID:…

        这样就可以使用: 作为分隔符 ,方便取内容,分隔符不是固定的,是按个人需求进行设定。

        -d   : 后面加上设定的分隔符

        -f :以分隔符分出的列进行划分,在f后跟数字代表取得第几列。

        比如:取出用户的UID号 :  # 以:为分隔符,UID处于第三列,使用f3。

        cut1.png

    head 取grep取出的内容的开头几行 ,tail取得是内容的后面几行,在命令后面跟上行数就可以,通常使用管道。

    -c # :指定获取前#字节    # 取字节可以把需要取得内容使用文本编译器(nano,vi)等显示,可以查看其字节。

    -n # :指定获取前#行

    -# :指定行数

    head,tail2.png

        


原创文章,作者:zhong,如若转载,请注明出处:http://www.178linux.com/29472

(0)
zhongzhong
上一篇 2016-08-05 16:09
下一篇 2016-08-05 16:09

相关推荐

  • 推荐-zabbix原理篇(1)

    zabbix原理篇(1) 介绍zabbix 之前让我们先来熟悉一下什么snmp ☺ SNMP:Simple Network Management Protoclol  翻译一下:简单网络管理协议 SNMP的工作模式是啥 ☺ NMS向agent采集数据 agent向NMS报告数据 NMS请求agent修改配置 SNMP组件…

    Linux干货 2016-04-11
  • 马哥教育网络班21期+第2周课程练习

    一、Linux文件管理类命令     1、文件的复制、移动和删除        A、cp  文件的复制          cp命令的用法:    &n…

    Linux干货 2016-06-26
  • SHELL脚本基础速览

    变量的赋值: Shell变量赋值从右到左进进行赋值 格式:NAME=value 变量的声明: export 变量名  export NAME=value declare –x 变量名 declare –x NAME=value   readonly 变量名  特定情况下需要使用到只读变量 readonly NAME=v…

    2017-04-15
  • 第10周作业(上)

    第10周作业 1、请详细描述CentOS系统的启动流程(详细到每个过程系统做了哪些事情)。CentOS系统启动详细的过程如下(以CentOS7为例): 加电自检(POST)按下电源开关,BIOS系统随即开始加电自检,检查CPU、内存、主板及各接口、硬盘、键盘、光驱等,检测它们的好坏。 读取启动顺序检查完成后,BIOS会根据预先设定好的启动顺序去挨个寻找可引导…

    Linux干货 2017-01-03
  • 马哥教育网络班21期-第一周课程练习

    第一周课程练习 1、描述计算机的组成及其功能?         1.1 现代主流的计算机(冯·诺依曼体系)主要由五部分组成,分别是控制器、运算器、存储器、输入和输出设备。控制器和运算器对应我们现实计算机看到的CPU,存储器对应内存和硬盘等存储设备,输入设备对应鼠标键盘等其它外设,输出设备对应显示器、音响、打印机等其它外…

    Linux干货 2016-06-26
  • 十个让你变成糟糕的程序员的行为

    之前本站发表过《优秀程序员的十个习惯》以及《程序员需要具备的基本技能》,那是我们需要去学习和培养的。这里,我们主要讨论十个糟糕程序员的特征,主要是需要让我们去避免和小心的。 1) 情绪化的思维 如果你开始使用不同颜色的眼光来看待这个世界的话,那么你可能会成为一个很糟糕的程序员。情绪化的思维或态度很有可能会把自己变成一个怪物。相信你经常可以看到很多很糟糕的程序…

    Linux资讯 2015-04-03