正则表达式及其用法

正则表达式及其用法

1.   什么是正则表达式

正则表达式是Global search REgular expression and Print out the line的缩写。是一类用字符所书写的模式,其中许多字符并不表示其字面意义,而是表达控制或通配等功能。

在Linux中,用正则表达式搜索文本的常用命令:

grep: 使用基本正则表达式匹配文本。

egrep:使用扩展正则表达式匹配文本,同: grep –E。

fgrep: 快速grep,不支持正则表达式,不识别元字符。

    语法格式:

      grep [option]… 'PATTERN' FILE…

2.   基本正则表达式

    (1)     字符匹配

(a)  .: 匹配任意单个字符。

(b)  []:匹配指定范围内的任意单个字符。

[0-9] 或[[:num:]]:匹配任意当个数字

[a-z]或[[:lower:]]:匹配任意单个小写字母

[A-Z]或[[:upper:]]:匹配任意一个大写字母

[[:space:]]:匹配空格或制表符

[[:punct:]]:匹配特殊字符

[[:alpha:]]:匹配单个任意字符

[[:alnum:]]:匹配单个字母或数字

(c)  [^]:匹配不包括指定范围内的任意单个字符。

   (2)     次数匹配

a*: 匹配它前面出现的字符任意次。

b\?: 匹配它前面的字符0次或1次。

c\{m\}: 匹配它前面出现的字符m次。

d\{m,n\}: 匹配它前面出现的字符至少m次,至多n次。

e\{m,\}: 匹配它前面出现的字符至少m次。

f\{,n\}: 匹配它前面出现的字符至多n次。

g.*: 匹配任意长度的任意字符.

  (3)     位置锚定

a^: 锚定句首,写在模式的最左面。

b$: 锚定句尾,写在模式的最右端。

c\<: 锚定词首,写在模式的最左面。

d\>: 锚定词尾,写在模式的最右面。

e.* : 空白行

  (4)     分组\(\)

       分组中的模式匹配到的内容,可由正则表达式引擎记忆在内存中,之后可被引用。

  (5)     引用 \#

引用第#个括号中匹配到的内容,而不是模式本身。

如:\(ab\?c\).*\1    abcmnabc 匹配

3.   扩展正则表达式

  (1)     字符匹配(同基本正则表达式)

(a)  .: 匹配任意单个字符。

(b)  []:匹配指定范围内的任意单个字符。

(c)  [^]:匹配不包括指定范围内的任意单个字符。

  (2)     次数匹配

a*: 匹配它前面出现的字符任意次。

b?: 匹配它前面的字符0次或1次。

c+: 匹配前面出现的字符至少一次。

c{m}: 匹配它前面出现的字符m次。

d{m,n}: 匹配它前面出现的字符至少m次,至多n次。

e{m,}: 匹配它前面出现的字符至少m次。

f{,n}: 匹配它前面出现的字符至多n次。

  (3)     位置锚定 (同基本正则表达式)

  (4)     分组()

  (5)     引用 \# (同基本正则表达式)

  (6)     或者  |

  如:a|b   表示 a或b

      ab|cd 表示 ab或cd

练习:

1.新建一个文本文件,假设有如下内容:

            He like his lover.

            He love his lover.

            He like his liker.

            He love his liker.

        找出其中最后一个单词是由此前某单词加r构成的行。

[root@centos7 ~]# cat ./liker.txt 

He like his lover.

He love his lover.

He like his liker.

He love his liker.

[root@centos7 ~]# grep '\<\(.*\)\>.*\1r' ./liker.txt 

He love his lover.

He like his liker.

[root@centos7 ~]# 

2.写一个模式,能匹配合理的ipv4地址;1.0.0.0-239.255.255.255

[root@centos7 ~]# cat ./ip.txt                       

249.1.0.1

229.2.1111.1

0.0.0.0

255.255.255.255

239.255.255.255

1.0.0.0

1000.0.0.0.0

1.1000.0.0

1.2.2000.0

1.2.3.4000

127.0.1.10

[root@centos7 ~]# grep -o -E '\<([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-3][0-9])((\.)([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])){3}\>' ./ip.txt 

239.255.255.255

1.0.0.0

1.2.3.40

127.0.1.10

[root@centos7 ~]# 

原创文章,作者:浪迹天涯,如若转载,请注明出处:http://www.178linux.com/7969

(0)
浪迹天涯浪迹天涯
上一篇 2015-09-14 09:19
下一篇 2015-09-14 09:21

相关推荐

  • Linux用户和组管理

        登录Linux时我们都需要输入账号和密码,但Linux只会识别账号所对应用ID号,这个ID号就称为UID。     同理每个用户组也都拥有相对应的组ID号,即GID。     Linux根据/etc/passwd文件的内容来查找当前…

    Linux干货 2015-04-26
  • 软链接和硬链接的区别

    软链接和硬链接的区别 什么是链接: 文件都是文件名和数据组成的,在linux中被分成两部分:数据和元数据。数据是记录文件的真实内容的地方;元数据是记录文件属性的地方:创建者、大小、创建时间等信息。元数据中的inode号这是唯一标识文件身份的属性。在linux中,文件的inode号可以通过ls –i命令查看。在linux中为了解决文件共享使用,引入了两种链接:…

    Linux干货 2016-10-20
  • Linux下 文件类型不同颜色的含义

    linux 文件颜色的含义 蓝色代表目录 绿色代表可执行文件 红色表示压缩文件 浅蓝色表示链接文件 灰色表示其他文件 红色闪烁表示链接的文件有问题了 黄色表示设备文件 蓝色文件———-目录 白色文件———-一般性文件,…

    Linux干货 2016-10-18
  • N25-第11周博客作业

    1、详细描述一次加密通讯的过程,结合图示最佳。 第一步:他们需要实现协商好对称加密算法,单向加密算法,公钥加密算法,交换公钥等。 第二步:B用户想要将数据传给A,首先需要使用单向加密算法取出数据的特征码,并用自己的私钥对这段特征码进行加密(数字签名),B用户生成临时对称密钥,并用对称密钥加密整段数据,B用户使用 A用户的公钥加密一次性对称密钥,附加在整段数据…

    Linux干货 2017-05-21
  • ps/top/htop/dstat命令的使用说明

    ps命令参数说明       ps命令是一种静态显示进程(process)状态的外部命令,获取的是某一个时间点的状态信息,其常用选项参数如下:         -A:all process信息    …

    Linux干货 2016-12-16
  • Corosync+Pacemaker+DRBD实现高可用 Mariadb

    一、DRBD简介 DRBD全称Distributed Replicated Block (分布式的复制块设备),开源项目。它是一款基于块设备的文件复制解决方案,速度比文件级别的软件如NFS,samba快很多,而且不会出现单点故障,是很多中小企业的共享存储首选解决方案。 二、DRBD的工作模式从上图中我们可以清楚的看到DRBD是工作在内核中,将协议建立在buf…

    2017-11-05