续上
3. 其他通用规则
还有一些在各个正则表达式引擎之间比较通用的规则,在前面的讲解过程中没有提到。
3.1 表达式中,可以使用 "\xXX" 和 "\uXXXX" 表示一个字符("X" 表示一个十六进制数)
3.2 在表达式 "\s","\d","\w","\b" 表示特殊意义的同时,对应的大写字母表示相反的意义
3.3 在表达式中有特殊意义,需要添加 "\" 才能匹配该字符本身的字符汇总
字符
|
说明
|
^
|
匹配输入字符串的开始位置。要匹配 "^" 字符本身,请使用 "\^"
|
$
|
匹配输入字符串的结尾位置。要匹配 "$" 字符本身,请使用 "\$"
|
( )
|
标记一个子表达式的开始和结束位置。要匹配小括号,请使用 "\(" 和 "\)"
|
[ ]
|
用来自定义能够匹配 '多种字符' 的表达式。要匹配中括号,请使用 "\[" 和 "\]"
|
{ }
|
修饰匹配次数的符号。要匹配大括号,请使用 "\{" 和 "\}"
|
.
|
匹配除了换行符(\n)以外的任意一个字符。要匹配小数点本身,请使用 "\."
|
?
|
修饰匹配次数为 0 次或 1 次。要匹配 "?" 字符本身,请使用 "\?"
|
+
|
修饰匹配次数为至少 1 次。要匹配 "+" 字符本身,请使用 "\+"
|
*
|
修饰匹配次数为 0 次或任意次。要匹配 "*" 字符本身,请使用 "\*"
|
|
|
左右两边表达式之间 "或" 关系。匹配 "|" 本身,请使用 "\|"
|
3.4 括号 "( )" 内的子表达式,如果希望匹配结果不进行记录供以后使用,可以使用 "(?:xxxxx)" 格式
举例1:表达式 "(?:(\w)\1)+" 匹配 "a bbccdd efg" 时,结果是 "bbccdd"。括号 "(?:)" 范围的匹配结果不进行记录,因此 "(\w)" 使用 "\1" 来引用。
3.5 常用的表达式属性设置简介:Ignorecase,Singleline,Multiline,Global
表达式属性
|
说明
|
Ignorecase
|
默认情况下,表达式中的字母是要区分大小写的。配置为 Ignorecase 可使匹配时不区分大小写。有的表达式引擎,把 "大小写" 概念延伸至 UNICODE 范围的大小写。
|
Singleline
|
默认情况下,小数点 "." 匹配除了换行符(\n)以外的字符。配置为 Singleline 可使小数点可匹配包括换行符在内的所有字符。
|
Multiline
|
默认情况下,表达式 "^" 和 "$" 只匹配字符串的开始 ① 和结尾 ④ 位置。如:
①xxxxxxxxx②\n ③xxxxxxxxx④
配置为 Multiline 可以使 "^" 匹配 ① 外,还可以匹配换行符之后,下一行开始前 ③ 的位置,使 "$" 匹配 ④ 外,还可以匹配换行符之前,一行结束 ② 的位置。
|
Global
|
主要在将表达式用来替换时起作用,配置为 Global 表示替换所有的匹配。
|
4. 其他提示
4.1 如果想要了解高级的正则引擎还支持那些复杂的正则语法,可参见本站 DEELX 正则引擎的说明文档。
4.2 如果要要求表达式所匹配的内容是整个字符串,而不是从字符串中找一部分,那么可以在表达式的首尾使用 "^" 和 "$",比如:"^\d+$" 要求整个字符串只有数字。
4.3 如果要求匹配的内容是一个完整的单词,而不会是单词的一部分,那么在表达式首尾使用 "\b",比如:使用 "\b(if|while|else|void|int……)\b" 来匹配程序中的关键字。
4.4 表达式不要匹配空字符串。否则会一直得到匹配成功,而结果什么都没有匹配到。比如:准备写一个匹配 "123"、"123."、"123.5"、".5" 这几种形式的表达式时,整数、小数点、小数数字都可以省略,但是不要将表达式写成:"\d*\.?\d*",因为如果什么都没有,这个表达式也可以匹配成功。更好的写法是:"\d+\.?\d*|\.\d+"。
4.5 能匹配空字符串的子匹配不要循环无限次。如果括号内的子表达式中的每一部分都可以匹配 0 次,而这个括号整体又可以匹配无限次,那么情况可能比上一条所说的更严重,匹配过程中可能死循环。虽然现在有些正则表达式引擎已经通过办法避免了这种情况出现死循环了,比如 .NET 的正则表达式,但是我们仍然应该尽量避免出现这种情况。如果我们在写表达式时遇到了死循环,也可以从这一点入手,查找一下是否是本条所说的原因。
4.6 合理选择贪婪模式与非贪婪模式,参见话题讨论。
4.7 或 "|" 的左右两边,对某个字符最好只有一边可以匹配,这样,不会因为 "|" 两边的表达式因为交换位置而有所不同。
5. 进阶与实战
有了从本文中掌握的基础,我们可以从实践中进一步巩固我们使用正则表达式的技巧。
5.1 下载正则表达式文档 chm 版本
[ 点击下载 chm 版本] - DEELX 正则语法,包含其他高级语法的 chm 版本。
5.2 下载正则工具 Regex Match Tracer 2.0 试用版(正版很值得购买)
[ 下载 Match Tracer] - 471kb
5.3 免费使用 Regex Match Tracer Web 版
[ 使用 Match Tracer Web 版]
本 Web 版工具为免费使用,不受 Regex Match Tracer 主程序的试用期限制。
分享到:
相关推荐
python正则表达式_深入浅出
如果你曾经用过Perl或任何其他内建正则表达式支持的语言,你一定知道用正则表达式处理文本和匹配模式是多么简单。如果你不熟悉这个术语,那么“正则表达式”(Regular Expression)就是一个字符构成的串,它定义了一...
正则表达式教程:30分钟让你精通正则表达式语法 _
正则表达式是一种威力无比强大的武器,几乎在所有的程序设计语言里和计算机平台上都可以用它来完成各种复杂的文本处理工作。本书从简单的文本匹配开始,循序渐进地介绍了很多复杂内容,其中包括回溯引用、条件性求值...
常用正则表达式 正则表达式 常用正则表达式 正则表达式
java的正则表达式的详细说明,里面有详细的说明和例子,是要学习java正则表达式的好资料。
正则表达式,正则表达式,正则表达式 正则表达式 正则表达式 正则表达式 正则表达式 正则表达式 正则表达式
正则表达式.rar正则表达式.rar正则表达式.rar正则表达式.rar
《学习正则表达式》从正则表达式的基本概念讲起,到编写完整的sed和Perl脚本,再到转换HTML文件,将这种强大的工具解释得清晰透彻。...《学习正则表达式》适合对正则表达式感兴趣的程序员和互联网从业者。
正则表达式验证工具 V1.0 本软件主要用于检测正则表达式是否正确。 运行环境:本软件为绿色软件,无需安装,但需要Microsoft .NET Framework 4 支持,如果没有请前去下载(下载路径:...
正则表达式日期校验 正则表达式日期校验 正则表达式日期校验
正则表达式正则表达式正则表达式正则表达式 验证程序
C/C++正则表达式boost_1_34_1源码,自测试可用。
正则表达式帮助 有用的正则表达式帮助 有用的正则表达式帮助 有用的正则表达式帮助 有用的
Java正则表达式Java正则表达式Java正则表达式Java正则表达式
正则表达式实例正则表达式实例正则表达式实例正则表达式实例正则表达式实例正则表达式实例正则表达式实例正则表达式实例正则表达式实例正则表达式实例正则表达式实例
精通正则表达式_第三版(英文版),请注意英文版
《正则表达式经典实例》讲解了基于8种常用的编程语言使用正则表达式的经典实例。书中提供了上百种可以在实战中使用的实例,以帮助读者使用正则表达式来处理数据和文本。对于如何使用正则表达式来解决性能不佳、误报...
整理的网上一篇VBA正则式方面的文章