零宽断言
接下来的四个用于查找在某些内容(但并不包括这些内容)之前或之后的东西,也就是说它们像 \b,\^,$ 那样用于指定一个位置,这个位置应该满足一定的条件(即断言),因此它们也被称为零宽断言。
最好还是拿例子来说明吧:
(?=exp)
也叫零宽度正预测先行断言,它断言自身出现的位置的后面能匹配表达式exp。比如 \b\w+(?=ing\b)
,匹配以ing结尾的单词的前面部分(除了ing以外的部分),如查找 I'm singing while you're dancing.
时,它会匹配 sing
和 danc
。
(?<=exp)
也叫零宽度正回顾后发断言,它断言自身出现的位置的前面能匹配表达式exp
。比如 (?<=\bre)\w+\b
会匹配以re
开头的单词的后半部分(除了 re
以外的部分),例如在查找reading a book
时,它匹配 ading
。
假如你想要给一个很长的数字中每三位间加一个逗号(当然是从右边加起了),你可以这样查找需要在前面和里面添加逗号的部分:
((?<=\d)\d{3})+\b
用它对1234567890进行查找时结果是234567890。
下面这个例子同时使用了这两种断言:
(?<=\s)\d+(?=\s)
匹配以空白符间隔的数字(再次强调,不包括这些空白符)。