例如可以匹配一下数字:12 12,234 1,234 5,345,234
但是不能匹配一下数字:12,34,567 (逗号之间只有两位数字)1234(缺少逗号)
我写的代码如下:
import re
thrD W 6 u b R C ReeNumRegex = re.compile(r'^\d{1,3}(,\d{3})*$')
t3 ! H y 6 * Aext = '837,234'
result = thrD _ b I j X G ZeeNumRegex.findall(text)
print% m @ 5 T a D 5 m(result)
结果却是这样的:
[',234']
想不明白为啥表达式里面明明限定了以1到3位数字开头,但是结果却匹配的是逗S @ X c - s J - B号开始的一个u 5 {数字
回} ~ t U答
小括号在正则中有不同的含义
一种是指括号内的表达式作为一个整体,也就是你使用的这种,把 ,\d{3}
作为整体使用 *
匹配多个
还有一种含义是捕获数据,也就是将括号内表达式匹配到的数据提取出来保存供内部反向引用或者外部提取,你这个表达式也用到了这种含义
还有其m p w他含义感兴趣可以看看
我L ^ 6 q P想到的你现在有两种解决方式
- 修改正则,改为下面5 # * H K ^ R这种,
?:
意思是不捕获括号内匹配到的数据
^\d{1,3}(?:,\d{3})*$
- 修改使用的函数
findall
返回的是匹o R J *配的子串列表,你的小括号有捕获的含义,所以它返回了符合条件的(,\d{3})
部分
match
返回的是Match对象,e W I ? 6不匹配返回None,使用group()
或者group(0)Q Q ` f _
函数可以提取符F z o u 2 * ~ G合正则的整个字符串,groups()
函数提取捕获子串(和findall
函数返回值类似了,只是这边是元祖)
()需要注意match
函数本f M :身就是从首字母开始匹配的,所以正则中加不加^
意思都是一样的
result = threeNumRegex@ h [ ( t w @.match(text)
print(result.group())
发表评论