re模块常用函数包括match()、search()等,match()从字符串开头匹配,若开头不匹配则返回none;search()扫描整个字符串查找第一个匹配项;正则表达式基础语法有.匹配任意字符,d匹配数字,*表示0次或多次,+至少1次,?表示可有可无;提取匹配内容可用group()获取字符串,start()和end()获取位置,span()返回位置元组。
在python中,使用re模块可以进行正则表达式操作。它提供了很多方法来处理字符串的匹配、查找、替换等任务。如果你只是想做基本的正则匹配,掌握几个常用函数和语法就够了。
1. re.match():从字符串开头开始匹配
这个函数只会在字符串开头尝试匹配正则表达式。如果开头不匹配,就直接返回None,即使后面有符合的内容也没用。
举个例子:
立即学习“Python免费学习笔记(深入)”;
import re text = "Hello, world!" pattern = r"Hello" result = re.match(pattern, text) if result: print("匹配成功") else: print("匹配失败")
- 上面的例子会输出“匹配成功”,因为Hello确实出现在字符串开头。
- 如果你把pattern改成world,就会输出“匹配失败”。
注意:match()不会检查整个字符串是否包含目标内容,它只关心开头。
2. re.search():在整个字符串中查找一次匹配
相比match(),search()更常用一些,因为它会扫描整个字符串,只要有一处匹配就返回结果。
继续上面的例子:
text = "Hi, Hello, world!" pattern = r"Hello" result = re.search(pattern, text) if result: print("找到匹配内容:", result.group())
这段代码仍然能正确找到Hello,而且它不在字符串开头也没关系。
- search()适合用来判断一个字符串中是否存在某个模式。
- 它返回的是第一个匹配到的结果。
3. 常见正则表达式写法与转义问题
正则表达式的基本写法包括:
- . 匹配任意单个字符(除了换行符)
- d 匹配数字
- w 匹配字母、数字或下划线
- * 表示前一个字符出现0次或多次
- + 表示至少出现1次
- ? 表示可有可无(0次或1次)
例如:
pattern = r"d+" # 匹配至少一个数字 pattern = r"abc.*" # 匹配以abc开头的字符串
写正则时建议在字符串前面加r,表示原始字符串,避免反斜杠被转义。
4. 提取匹配内容的方法
当你用match()或search()得到了结果对象后,可以通过这些方法提取信息:
- group():获取匹配到的完整字符串
- start() 和 end():获取匹配部分在原字符串中的起始和结束位置
- span():返回(start, end)元组
比如:
text = "Your age is 25." pattern = r"d+" result = re.search(pattern, text) if result: print("匹配内容:", result.group()) print("位置范围:", result.span())
这会输出:
匹配内容:25 位置范围:(11, 13)
基本上就这些。掌握这几个函数和常见写法,就能完成大部分基本的正则匹配任务了。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END