正则记录

正则表达式,真的是一段时间不用就会忘记,于是就简单记录一下日常用到的一些正则表达式的例子,以便日后复盘。

取出括号中的词

这在序列标注任务中 常常会用到
text:[以后][在全国范围][普遍][推广]
code:

1
2
3
4
import re
text = "[以后][在全国范围][普遍][推广]"
words = re.findall(r'\[(.*?)\]',text)
print(words)

out:

1
['以后', '在全国范围', '普遍', '推广']

找到多行文件中不包括str1, str2, str3的行

Note: 建议使用regex 替换 re

1
2
import regex as re
p = ^((?!str1|str2|str3).)*$