import re
regex = ur"\[P\] (.+?) \[/P\]+?"
line = "President [P] Barack Obama [/P] met Microsoft founder [P] Bill Gates [/P], yesterday."
person = re.findall(regex, line)
print(person)
产量
['Barack Obama', 'Bill Gates']
regexur"[\u005B1P\u005D.+?\u005B\u002FP\u005D]+?"
与unicode完全相同,u'[[1P].+?[/P]]+?'
但难于阅读。
第一个括号组[[1P]
告诉重新任何列表中的字符['[', '1', 'P']
应匹配,并且同样与第二组括号[/P]]
。那你想什么都不要。所以,