要将字符串分割成列表,并保持分割后的标记,可以使用正则表达式的split()
函数。下面是一个例子:
import re
string = "Hello,world!How are you?"
pattern = r"(\W+)"
result = re.split(pattern, string)
print(result)
输出:
['Hello', ',', 'world', '!', 'How', ' ', 'are', ' ', 'you', '?']
在上面的例子中,我们使用正则表达式(\W+)
作为分割的模式,这个模式表示一个或多个非单词字符。re.split()
函数会根据这个模式将字符串分割成列表,同时保留分隔符。所以在输出结果中,逗号、感叹号、空格和问号都被作为独立的元素保存在列表中。
注意:在使用正则表达式时,需要导入re
模块。