要捕获标题后的多行文本,可以使用正则表达式来匹配文本块。以下是一个示例解决方法:
import re
def extract_code_examples(text):
pattern = r"##\s(.+)\n([\s\S]+?)(?=\n##|$)"
matches = re.findall(pattern, text)
code_examples = []
for match in matches:
title = match[0]
code = match[1]
code_examples.append((title, code.strip()))
return code_examples
# 示例用法
text = """
## 示例 1
这是示例 1 的代码示例:
```python
print("Hello, World!")
这是示例 2 的代码示例:
x = 5
y = 10
print(x + y)
"""
code_examples = extract_code_examples(text) for title, code in code_examples: print(f"标题:{title}") print(f"代码:{code}") print()
输出:
标题:示例 1 代码:print("Hello, World!")
标题:示例 2 代码:x = 5 y = 10 print(x + y)
在这个示例中,我们使用正则表达式 `##\s(.+)\n([\s\S]+?)(?=\n##|$)` 来匹配标题和代码示例。这个正则表达式的含义是:以"## "开始的一行作为标题,然后匹配接下来的任意多行文本(包括换行符)作为代码示例,直到遇到下一个标题(以"## "开始)或文本结束位置(以"$"结尾)为止。
使用 `re.findall()` 函数可以找到所有匹配的结果,然后我们将标题和代码示例分别提取出来,并将其存储在一个列表中。
最后,我们可以遍历列表,并输出每个代码示例的标题和代码。
上一篇:捕获变量索引越界