要提取页面上的所有元素,可以使用BeautifulSoup的find_all()方法。以下是一个代码示例:
from bs4 import BeautifulSoup
# 假设页面内容已经保存在html变量中
html = """
标题
这是一个段落。
- 列表项1
- 列表项2
- 列表项3
"""
# 创建BeautifulSoup对象
soup = BeautifulSoup(html, 'html.parser')
# 使用find_all()方法提取所有元素
elements = soup.find_all()
# 打印所有元素
for element in elements:
print(element)
上述代码会将页面上的所有元素打印出来。你可以根据自己的需求进一步处理这些元素。