要使用BeautifulSoup仅返回元数据,可以使用BeautifulSoup的find_all()
方法来获取所有的元数据标签。以下是一个示例代码:
from bs4 import BeautifulSoup
html = """
网页标题
网页内容
这是一个示例网页。
"""
soup = BeautifulSoup(html, 'html.parser')
metadata_tags = soup.find_all('meta')
for tag in metadata_tags:
print(tag)
运行以上代码,将会输出所有的标签,即网页的元数据:
注意:find_all()
方法返回的是一个列表,其中包含所有符合条件的标签。你可以根据需要,进一步处理这些标签,例如提取其中的内容或属性。