这是一个标题
这是一段文本。
要使用BeautifulSoup解析正确的值,需要先安装BeautifulSoup库。可以使用pip命令进行安装:
pip install beautifulsoup4
接下来,可以使用以下代码示例来解析HTML文档中的正确值:
from bs4 import BeautifulSoup
# HTML文档
html_doc = """
网页标题
这是一个标题
这是一段文本。
"""
# 创建BeautifulSoup对象
soup = BeautifulSoup(html_doc, 'html.parser')
# 通过标签名获取值
title = soup.title.string
print("网页标题:", title)
h1 = soup.h1.string
print("标题:", h1)
p = soup.p.string
print("文本:", p)
# 通过属性获取值
div = soup.find('div', id='content')
print("div内容:", div.string)
运行以上代码,将输出以下结果:
网页标题: 网页标题
标题: 这是一个标题
文本: 这是一段文本。
div内容: 这是一个标题