要解决BeautifulSoup解析器添加不必要的闭合HTML标签的问题,可以使用其他解析器替代默认的解析器。以下是一个使用lxml解析器的示例代码:
from bs4 import BeautifulSoup
html = """
Example
Paragraph 1
Paragraph 2
"""
soup = BeautifulSoup(html, 'lxml')
print(soup.prettify())
在这个示例中,我们使用lxml解析器来解析HTML,而不是默认的解析器。这样可以避免BeautifulSoup添加不必要的闭合HTML标签。