在使用BeautifulSoup时,可以使用string
属性来获取标签中的文本内容,而不是使用.text
或.get_text()
方法。这样可以避免将数字显示出来。
以下是使用string
属性来获取文本内容的代码示例:
from bs4 import BeautifulSoup
html = """
这是一段文字。
这是第2段文字。
"""
soup = BeautifulSoup(html, 'html.parser')
# 找到所有的p标签
paragraphs = soup.find_all('p')
for p in paragraphs:
# 使用string属性获取文本内容
text = p.string
print(text)
运行上述代码,将只会输出文本内容,而不会显示数字。
输出结果:
这是一段文字。
这是第2段文字。