要捕获BeautifulSoup爬取的列表标签之间的文本并打印输出,可以使用以下代码示例:
from bs4 import BeautifulSoup
import requests
# 发送请求获取HTML页面
url = 'https://example.com'
response = requests.get(url)
html_content = response.text
# 使用BeautifulSoup解析HTML
soup = BeautifulSoup(html_content, 'html.parser')
# 找到列表标签
list_tags = soup.find_all('li')
# 遍历列表标签,获取文本并打印输出
for tag in list_tags:
text = tag.text.strip() # 使用strip()方法去掉文本前后的空格和换行符
print(text)
在这个示例中,我们首先使用requests库发送HTTP请求来获取要爬取的网页的HTML内容。然后,我们使用BeautifulSoup库将HTML内容解析成可操作的对象。接下来,我们使用find_all
方法找到所有的列表标签,并使用一个循环遍历每个标签。在循环中,我们使用text
属性获取标签之间的文本,并使用strip()
方法去掉文本前后的空格和换行符。最后,我们使用print
语句将文本打印输出。