使用Python的requests库和正则表达式抓取网站数据
示例代码:
import requests
import re
url = "http://example.com" # 要抓取数据的网址
response = requests.get(url) # 请求网址
content = response.text # 获取网页内容
# 用正则表达式提取需要的数据
pattern = r"(.+?)"
data = re.findall(pattern, content)
print(data) # 打印获取到的数据
这段代码使用requests库获取网页的HTML源代码,然后用正则表达式提取需要的数据。这种方法比较低级,需要使用正则表达式,容易出错,但对于简单的网页抓取还是很有用的。