要获取不包含文本的标签的XPath,可以使用以下代码示例:
from lxml import etree
# 示例HTML
html = '''
Text 1
'''
# 创建解析器对象
parser = etree.HTMLParser()
tree = etree.fromstring(html, parser)
# 获取不包含文本的标签的XPath
xpath = tree.xpath('//*[not(text())]')
# 打印结果
for element in xpath:
print(etree.tostring(element).decode())
输出结果为:
在上述代码中,我们首先导入了etree
模块,然后定义了示例HTML。然后,我们创建了一个解析器对象,并将HTML字符串解析为一个树对象。接下来,我们使用XPath表达式//*[not(text())]
来获取不包含文本的所有标签。最后,我们遍历结果并将其打印出来。输出结果为不包含文本的标签。