xpath 取标签下所有文字内容_xpath提取目录下所有标签内的内容,递归 //text()...
生活随笔
收集整理的这篇文章主要介绍了
xpath 取标签下所有文字内容_xpath提取目录下所有标签内的内容,递归 //text()...
小编觉得挺不错的,现在分享给大家,帮大家做个参考.
利用xpath来提取所有标签里面的内容,即使标签头不同
#-*-coding:utf8-*-
import re
import os
from lxml import etree
html = '''
测试-常规用法- 我
是
谁- who
- am
- i!
- 你是
- 谁!
- who
- you
- are!
'''
selector = etree.HTML(html)
for k in range(1,3):
chinese = selector.xpath('//div[@id="content"][%s]/ul[@id="useful"]//text()'%k)
data = "".join([each for each in chinese])
english = selector.xpath('//div[@id="content"][%s]/ul[@id="useless"]//text()'%k)
Data = "".join([each for each in english])
print data
print Data
结果:
总结
以上是生活随笔为你收集整理的xpath 取标签下所有文字内容_xpath提取目录下所有标签内的内容,递归 //text()...的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇: matlab randn state 2
- 下一篇: qt html导pdf 页眉,如何使用w