Python Scrapy无法从类中提取文本

ly

请查看以下html代码:

<header class="online">
                        <img src="http://static.flv.com/themes/h5/img/iconos/online.png"> <span>online</span> 
            <img src="http://static.flv.com/themes/h5/img/iconos/ojo16.png"> 428                        <p>xxfantasia</p>
</header>

我想获取内部文本(在这种情况下为428)。我用这个:

        def parse(self, response):
            sel = Selector(response)
            cams = sel.css('header.online')
            for cam in cams:
                  print cam.css('text').extract()

我认为我使用了正确的CSS选择器,但结果为空。

有什么帮助吗?

保罗·特姆布雷斯

CSS选择器通常没有语法来提取文本内容

但是Scrapy使用::text伪元素扩展了CSS选择器,因此您要使用cam.css('::text').extract()that应该给您与cam.xpath('.//text()').extract()

注意:Scrapy还添加了::attr(attribute_name)功能性的伪元素来提取属性值(使用标准CSS选择器也是不可能的)

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

无法从python中的xml中提取文本

来自分类Dev

如何使用Selenium和Python从div类中提取文本

来自分类Dev

无法在python中使用pytesseract从tif图像中提取文本

来自分类Dev

无法使用 geograpy(Python) 从文本中提取城市名称

来自分类Dev

使用python scrapy从网页中提取链接

来自分类Dev

Selenium代码等待CSS类可用并在Python中提取文本

来自分类Dev

Python:提取类和文本

来自分类Dev

Python BeautifulSoup从结果中提取文本

来自分类Dev

Python使用键从文本中提取值

来自分类Dev

如何在文件python中提取文本

来自分类Dev

python-从Microsoft Word中提取文本

来自分类Dev

Python从PDF文件中提取多个文本

来自分类Dev

使用Python从文本中提取IBAN

来自分类Dev

Python BeautifulSoup从结果中提取文本

来自分类Dev

尝试使用 Python 从标签中提取“文本”

来自分类Dev

使用python和scrapy从Web提取文本

来自分类Dev

从标签beautifulsoup python中提取类名

来自分类Dev

在python中提取Java主类名称

来自分类Dev

Python无法从照片Linux中提取数字

来自分类Dev

无法在python中提取URL链接

来自分类Dev

使用 Python/Scrapy 在 h1 中提取 p

来自分类Dev

使用 BeautifulSoup 和 Python 从多个标签中提取文本,例如具有类的 h1 和 p 标签

来自分类Dev

Python程序从文本文件中提取文本?

来自分类Dev

从文本文件中提取文本的Python程序?

来自分类Dev

Python,BeautifulSoup:从表单元格中提取文本

来自分类Dev

Python元素树-从元素中提取文本,剥离标签

来自分类Dev

从Python中的文本文件中提取数值数据

来自分类Dev

Python:从文本中提取星号字符串

来自分类Dev

从Python的文本文件中的字段中提取数据

Related 相关文章

热门标签

归档