搜索

搜索

Python Scrapy无法从类中提取文本

buly 发表于 Dev

35

ly

请查看以下html代码：

<header class="online">
                        <img src="http://static.flv.com/themes/h5/img/iconos/online.png"> <span>online</span> 
            <img src="http://static.flv.com/themes/h5/img/iconos/ojo16.png"> 428                        <p>xxfantasia</p>
</header>

我想获取内部文本（在这种情况下为428）。我用这个：

        def parse(self, response):
            sel = Selector(response)
            cams = sel.css('header.online')
            for cam in cams:
                  print cam.css('text').extract()

我认为我使用了正确的CSS选择器，但结果为空。

有什么帮助吗？

保罗·特姆布雷斯

CSS选择器通常没有语法来提取文本内容。

但是Scrapy使用::text伪元素扩展了CSS选择器，因此您要使用cam.css('::text').extract()that应该给您与cam.xpath('.//text()').extract()

注意：Scrapy还添加了::attr(attribute_name)功能性的伪元素来提取属性值（使用标准CSS选择器也是不可能的）

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-02-7

0

我来说两句

0条评论

登录后参与评论

上一篇：弹簧错误中Validator的目标无效？

相关文章

来自分类Dev

无法从python中的xml中提取文本

来自分类Dev

如何使用Selenium和Python从div类中提取文本

来自分类Dev

无法在python中使用pytesseract从tif图像中提取文本

来自分类Dev

无法使用 geograpy(Python) 从文本中提取城市名称

来自分类Dev

使用python scrapy从网页中提取链接

来自分类Dev

Selenium代码等待CSS类可用并在Python中提取文本

来自分类Dev

Python：提取类和文本

来自分类Dev

Python BeautifulSoup从结果中提取文本

来自分类Dev

Python使用键从文本中提取值

来自分类Dev

如何在文件python中提取文本

来自分类Dev

python-从Microsoft Word中提取文本

来自分类Dev

Python从PDF文件中提取多个文本

来自分类Dev

使用Python从文本中提取IBAN

来自分类Dev

Python BeautifulSoup从结果中提取文本

来自分类Dev

尝试使用 Python 从标签中提取“文本”

来自分类Dev

使用python和scrapy从Web提取文本

来自分类Dev

从标签beautifulsoup python中提取类名

来自分类Dev

在python中提取Java主类名称

来自分类Dev

Python无法从照片Linux中提取数字

来自分类Dev

无法在python中提取URL链接

来自分类Dev

使用 Python/Scrapy 在 h1 中提取 p

来自分类Dev

使用 BeautifulSoup 和 Python 从多个标签中提取文本，例如具有类的 h1 和 p 标签

来自分类Dev

Python程序从文本文件中提取文本？

来自分类Dev

从文本文件中提取文本的Python程序？

来自分类Dev

Python，BeautifulSoup：从表单元格中提取文本

来自分类Dev

Python元素树-从元素中提取文本，剥离标签

来自分类Dev

从Python中的文本文件中提取数值数据

来自分类Dev

Python：从文本中提取星号字符串

来自分类Dev

从Python的文本文件中的字段中提取数据

Related 相关文章

文章

热门标签

归档