如何从HTML标记中提取内部文本?

努斯拉特

我有以下代码:

import Text.HTML.TagSoup

parseTags "<hello>my&amp;</world>" 

给出的输出如下:[TagOpen "hello" [],TagText "my&",TagClose "world"]但我只想得到[TagText "my&"]我可以这样做:

filter (~== "my&")$ parseTags "<hello>my&amp;</world>"

这会给我类似以下的输出[TagText "my&"]但我不知道里面是什么了TagText,即"my&"我的最终目标是"my&"获得

map(fromTagText) $ filter (~== "my&")$ parseTags "<hello>my&amp;</world>"

有什么可以帮忙吗?我尝试使用TagText,但无法正确执行。谢谢。

丹尼尔·瓦格纳
> filter isTagText (parseTags "<hello>my&amp;</world>")
[TagText "my&"]

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

提取HTML标记之外的文本

来自分类Dev

如何从contenteditable div中提取文本(而不是html标签)

来自分类Dev

使用Jsoup一一从HTML标记中提取文本

来自分类Dev

如何使用JQuery在嵌套HTML中提取文本?

来自分类Dev

Java:如何从HTML的嵌套<div>中提取分隔的文本?

来自分类Dev

如何只提取内部带有<strong>的<p>的HTML标记?

来自分类Dev

如何使用PHP从html字符串中提取未标记的文本

来自分类Dev

Jsoup:从锚标记中提取内部文本

来自分类Dev

如何使用不带HTML标记的XPath提取文本?

来自分类Dev

如何从图像中提取文本?

来自分类Dev

如何从包含“ p”标签和内部文本混合的HTML元素中提取文本?

来自分类Dev

如何从隔离表中<br>标记的文本节点中提取文本?

来自分类Dev

如何从熊猫解析的html页面中提取文本

来自分类Dev

从“伪” HTML中提取文本

来自分类Dev

从html标记中提取文本

来自分类Dev

Java:如何从HTML的嵌套<div>中提取分隔的文本?

来自分类Dev

如何仅提取内部带有<strong>的<p>的HTML标记?

来自分类Dev

如何使用jQuery从<b>标记中提取粗体文本

来自分类Dev

如何使用PHP从html字符串中提取未标记的文本

来自分类Dev

如何从html表及其内部表中提取数据?

来自分类Dev

如何使用不带HTML标记的XPath提取文本?

来自分类Dev

如何从MySQL表中提取多个HTML标记

来自分类Dev

如何从多组HTML标记中提取文本?

来自分类Dev

如何使用jsoup提取html标记之外的文本?

来自分类Dev

如何从HTML中提取文本(在特定字符串之后)

来自分类Dev

如何基于同级标记的值从lxml.etree标记中提取文本

来自分类Dev

如何通过 Python 中的 Selenium Webdriver 从 HTML 标记的所有子项中提取文本

来自分类Dev

如何使用beautifulsoup从html中提取文本?

来自分类Dev

如何在 Perl 中从 HTML 中提取 URL 标记和链接文本?

Related 相关文章

  1. 1

    提取HTML标记之外的文本

  2. 2

    如何从contenteditable div中提取文本(而不是html标签)

  3. 3

    使用Jsoup一一从HTML标记中提取文本

  4. 4

    如何使用JQuery在嵌套HTML中提取文本?

  5. 5

    Java:如何从HTML的嵌套<div>中提取分隔的文本?

  6. 6

    如何只提取内部带有<strong>的<p>的HTML标记?

  7. 7

    如何使用PHP从html字符串中提取未标记的文本

  8. 8

    Jsoup:从锚标记中提取内部文本

  9. 9

    如何使用不带HTML标记的XPath提取文本?

  10. 10

    如何从图像中提取文本?

  11. 11

    如何从包含“ p”标签和内部文本混合的HTML元素中提取文本?

  12. 12

    如何从隔离表中<br>标记的文本节点中提取文本?

  13. 13

    如何从熊猫解析的html页面中提取文本

  14. 14

    从“伪” HTML中提取文本

  15. 15

    从html标记中提取文本

  16. 16

    Java:如何从HTML的嵌套<div>中提取分隔的文本?

  17. 17

    如何仅提取内部带有<strong>的<p>的HTML标记?

  18. 18

    如何使用jQuery从<b>标记中提取粗体文本

  19. 19

    如何使用PHP从html字符串中提取未标记的文本

  20. 20

    如何从html表及其内部表中提取数据?

  21. 21

    如何使用不带HTML标记的XPath提取文本?

  22. 22

    如何从MySQL表中提取多个HTML标记

  23. 23

    如何从多组HTML标记中提取文本?

  24. 24

    如何使用jsoup提取html标记之外的文本?

  25. 25

    如何从HTML中提取文本(在特定字符串之后)

  26. 26

    如何基于同级标记的值从lxml.etree标记中提取文本

  27. 27

    如何通过 Python 中的 Selenium Webdriver 从 HTML 标记的所有子项中提取文本

  28. 28

    如何使用beautifulsoup从html中提取文本?

  29. 29

    如何在 Perl 中从 HTML 中提取 URL 标记和链接文本?

热门标签

归档