如何获取HTML标记之间的所有字符

用户名

我试图在我们论坛的div标签之间获取所有内容,以在程序中处理它们,获取的页面如下所示:

<div id="post_message_1234567">

        <a href="http://blahblah.com" target="_blank"><img src="http://blahblah.com/iuhiuhuh.gif" border="0" alt="" /></a> <br />
<br />
jofjhoeifjoiwefjoweifj<br />
 blahblahblahpokpoekpfowef<br />
<br />
khfiudhfisduhfiusdfh<br />
<br />
<a href="http://blah.com/img.php?image=trepazoid.jpg" target="_blank"><img src="http://blah.com/loc367/euhfwieufhwifuhiwefuh.jpg" border="0" alt="" /></a><br />
<br />
one<br />
 two*three<br />
 87879879 nuts<br />
 11 bananas<br />
<br />
<a href="hjoiwjhfoweif.dat" target="_blank">Monkeys</a>
        </div>

我尝试使用此正则表达式代码,但没有帮助:

string find = "\\b<div id=\"post_message_\\d+\">\\n*.*</div>\\b";

您能帮我在<div id="post_message_1234567">之间获得所有信息</div>吗?

本·艾尔雷德

这个怎么样:

@"<div id=""post_message_\d+"">(?<Content>(\r|\n|.)*)</div>"

例:

string searchString = @"<div id=""post_message_1234567"">

        <a href=""http://blahblah.com"" target=""_blank""><img src=""http://blahblah.com/iuhiuhuh.gif"" border=""0"" alt="""" /></a> <br />
<br />
jofjhoeifjoiwefjoweifj<br />
 blahblahblahpokpoekpfowef<br />
<br />
khfiudhfisduhfiusdfh<br />
<br />
<a href=""http://blah.com/img.php?image=trepazoid.jpg"" target=""_blank""><img src=""http://blah.com/loc367/euhfwieufhwifuhiwefuh.jpg"" border=""0"" alt="""" /></a><br />
<br />
one<br />
 two*three<br />
 87879879 nuts<br />
 11 bananas<br />
<br />
<a href=""hjoiwjhfoweif.dat"" target=""_blank"">Monkeys</a>
        </div>";
Regex regex = new Regex(@"<div id=""post_message_\d+"">(?<Content>(\r|\n|.)*)</div>");
Match match = regex.Match(searchString);
bool success = match.Success; // True
string content = match.Groups["Content"].Value;

content 现在包含所需标签之间的所有内容。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何在Python中的两个html标记之间获取所有内容?

来自分类Dev

如何使用HTML Agility Pack获取所有在其属性值中包含特定字符串的HTML标记?

来自分类Dev

如何删除字符串中除少数HTML标记外的所有HTML标记?

来自分类Dev

如何找到位于两个标记之间的字符串中的所有单词?

来自分类Dev

如何在这些html标记之间获取字符串和日期

来自分类Dev

如何从 iframe 获取所有 html 字符串?

来自分类Dev

如何使用SQL Server从字符串中剥离所有html标记和特殊字符

来自分类Dev

如何在所有javascript文件中的html标记之间包含javascript

来自分类Dev

如何使用PHP DOM从<body>标记获取所有<a>标记?

来自分类Dev

读取非同级HTML标记之间的所有文本

来自分类Dev

如何使用Kuchiki获取HTML文档的所有文本(脚本/样式/ noscript标记除外)?

来自分类Dev

如何删除所有 html 标记但从字符串中保留图像源链接

来自分类Dev

如何找到字符之间的所有符号

来自分类Dev

如何删除<style>标记之间的所有文本?

来自分类Dev

如何在Notepad ++中选择标记之间的所有内容?

来自分类Dev

Javascript解析HTML:在表格标记中获取所有内容

来自分类Dev

使用Java获取所有可能的HTML标记的集合

来自分类Dev

Javascript RegEx替换HTML标记内的所有字符

来自分类Dev

提取开始标记和结束标记之间的所有字符串

来自分类Dev

如何在传单上获取所有标记

来自分类Dev

如何获取matplotlib中所有标记的列表?

来自分类Dev

获取PCollection中的所有元素,而不管标记如何

来自分类Dev

删除所有HTML标记

来自分类Dev

如何通过JS更改HTML文档中字符串的所有实例,而又不影响其标记?

来自分类Dev

我如何获得vim来缩进所有HTML标记?

来自分类Dev

如何删除HTML标记中的所有属性

来自分类Dev

我如何获得vim来缩进所有HTML标记?

来自分类Dev

如何删除HTML标记中的所有属性

来自分类Dev

HTML 解析 - 在所有标签之间获取文本

Related 相关文章

  1. 1

    如何在Python中的两个html标记之间获取所有内容?

  2. 2

    如何使用HTML Agility Pack获取所有在其属性值中包含特定字符串的HTML标记?

  3. 3

    如何删除字符串中除少数HTML标记外的所有HTML标记?

  4. 4

    如何找到位于两个标记之间的字符串中的所有单词?

  5. 5

    如何在这些html标记之间获取字符串和日期

  6. 6

    如何从 iframe 获取所有 html 字符串?

  7. 7

    如何使用SQL Server从字符串中剥离所有html标记和特殊字符

  8. 8

    如何在所有javascript文件中的html标记之间包含javascript

  9. 9

    如何使用PHP DOM从<body>标记获取所有<a>标记?

  10. 10

    读取非同级HTML标记之间的所有文本

  11. 11

    如何使用Kuchiki获取HTML文档的所有文本(脚本/样式/ noscript标记除外)?

  12. 12

    如何删除所有 html 标记但从字符串中保留图像源链接

  13. 13

    如何找到字符之间的所有符号

  14. 14

    如何删除<style>标记之间的所有文本?

  15. 15

    如何在Notepad ++中选择标记之间的所有内容?

  16. 16

    Javascript解析HTML:在表格标记中获取所有内容

  17. 17

    使用Java获取所有可能的HTML标记的集合

  18. 18

    Javascript RegEx替换HTML标记内的所有字符

  19. 19

    提取开始标记和结束标记之间的所有字符串

  20. 20

    如何在传单上获取所有标记

  21. 21

    如何获取matplotlib中所有标记的列表?

  22. 22

    获取PCollection中的所有元素,而不管标记如何

  23. 23

    删除所有HTML标记

  24. 24

    如何通过JS更改HTML文档中字符串的所有实例,而又不影响其标记?

  25. 25

    我如何获得vim来缩进所有HTML标记?

  26. 26

    如何删除HTML标记中的所有属性

  27. 27

    我如何获得vim来缩进所有HTML标记?

  28. 28

    如何删除HTML标记中的所有属性

  29. 29

    HTML 解析 - 在所有标签之间获取文本

热门标签

归档