如何在 Perl 中从 HTML 中提取 URL 标记和链接文本?

我有一个页面,其中包含:

<a href="http://www.trial.com" title="yellow">Trial</a>
<a href="http://www.trial1.com" title="red">Trial2</a>

如何获取锚文本、URL 和标题?

我想要这个输出:

Trial, http://www.trial.com, yellow
Trial2, http://www.trial1.com, red

我尝试使用WWW::Mechanize解释过here,但我不知道如何以这种方式获得标题。你有什么想法?

范霍塞尔

简单版本,基于您的问题

  • 一个看起来像你的页面(所以没有可能弄乱的晦涩的 html)
  • 期望的输出

这可能是您正在寻找的:

use strict;
use warnings;

use WWW::Mechanize;

my $mech = WWW::Mechanize->new;
$mech->get('file:page.html');

foreach my $link ($mech->links) {
    my $text  = $link->text;
    my $url   = $link->url;
    my $title = $link->attrs->{title};

    print "$text, $url, $title\n"
}

快乐编码,TIMTOWTDI

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何从Perl中的文本中提取引用的部分?

来自分类Dev

如何从HTML标记中提取内部文本?

来自分类Dev

如何从多组HTML标记中提取文本?

来自分类Dev

从 html 正文中提取 Gmail 插件中特定链接文本的 URL

来自分类Dev

如何使用jsoup从html中的<form action=中提取链接

来自分类Dev

如何通过 Python 中的 Selenium Webdriver 从 HTML 标记的所有子项中提取文本

来自分类Dev

从android中的文本中提取完整的url

来自分类Dev

如何在iOS中从URL请求中提取数据

来自分类Dev

如何在Excel中的URL中提取参数?

来自分类Dev

从xpath的html中的href链接中提取文本

来自分类Dev

从html标记中提取文本

来自分类Dev

如何从 IGN 网站中提取 url 链接

来自分类Dev

如何使用ASP从文本中提取URL?

来自分类Dev

如何使用beautifulsoup从html中提取文本?

来自分类Dev

如何在R中的矩阵中提取链接数?

来自分类Dev

如何从Perl中的多维数组中提取列数据

来自分类Dev

如何从Perl中的字符串模式中提取日期

来自分类Dev

如何在Perl中提取部分行

来自分类Dev

如何在Perl中提取Unix路径

来自分类Dev

如何使用javascript从html字符串中提取所有图像url和href值?

来自分类Dev

如何从URL中只有月份和年份的网站中的多个表中提取内容

来自分类Dev

如何在Python和beautifulsoup中从CDATA中提取数据?

来自分类Dev

如何从Java中的绝对URL中提取相对URL

来自分类Dev

如何使用findall函数从python中的文本文件中提取特定的url

来自分类Dev

如何在Perl中从正文电子邮件中提取href?

来自分类Dev

如何从链接@中提取文本?

来自分类Dev

如何使用javaScript在HTML电子邮件中提取VML(Outlook代码)中的href链接?

来自分类Dev

PHP 使用 DOMDocument 和/或 Regex 从 HTML 中提取 url

来自分类Dev

如何从JavaScript中的段落中提取数组中的URL

Related 相关文章

  1. 1

    如何从Perl中的文本中提取引用的部分?

  2. 2

    如何从HTML标记中提取内部文本?

  3. 3

    如何从多组HTML标记中提取文本?

  4. 4

    从 html 正文中提取 Gmail 插件中特定链接文本的 URL

  5. 5

    如何使用jsoup从html中的<form action=中提取链接

  6. 6

    如何通过 Python 中的 Selenium Webdriver 从 HTML 标记的所有子项中提取文本

  7. 7

    从android中的文本中提取完整的url

  8. 8

    如何在iOS中从URL请求中提取数据

  9. 9

    如何在Excel中的URL中提取参数?

  10. 10

    从xpath的html中的href链接中提取文本

  11. 11

    从html标记中提取文本

  12. 12

    如何从 IGN 网站中提取 url 链接

  13. 13

    如何使用ASP从文本中提取URL?

  14. 14

    如何使用beautifulsoup从html中提取文本?

  15. 15

    如何在R中的矩阵中提取链接数?

  16. 16

    如何从Perl中的多维数组中提取列数据

  17. 17

    如何从Perl中的字符串模式中提取日期

  18. 18

    如何在Perl中提取部分行

  19. 19

    如何在Perl中提取Unix路径

  20. 20

    如何使用javascript从html字符串中提取所有图像url和href值?

  21. 21

    如何从URL中只有月份和年份的网站中的多个表中提取内容

  22. 22

    如何在Python和beautifulsoup中从CDATA中提取数据?

  23. 23

    如何从Java中的绝对URL中提取相对URL

  24. 24

    如何使用findall函数从python中的文本文件中提取特定的url

  25. 25

    如何在Perl中从正文电子邮件中提取href?

  26. 26

    如何从链接@中提取文本?

  27. 27

    如何使用javaScript在HTML电子邮件中提取VML(Outlook代码)中的href链接?

  28. 28

    PHP 使用 DOMDocument 和/或 Regex 从 HTML 中提取 url

  29. 29

    如何从JavaScript中的段落中提取数组中的URL

热门标签

归档