使用AWK解析HTML代码段

zavg 发表于 Dev

扎夫格

我正在尝试使用awk解析HTML文档。

该文档包含几个<div class="p_header_bottom"></div块

 <div class="p_header_bottom">
    <span class="fl_r"></span>
    287,489 people
  </div>
  <div class="p_header_bottom">
    <span class="fl_r"></span>
    5 links
  </div>

我在用

awk '/<div class="p_header_bottom">/,/<\/div>/'

接收所有此类div。

我如何287,489从第一个电话号码获取号码？

实际上awk '/<\/span>/,/people/'无法正常工作。

伊鲁瓦

使用gawk并假设每个<div> </div>块中仅有数字和逗号出现在感兴趣的数字部分中

awk -v RS='<[/]?div[^>]*>' '/span/ && /people/{gsub(/[^[:digit:],]/, ""); print}' file.txt

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-02-5

我来说两句

0条评论

登录后参与评论

来自分类Dev

在Atom中使用变量创建代码段

来自分类Dev

漂亮的HTML代码段输出

来自分类Dev

将一段html代码解析为XDocument？

来自分类Dev

对INotifyPropertyChanged使用代码段

来自分类Dev

Sublime Doctype HTML代码段

来自分类Dev

解析复合语法时内部Boost :: Spirit代码段错误

来自分类Dev

生成小的HTML代码段的辅助方法

来自分类Dev

如何使用Jsoup从HTML页面检索代码段？

来自分类Dev

难以使用PHP DOMDocument解析脏的html代码

来自分类Dev

在Rails视图中重复的HTML代码段

来自分类Dev

将代码段转换为HTML页面

来自分类Dev

Jsoup html代码解析

来自分类Dev

使用python正则表达式替换HTML代码段中的块

来自分类Dev

如何使用此HTML代码解析我想要的内容？

来自分类Dev

尝试使用正则表达式提取一段HTML代码

来自分类Dev

使用正则表达式解析URL，忽略Markdown中的代码块和代码段

来自分类Dev

如果在HTML代码段中使用一行javascript

来自分类Dev

如何使用lxml从此HTML代码段中获取文本？

来自分类Dev

如何使用python在HTML页面（纯文本）上显示HTML / Javascript代码段？

来自分类Dev

对INotifyPropertyChanged使用代码段

来自分类Dev

使用JavaScript注入任意HTML代码段

来自分类Dev

Sublime Doctype HTML代码段

来自分类Dev

如何使用Jsoup从html页面检索代码段？

来自分类Dev

Atom HTML代码段不起作用

来自分类Dev

管道使用awk代码创建的awk对象

来自分类Dev

编辑HTML代码段建议VSCode

来自分类Dev

使用PHP改进使用DOM解析html代码

来自分类Dev

将代码段转换为HTML页面

来自分类Dev

如何使用shell脚本在两个特定的html标签之间插入一段代码？

Related 相关文章

文章