从文件中提取URL链接

幼稚的

下面的代码是使用正则表达式从文件(urlfile包含约1000个链接)中提取/support/security/*.html链接到urlsort文件,但是我对regex感到很虚弱,谁能告诉我该怎么做...?

#!/usr/bin/env python
import re,sys

fileHandle = open('urlfile', 'r')
f1 = open('urlsort', 'w')
for line in fileHandle.readlines():

    links = re.findall(r"(\/support\/security\/*.html.*?)", line)
    for link in links:
        sys.stdout = f1
        print ('%s' % (link[0]))
        sys.stdout = sys.__stdout__


 f1.close()
 fileHandle.close()
dwurf

您正则表达式有两个失误,丢失.前的第一*和一个额外的?接近尾声。

这是一些代码,用于编写与您的模式匹配的url以urlsort使用某些python惯用语。

#!/usr/bin/env python

import re

with open('urlfile', 'r') as urls_in:
    with open('urlsort', 'w') as urls_out:
        for line in urls_in:
            links = re.findall(r"(\/support\/security\/bulletins\/.*.html)", line)
            if links:
                urls_out.write("%s\n" % links[0])

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

从文件中提取URL链接

来自分类Dev

从文件中提取链接

来自分类Dev

从.url文件中提取URL

来自分类Dev

从json文件中提取URL

来自分类Dev

从CSV文件中提取URL

来自分类Dev

从大文件中提取URL

来自分类Dev

使用Beautifulsoup从URL中提取链接

来自分类Dev

无法在python中提取URL链接

来自分类Dev

如何从 IGN 网站中提取 url 链接

来自分类Dev

BASH从youtube html文件中提取链接

来自分类Dev

从网站中提取链接

来自分类Dev

正则表达式从URL中提取链接

来自分类Dev

从R中的Excel文件中提取超链接

来自分类Dev

如何使用bash从html文件中提取链接

来自分类Dev

我如何从 php 下载链接中提取文件名

来自分类Dev

试图从从 csv 文件中提取链接到 request.get 中提取链接,但得到“ TypeError: 'NoneType' object is not subscriptable ”

来自分类Dev

从网站中提取链接数量

来自分类Dev

如何从链接@中提取文本?

来自分类Dev

从 href 链接中提取 CSS

来自分类Dev

从 URL 中提取 ID

来自分类Dev

仅使用其URL从在线tar存档中提取文件

来自分类Dev

需要从Java中的URL中提取Jpg或Png文件

来自分类Dev

从基于url的txt文件中提取密钥数据

来自分类Dev

Jekyll 使用 Ruby 从 url 中提取文件名

来自分类Dev

从文本文件 Python 中提取 URL 和 TITLE

来自分类Dev

从文件中提取列

来自分类Dev

从文件中提取多行

来自分类Dev

从文件中提取数据

来自分类Dev

从文件中提取列