尝试从网站提取HTML数据时urllib保持冻结-我的代码正确吗？

Twiggy Garcia 发表于 Dev

特威吉·加西亚（Twiggy Garcia）

我正在尝试在Mac OS X上构建一个简单的Python脚本算法，其中有四个部分。

转到定义的网站并使用 urllib
解析HTML数据以找到数字表（使用beautifulsoup）
用这些数字做一个简单的计算
将结果按数字顺序打印在表格中

我在执行步骤1时遇到问题，可以urllib使用此代码获取数据

import urllib.request
y=urllib.request.urlopen('my target website url')
x=y.read()
print(x)

但是一旦返回HTML并且Python shell没有响应，它就会保持冻结状态。

chishaku

既然您提到了请求，我认为这是一个很好的解决方案。

import requests
import BeautifulSoup

r = requests.get('http://example.com')
html = r.content
soup = BeautifulSoup(html)
table = soup.find("table", {"id": "targettable"})

正如jonrsharpe所建议的那样，如果您担心该URL返回的响应的大小，则可以在打印或解析之前先检查该大小。

有要求：

r = requests.get('http://example.com')
print r.headers['content-length']

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-02-20

我来说两句

0条评论

登录后参与评论

来自分类Dev

尝试从网站提取HTML数据时urllib保持冻结-我的代码正确吗？

来自分类Dev

尝试从格式不正确的HTML网站提取数据

来自分类Dev

我有一个CSV文件，我正在尝试使用python提取数据。没有得到正确的结果。有人可以帮忙吗？附带的代码和样本数据

来自分类Dev

我可以保护 html 输入代码吗？

来自分类Dev

我可以获取我的数据库代码吗？

来自分类Dev

AJAX数据的控制台日志是我的html代码吗？

来自分类Dev

Android / Java：我的代码正确吗？

来自分类Dev

我对以下代码的理解正确吗？

来自分类Dev

我对此代码的理解正确/完整吗？

来自分类Dev

我正在尝试使用值更新多行，这是正确的吗？

来自分类Dev

我怎么知道正确的HTML代码是什么样的

来自分类Dev

我的 html 上的 CSS 代码错误（不正确匹配）

来自分类Dev

我使用类查询数据库的方法正确吗？

来自分类Dev

我使用类查询数据库的方法正确吗？

来自分类Dev

我正在尝试在android中创建SQLite数据库。但是，每当启动家庭活动时，该应用都会保持黑屏冻结

来自分类Dev

从bigTable提取数据时如何添加限制选项？有人可以在NodeJS中给我正确的语法吗

来自分类Dev

我可以在html源代码中看到ViewStateUserKey吗？

来自分类Dev

jQuery代码会影响我的HTML图像链接吗？

来自分类Dev

我不能在HTML文档中使用CSS代码吗？

来自分类Dev

我可以从html元素访问LINQPad的C＃代码吗？

来自分类Dev

jQuery代码会影响我的HTML图像链接吗？

来自分类Dev

我的代码正确吗？我使用的书是否错误？

来自分类Dev

我的代码正确吗，我可以进行哪些改进？

来自分类常见问题

我每次想更新内容时都需要更改网站的源代码吗？

来自分类Dev

我可以在自动缩放时使用AWS Code Deploy提取应用程序代码吗？

来自分类Dev

我在调试下面的代码时遇到问题。我在Visual Studio中得到正确的输出，

来自分类Dev

我可以在代码加载时通过代码检查会话是否处于活动状态吗？

来自分类Dev

当我从C＃代码调用C ++代码时，它是线程安全的吗？

来自分类Dev

代码优先中的正确映射（我闻到很多吗？）

Related 相关文章

文章