我正在尝试在Mac OS X上构建一个简单的Python脚本算法,其中有四个部分。
urllib
beautifulsoup
)我在执行步骤1时遇到问题,可以urllib
使用此代码获取数据
import urllib.request
y=urllib.request.urlopen('my target website url')
x=y.read()
print(x)
但是一旦返回HTML并且Python shell没有响应,它就会保持冻结状态。
既然您提到了请求,我认为这是一个很好的解决方案。
import requests
import BeautifulSoup
r = requests.get('http://example.com')
html = r.content
soup = BeautifulSoup(html)
table = soup.find("table", {"id": "targettable"})
正如jonrsharpe所建议的那样,如果您担心该URL返回的响应的大小,则可以在打印或解析之前先检查该大小。
有要求:
r = requests.get('http://example.com')
print r.headers['content-length']
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句