requests是python的一个HTTP客户端库,跟urllib,urllib2类似。它比 urllib 更加方便,可以节约我们大量的工作,它比 urllib 更加 Pythoner。
通过pip安装
$ pip install requests
或者,下载代码后安装:
$ wget https://github.com/requests/requests/tarball/master$ mv master requests.tgz$ tar xzf requests.tgz$ cd requests-requests-3dc84cd$ python setup.py install
使用Requests发送网络请求非常简单。
>>> import requests #导入Requests模块>>> result = requests.get('http://www.pythontab.com') # 生成Response 对象>>> result.status_code # 返回码 200>>> result.headers['content-type'] # 返回头部信息'text/html; charset=utf8'>>> result.encoding # 编码信息'utf-8'>>> result.content #内容部分
你也许经常想为URL的查询字符串(query string)传递某种数据。如果你是手工构建URL,那么数据会以键/值 对的形式置于URL中,跟在一个问号的后面。例如,www.pythontab.com?version=python3 。 Requests允许你使用 params 关键字参数,以一个字典来提供这些参数。举例来说,如果你想传递 version=python3 和 keywords=pythontab 到 www.pythontab.com ,那么你可以使用如下代码:
>>> data = {'version': 'python3', 'keywords': 'pythontab'}>>> result = requests.get("http://www.pythontab.com", params=data)>>> print result.status_code200
在罕见的情况下你可能想获取来自服务器的原始套接字响应,那么你可以访问 r.raw 。 如果你确实想这么干,那请你确保在初始请求中设置了 stream=True 。具体的你可以这么做:
>>> result = requests.get('http://www.pythontab.com', stream=True)>>> result.raw<requests.packages.urllib3.response.HTTPResponse object at 0x101194810>>>> result.raw.read(10)'x1fx8bx08x00x00x00x00x00x00x03'
如果你想为请求添加HTTP头部,只要简单地传递一个 dict 给 headers 参数就可以了。
例如,在前一个示例中我们没有指定content-type:
>>> import requests>>> url = 'http://www.pythontab.com'>>> data = {'version': 'python3', 'keywords': 'pythontab'}>>> headers = {'content-type': 'application/json'}>>> result = requests.post(url, data=json.dumps(data), headers=headers)
错误与异常
遇到网络问题(如:DNS查询失败、拒绝连接等)时,Requests会抛出一个ConnectionError 异常。
遇到罕见的无效HTTP响应时,Requests则会抛出一个 HTTPError 异常。
若请求超时,则抛出一个 Timeout 异常。
若请求超过了设定的最大重定向次数,则会抛出一个 TooManyRedirects 异常。
所有Requests显式抛出的异常都继承自 requests.exceptions.RequestException 。
其他常用方法
result.content #获取二进制响应内容
result.json() #JSON响应内容
result.headers #响应头内容
result.cookies #cookie内容
result.history #请求历史