requests 库是 python 中用于发送 http 请求的常用工具,支持多种请求方式及异常处理。1. 发送 get 请求可使用 requests.get() 方法获取响应状态码与文本内容;2. 发送 post 请求可通过 data 参数传递表单数据;3. 发送 json 数据时使用 json 参数自动序列化并设置 content-type 为 application/json;4. 响应处理包括判断状态码、打印响应头及解析 json 数据;5. 超时异常通过 timeout 参数设置超时时间,并结合 try…except 捕获 timeout 异常及其他请求异常;6. 自定义请求头可通过 headers 参数传入字典实现;7. cookies 可自动保存并在后续请求中携带,也可通过 cookies 参数手动设置。
python 的 requests 库,用起来相当顺手,可以轻松发送各种 HTTP 请求,处理响应。简单来说,就是个让你用 Python 代码跟服务器“聊天”的工具。
requests 库的核心就是发送 HTTP 请求。下面是一些常见用法:
发送 GET 请求:
立即学习“Python免费学习笔记(深入)”;
import requests response = requests.get('https://www.example.com') print(response.status_code) # 打印状态码,例如 200 print(response.text) # 打印响应内容(文本)
发送 POST 请求:
import requests payload = {'key1': 'value1', 'key2': 'value2'} response = requests.post('https://www.example.com/post', data=payload) print(response.status_code) print(response.text)
发送带有 JSON 数据的 POST 请求:
import requests import json payload = {'key1': 'value1', 'key2': 'value2'} response = requests.post('https://www.example.com/post', json=payload) print(response.status_code) print(response.json()) # 如果响应是 JSON,可以直接解析
处理响应:
import requests response = requests.get('https://www.example.com') if response.status_code == 200: print("请求成功!") print(response.headers) # 打印响应头 # 其他操作 else: print(f"请求失败,状态码:{response.status_code}")
如何处理 requests 库的超时异常?
网络请求,最怕的就是卡住不动。requests 库提供了 timeout 参数,可以设置请求的超时时间。如果超过这个时间还没收到响应,就会抛出异常。
import requests try: response = requests.get('https://www.example.com', timeout=5) # 设置超时时间为 5 秒 print(response.status_code) except requests.exceptions.Timeout: print("请求超时!") except requests.exceptions.RequestException as e: print(f"其他请求异常:{e}")
这里用 try…except 块捕获了 requests.exceptions.Timeout 异常,这样即使请求超时,程序也不会崩溃,可以优雅地处理错误。 另外,requests.exceptions.RequestException 是一个更宽泛的异常,可以捕获其他类型的请求错误,比如连接错误、DNS 解析错误等等。
如何在 requests 库中添加请求头?
有时候,我们需要在请求中添加一些自定义的请求头,比如 User-Agent,或者 Authorization。
import requests headers = {'User-Agent': 'Mozilla/5.0 (windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} response = requests.get('https://www.example.com', headers=headers) print(response.status_code)
很简单,就是把请求头放到一个字典里,然后通过 headers 参数传递给 requests.get() 或 requests.post() 等方法。
requests 库如何处理 cookies?
网站经常会用 cookies 来跟踪用户的会话状态。requests 库可以自动处理 cookies,也可以手动设置和获取 cookies。
自动处理 cookies:
import requests response = requests.get('https://www.example.com') print(response.cookies) # 打印服务器返回的 cookies # 后续的请求会自动带上这些 cookies response2 = requests.get('https://www.example.com/profile')
手动设置 cookies:
import requests url = 'https://www.example.com' cookies = {'sessionid': '1234567890'} response = requests.get(url, cookies=cookies) print(response.status_code)
requests 会自动保存服务器返回的 cookies,并在后续的请求中自动带上。如果你需要手动设置 cookies,可以通过 cookies 参数传递一个字典。