- 實戰Python網絡爬蟲
- 黃永祥
- 330字
- 2019-11-22 18:44:45
8.2 請求方式
Requests-HTML向網站發送請求的方法是來自Requests模塊,但是Requests-HTML只能使用Requests的Session模式,該模式是將請求會話實現持久化,使這個請求保持連接狀態。Session模式好比我們在打電話的時候,只要雙方沒有掛斷電話,就會一直保持一種會話(連接)狀態。Session模式對HTTP的GET和POST請求也是由get()和post()方法實現,具體的使用方法如下:

上述代碼分別對同一個URL使用get()和post()方法,由于get()和post()方法都來自Requests模塊,因此還可以對這兩個方法設置相關的參數,如請求參數、請求頭、Cookies、代理IP以及證書驗證等。
Requests-HTML在請求過程中還做了優化處理,如果沒有設置請求頭,Requests-HTML就會默認使用源碼里所定義的請求頭以及編碼格式。在Python的安裝目錄下打開Requests-HTML的源碼文件(\Lib\site-packages\requests_html.py),定義了屬性DEFAULT_ENCODING和DEFAULT_USER_AGENT,分別對應編碼格式和HTTP的請求頭,如圖8-1所示。

圖8-1 默認屬性
推薦閱讀
- LabVIEW2018中文版 虛擬儀器程序設計自學手冊
- Kubernetes實戰
- Photoshop智能手機APP UI設計之道
- INSTANT Weka How-to
- UI智能化與前端智能化:工程技術、實現方法與編程思想
- 差分進化算法及其高維多目標優化應用
- concrete5 Cookbook
- Elasticsearch Server(Third Edition)
- Lighttpd源碼分析
- Oracle Data Guard 11gR2 Administration Beginner's Guide
- 零基礎看圖學ScratchJr:少兒趣味編程(全彩大字版)
- Android應用開發攻略
- Mastering XenApp?
- TensorFlow+Keras深度學習算法原理與編程實戰
- 寫給所有人的編程思維