- 實戰Python網絡爬蟲
- 黃永祥
- 480字
- 2019-11-22 18:44:33
2.8 本章小結
本章主要介紹了與編寫爬蟲程序相關的Web前端開發技術。
前端開發技術是爬蟲開發人員必備技能之一,也是編寫爬蟲程序的基礎。前端技術的主要作用是分析各類網站的設計架構,以便有針對性地編寫爬蟲腳本。從整個爬蟲開發周期來看,分析網站架構是最為耗時的一環,也是爬蟲開發的核心之一,可以說,爬蟲的開發都是基于網站的分析為前提。
關于前端開發技術,讀者應重點掌握以下內容。
● HTTP與HTTPS:互聯網上應用最為廣泛的一種網絡協議。目前所有網站開發都基于該協議,也是網站的實現原理。
● 請求頭:基于HTTP與HTTPS協議實現,其作用是在通信之間實現信息傳遞。熟知各種請求類型,對爬蟲中編寫請求頭有指導性作用。
● Cookies:存儲在用戶主機瀏覽器中的文本文件,主要讓服務器識別各個用戶身份信息。
● HTML:服務器返回的網頁內容,一般由服務器后臺生成。網站大部分數據來源于此,熟悉HTML布局和各個標簽的作用,有利于數據抓取和清洗。
● JavaScript:主要實現網頁的動態功能及用戶交互。要懂得分析JavaScript代碼,尤其是數據加密處理。
● JSON:表示一個JavaScript對象的信息,本質是一個特殊的字符串。
● Ajax:主要是前端數據加載和渲染技術,其響應內容大部分以JSON格式為主。
推薦閱讀
- 零基礎PHP學習筆記
- 網頁設計與制作教程(HTML+CSS+JavaScript)(第2版)
- Learning AWS Lumberyard Game Development
- PHP網絡編程學習筆記
- JavaScript+Vue+React全程實例
- Kotlin編程實戰:創建優雅、富于表現力和高性能的JVM與Android應用程序
- 運用后端技術處理業務邏輯(藍橋杯軟件大賽培訓教材-Java方向)
- Creating Mobile Apps with jQuery Mobile(Second Edition)
- C++20高級編程
- Java程序設計案例教程
- Django 3.0入門與實踐
- MATLAB GUI純代碼編寫從入門到實戰
- Android應用開發實戰
- Deep Learning with R Cookbook
- 超好玩的Scratch 3.5少兒編程