官术网_书友最值得收藏!

1.5 模擬瀏覽器

模擬瀏覽器不同于urllib庫、requests庫等網絡請求庫,后者通過偽裝瀏覽器來爬取網頁數據,而模擬瀏覽器則直接操作瀏覽器爬取網頁數據,因此其優缺點顯而易見,優點是無論網站使用了多么復雜且多么精妙的反爬蟲技術,使用模擬瀏覽器都可以根據在Web瀏覽器中所看到的頁面進行爬取,缺點是其爬取速度較網絡請求庫慢很多。

Python支持很多模擬瀏覽器的庫,如Selenium、Splash、PyV8等,本節將重點講解目前最常用的模擬瀏覽器庫Selenium。

主站蜘蛛池模板: 西乌珠穆沁旗| 公主岭市| 丹江口市| 麻城市| 增城市| 苗栗县| 含山县| 老河口市| 襄樊市| 聊城市| 邛崃市| 吉安市| 巫山县| 来安县| 喀喇| 临猗县| 呼图壁县| 新龙县| 会泽县| 麻栗坡县| 临高县| 东兴市| 格尔木市| 明光市| 凤台县| 佛山市| 含山县| 睢宁县| 乡城县| 田东县| 青岛市| 胶南市| 多伦县| 苗栗市| 五华县| 齐河县| 中宁县| 新丰县| 枞阳县| 防城港市| 博爱县|