官术网_书友最值得收藏!

Python網(wǎng)絡(luò)爬蟲:從入門到精通

本書主要介紹如何使用Python語言進(jìn)行網(wǎng)絡(luò)爬蟲程序的開發(fā),從Python語言的基本特性入手,詳細(xì)介紹Python網(wǎng)絡(luò)爬蟲開發(fā)的多個(gè)方面,涉及HTTP、HTML、正則表達(dá)式、JavaScript、自然語言處理、數(shù)據(jù)處理與科學(xué)計(jì)算等不同領(lǐng)域的內(nèi)容。全書共12章,包括基礎(chǔ)篇、進(jìn)階篇、提高篇和實(shí)戰(zhàn)篇4個(gè)部分。基礎(chǔ)篇包括第1、2、3章,分別為Python基礎(chǔ)及網(wǎng)絡(luò)爬蟲、靜態(tài)網(wǎng)頁抓取、數(shù)據(jù)存儲(chǔ)。進(jìn)階篇包括第4、5、6章,分別為JavaScript與動(dòng)態(tài)內(nèi)容、模擬登錄與驗(yàn)證碼、爬蟲數(shù)據(jù)的分析與處理。提高篇包括第7、8、9章,分別為爬蟲的靈活性和多樣性、Selenium模擬瀏覽器與網(wǎng)站測(cè)試、爬蟲框架Scrapy與反爬蟲。實(shí)戰(zhàn)篇提供了3個(gè)實(shí)戰(zhàn)項(xiàng)目供讀者學(xué)習(xí)參考。本書內(nèi)容覆蓋網(wǎng)絡(luò)數(shù)據(jù)抓取與爬蟲編程中的主要知識(shí)和前沿技術(shù)。同時(shí),本書在重視理論基礎(chǔ)的前提下,從實(shí)用性和豐富度出發(fā),結(jié)合實(shí)例演示爬蟲程序編寫的核心流程,將理論與實(shí)踐結(jié)合,力求提高讀者的網(wǎng)絡(luò)爬蟲實(shí)操技能。本書可作為高等院校數(shù)據(jù)科學(xué)、統(tǒng)計(jì)學(xué)、計(jì)算機(jī)科學(xué)、軟件工程等相關(guān)專業(yè)課程的教材,也可作為Python語言初學(xué)者、網(wǎng)絡(luò)爬蟲技術(shù)愛好者的參考書。

呂云翔主編 ·高教教材 ·11.2萬字

QQ閱讀手機(jī)版

主站蜘蛛池模板: 合阳县| 江陵县| 乡宁县| 营山县| 西和县| 揭东县| 佳木斯市| 枞阳县| 鄂温| 蓬安县| 卢龙县| 平原县| 库伦旗| 高阳县| 石屏县| 钟祥市| 炉霍县| 百色市| 兰西县| 石泉县| 临沂市| 华容县| 思南县| 彰化县| 浦江县| 资阳市| 仙居县| 建宁县| 巴南区| 黄龙县| 甘德县| 同江市| 曲靖市| 额济纳旗| 甘孜县| 桃源县| 墨脱县| 威宁| 花莲市| 邵阳县| 义马市|