- 零基礎(chǔ)入門Python數(shù)據(jù)分析與機(jī)器學(xué)習(xí)
- 王國平
- 1621字
- 2022-07-27 18:22:37
前言
人工智能(AI)是目前炙手可熱的一個領(lǐng)域,互聯(lián)網(wǎng)公司紛紛表示人工智能將是下一個時代的革命性技術(shù)。機(jī)器學(xué)習(xí)屬于人工智能的一個重要分支,其更偏向于理論,目的是讓計算機(jī)不斷從大量數(shù)據(jù)中學(xué)習(xí)知識,自動實(shí)現(xiàn)知識發(fā)現(xiàn)和預(yù)測,使結(jié)果不斷接近目標(biāo)。
在實(shí)際工作中,我們比較常見的是數(shù)據(jù)分析的概念,是用適當(dāng)?shù)慕y(tǒng)計分析方法對收集來的大量數(shù)據(jù)進(jìn)行分析,以求最大化地利用數(shù)據(jù),從而發(fā)揮其商業(yè)價值。目前,數(shù)據(jù)分析已經(jīng)是一種比較成熟的技術(shù),而機(jī)器學(xué)習(xí)還處于快速發(fā)展的過程中,主要依靠算法和數(shù)據(jù)進(jìn)行驅(qū)動。
在數(shù)據(jù)分析和機(jī)器學(xué)習(xí)研究熱潮中,相關(guān)圖書大多偏重于理論。由于Python是開源免費(fèi)的,而且目前市場上從零基礎(chǔ)深入介紹數(shù)據(jù)分析和機(jī)器學(xué)習(xí)的圖書較少,鑒于此,本書基于新版本的Python 3.10編寫,全面而系統(tǒng)地講解基于Python的數(shù)據(jù)分析和機(jī)器學(xué)習(xí)技術(shù)。
本書既包括Python數(shù)據(jù)分析的主要方法和技巧,又融入了機(jī)器學(xué)習(xí)的案例實(shí)戰(zhàn),使廣大讀者通過對本書的學(xué)習(xí),能夠輕松快速地掌握數(shù)據(jù)分析和機(jī)器學(xué)習(xí)的主要方法。本書配套資源中包含案例實(shí)戰(zhàn)中所采用的數(shù)據(jù)源,以及教學(xué)PPT和學(xué)習(xí)視頻,供讀者在閱讀本書時練習(xí)使用。
本書的內(nèi)容
第1章介紹數(shù)據(jù)分析的流程和思維、搭建Python 3.10開發(fā)環(huán)境以及必會的包(庫)。
第2章介紹Python核心基礎(chǔ),包括數(shù)據(jù)類型、基礎(chǔ)語法、常用高階函數(shù)和編程技巧。
第3章介紹如何進(jìn)行數(shù)據(jù)準(zhǔn)備,包括數(shù)據(jù)的讀取、索引、切片、聚合、透視、合并等。
第4章介紹NumPy基礎(chǔ)知識和操作,包括索引與切片、維度變換、廣播機(jī)制和矩陣運(yùn)算。
第5章介紹如何利用Pandas進(jìn)行數(shù)據(jù)清洗,包括重復(fù)值、缺失值、異常值的檢測和處理。
第6章介紹Matplotlib繪圖參數(shù)設(shè)置,包括線條、坐標(biāo)軸、圖例、繪圖函數(shù)和圖形整合等。
第7章介紹機(jī)器學(xué)習(xí)及Sklearn庫的基本概念、基本流程、主要算法和自帶的主要數(shù)據(jù)集等。
第8章介紹監(jiān)督式機(jī)器學(xué)習(xí)算法,包括線性回歸、邏輯回歸、決策樹、K近鄰和支持向量機(jī)等。
第9章介紹無監(jiān)督式機(jī)器學(xué)習(xí)算法、包括K均值聚類、主成分分析、關(guān)聯(lián)分析和雙聚類分析等。
第10章詳細(xì)介紹機(jī)器學(xué)習(xí)的挑戰(zhàn)、模型的主要評估方法,并通過實(shí)際案例介紹模型的調(diào)優(yōu)方法。
第11章介紹基于中文的文本分詞、關(guān)鍵詞提取技術(shù),以及如何生成詞向量和進(jìn)行中文情感分析。
本書的特色
(1)零基礎(chǔ)入手,精心設(shè)計知識體系
本書首先介紹Python 3.10版本的基礎(chǔ)語法,并針對初學(xué)者構(gòu)建數(shù)據(jù)分析與機(jī)器學(xué)習(xí)的實(shí)驗(yàn)環(huán)境,以便初學(xué)者無障礙上手。全書內(nèi)容循序漸進(jìn),在精要介紹基礎(chǔ)語法之后,還介紹了當(dāng)前流行的數(shù)據(jù)分析工具,最后介紹機(jī)器學(xué)習(xí)算法在數(shù)據(jù)分析和挖掘中的應(yīng)用,以便讀者通過閱讀本書能夠整體上掌握數(shù)據(jù)分析的重要工具、方法與技術(shù)。
(2)全面介紹流行工具的使用,應(yīng)對工作需求
本書主要針對當(dāng)前流行的數(shù)據(jù)分析工具分章介紹,包括數(shù)值計算工具NumPy、數(shù)據(jù)處理工具Pandas、數(shù)據(jù)可視化工具M(jìn)atplotlib、數(shù)據(jù)建模工具Sklearn等。每一個工具都從基礎(chǔ)講解,并輔之以案例演示,讀者可以邊學(xué)邊練,快速掌握技能。其中也有很多案例來自于工作實(shí)踐,可以真正提升讀者的實(shí)戰(zhàn)技能,讀者通過本書的學(xué)習(xí)能夠應(yīng)對工作需求。
(3)詳細(xì)講解十大機(jī)器學(xué)習(xí)算法,并輔之以豐富的案例
本書針對數(shù)據(jù)挖掘中經(jīng)常使用的算法進(jìn)行了詳細(xì)介紹,其中每一個算法首先介紹理論知識,然后給出算法在實(shí)際案例中的應(yīng)用,理論與實(shí)踐并重,可以幫助讀者真正理解算法并加以應(yīng)用,從而提高讀者數(shù)據(jù)分析和機(jī)器學(xué)習(xí)的綜合能力。
源碼、PPT課件、教學(xué)視頻下載
本書每一章都有對應(yīng)的數(shù)據(jù)源和完整代碼,代碼均包含具體的中文注釋。另外,本書還提供了教學(xué)PPT。讀者可以掃描以下二維碼獲取文件:


如果在下載過程中出現(xiàn)問題,請發(fā)送電子郵件至booksaga@126.com,郵件主題為“零基礎(chǔ)入門Python數(shù)據(jù)分析與機(jī)器學(xué)習(xí)”。
本書還提供了全程視頻教學(xué),讀者掃描書中各章的二維碼即可觀看學(xué)習(xí)。
本書的讀者對象
本書的內(nèi)容和案例適用于互聯(lián)網(wǎng)、咨詢、零售、能源等行業(yè)從事數(shù)據(jù)分析的讀者,也可以作為培訓(xùn)機(jī)構(gòu)或大專院校相關(guān)課程和專業(yè)的教學(xué)用書。
由于編者水平所限,雖然盡心竭力,但仍然難免存在疏漏之處,敬請廣大讀者與專家不吝指正。
編 者
2021年5月20日
- Spring 5企業(yè)級開發(fā)實(shí)戰(zhàn)
- Java:Data Science Made Easy
- Hands-On Microservices with Kotlin
- RabbitMQ Essentials
- Mastering Android Game Development
- Microsoft Azure Storage Essentials
- Procedural Content Generation for C++ Game Development
- C編程技巧:117個問題解決方案示例
- 從程序員角度學(xué)習(xí)數(shù)據(jù)庫技術(shù)(藍(lán)橋杯軟件大賽培訓(xùn)教材-Java方向)
- JavaScript悟道
- Xamarin Cross-Platform Development Cookbook
- 算法訓(xùn)練營:海量圖解+競賽刷題(入門篇)
- Web程序設(shè)計與架構(gòu)
- Swift iOS Programming for Kids
- 深度學(xué)習(xí)的數(shù)學(xué):使用Python語言