官术网_书友最值得收藏!

本書內容介紹

本書講述了世界知名公司的數據科學家經常使用的各種技術,還介紹了如何應用這些技術創造性地解決不同行業中的問題。下面簡單介紹各章的內容。

第1章——探索性數據分析:解決數據科學問題的第一步是數據探索,包括在Python中讀取數據、計算匯總統計信息、對數據進行可視化,以及發現一些常識性的見解等。

第2章——預測:主要介紹線性回歸,線性回歸是統計學中的一種常用技術,可以用來確定定量、變量之間的關系,甚至可以用來預測未來。

第3章——分組比較:主要介紹假設檢驗的探索和比較分組測量的標準統計方法。

第4章——A/B測試:討論如何使用實驗來確定哪種業務實踐最有效。

第5章——二分類算法:介紹邏輯回歸和線性概率模型等內容。

第6章——監督學習:深入探討幾種用于預測的機器學習方法,包括kNN、決策樹、隨機森林和神經網絡等。

第7章——無監督學習:介紹無監督學習的基本知識及EM聚類,以及其他聚類方法與無監督學習的關系。

第8章——網絡爬?。航榻B從公開網站自動下載數據的方法以及正則表達式和Beautiful Soup等。

第9章——推薦系統:討論如何建立一個自動向客戶推薦商品的系統。

第10章——自然語言處理:探索一種將文本轉換為可用于各種數據科學分析的定量向量的高級方法。

第11章——其他語言中的數據科學:介紹SQL和R這兩種經常用于數據科學的語言。

主站蜘蛛池模板: 江源县| 金昌市| 惠水县| 沂南县| 吉安市| 五河县| 齐河县| 朝阳县| 彩票| 遵义县| 遵义县| 玉龙| 莱芜市| 鹤峰县| 长沙市| 大竹县| 金沙县| 河东区| 吴桥县| 扎兰屯市| 孟州市| 长岛县| 义乌市| 盖州市| 自治县| 德昌县| 汤原县| 保德县| 遂宁市| 绿春县| 乌拉特前旗| 随州市| 桐乡市| 从江县| 延寿县| 洛川县| 岳阳县| 永修县| 平安县| 梁河县| 安国市|