舉報

會員
深入淺出數據分析
(美)Michael Milton 著
更新時間:2023-12-13 15:23:51
開會員,本書免費讀 >
最新章節:
封底
我們生活在數據的天地里,我們的工作就是淋漓盡致地發揮數據的作用。從哪里起步?米爾頓編著的《深入淺出數據分析》將為你提供幫助。《深入淺出數據分析》以類似“章回小說”的活潑形式,生動地向讀者展現出色的數據分析人員應知應會的技術:數據分析基本步驟、實驗方法、優化方法、假設檢驗方法、貝葉斯統計方法、主觀概率法、啟發法、直方圖法、回歸法、誤差處理、相關數據庫、數據整理技巧;正文之后,意猶未盡地以三篇附錄介紹數據分析十大要務、R工具及ToolPak工具,在充分展現目標知識以外,為讀者搭建了走向深入研究的橋梁。無論你是研究新產品可行性的開發人員,還是評估廣告效果的市場營銷經理;無論你是向客戶呈報數據的營銷員,還是管理所有這些數據密集型部門及種種其他事務的個人企業家,《深入淺出數據分析》都能為你帶來全面的學習體驗,讓你將數據轉變為事業中有用的工具。
- 封底 更新時間:2023-12-13 15:23:51
- 索引
- 在Excel中安裝數據分析工具
- 附錄C:安裝Excel分析工具ToolPak
- R起步
- 附錄B:安裝R啟動R!
- 其十:你的專業技能
- 其九:Google Docs
- 其八:隨機性
- 其七:原假設-備擇假設檢驗
- 其六:非線性與多元回歸
- 其五:R社區
- 其四:數據透視表
- 其三:耶魯大學教授Edward Tufte(愛德華·塔夫特)的圖形原則
- 其二:Excel技巧
- 其一:統計知識大全
- 附錄A:尾聲 正文未及的十大要訣
- 再見……
- Head First獵頭公司正在一網打盡各種人才!
- 你創建了美觀、整潔、具有唯一性的記錄
- 刪除重復名字
- 這些數據有可能來源于某個關系數據庫
- 為數據排序,讓重復數值集中出現
- 可能尚未大功告成……
- 現在可以向客戶交貨了
- 用sub指令整理“名”
- R能用正則表達式處理復雜的數據模式
- 用嵌套文本公式處理復雜的模式
- 用SUBSTITUTE替換名字模式太麻煩了
- 所有的“姓”都整理好了
- 用SUBSTITUTE替換“^”字符
- Excel通過分隔符將數據分成多個列
- 將#號作為分隔符
- 一旦組織好數據,就能修復數據
- 清理混亂數據的根本在于準備
- Head First獵頭公司想為自己的銷售團隊搞到這份名單
- 數據分析不可告人的秘密
- 剛從停業的競爭對手那兒搞到一份客戶名單
- 13 整理數據 井然有序
- 你上了封面
- RDBMS數據可以進行無窮無盡的比較
- 《數據邦新聞》用SQL提取數據
- 《數據邦新聞》利用你的關系圖建立了一個RDBMS
- 用關系數據庫管理關系
- 復制并粘貼所有這些數據是件痛苦的事
- 看來你的散點圖確實畫得很好
- 通過匯總將文章數目和銷量關聯起來
- 創建一份穿過這條路徑的電子表格
- 找到一條貫穿各種關系的路線,以便進行必要的比較
- 數據庫就是一系列相互有特定關系的數據
- 你需要知道數據表之間的相互關系
- 這是他們保存的運營跟蹤數據
- 《數據邦新聞》希望分析銷量
- 12 關系數據庫 你能關聯嗎?
- 你的客戶紛紛回頭
- 相比原來的模型,分區模型能更好地處理誤差
- 優秀的回歸分析兼具解釋功能和預測功能
- 分割的根本目的是管理誤差
- R的線性模型匯總展示了均方根誤差
- R模型知道存在均方根誤差
- 用均方根誤差定量表示殘差分布
- 定量地指定誤差
- 機會誤差訪談
- 誤差對你和客戶都有好處
- 機會誤差=實際結果與模型預測結果之間的偏差
- 扭曲的加薪結果數據看起來是什么樣子?
- 你只解決了部分問題
- 由于使用外插法而慘遭解雇的家伙冷靜下來了
- 如何對待想對數據范圍以外的情況進行預測的客戶
- 要求加薪25%的家伙不在模型范圍內
- 客戶組成
- 你的加薪預測算法做了什么?
- 客戶大為惱火
- 11 誤差 合理誤差
- 你的加薪計算器沒有照計劃行事……
- 加薪計算器的算法正是回歸方程
- 回歸方程與散點圖密切相關
- 讓R創建一個回歸對象
- 你需要用一個等式進行精確預測
- 回歸線對于具有線性相關特點的數據很有用
- 回歸線預測出人們的實際加薪幅度
- 使用平均值圖形預測每個區間內的數值
- 直線能為客戶指明目標
- 用散點圖比較兩種變量
- 這個算法的玄機在于預測加薪幅度
- 稍等片刻……加薪計算器!
- 以獲取大幅度加薪為目的進行分析
- 你打算怎么花這些錢?
- 10 回歸 預測
- 談判要求加薪對你意味著什么?
- 加薪談判有回報
- 用數據的子集繪制直方圖
- R創建了美觀的直方圖
- 將數據加載到R程序
- 安裝并運行R
- 直方圖不同區間之間的缺口即數據點之間的缺口
- 直方圖體現每組數據的發生頻數
- 這是歷年加薪記錄
- 伸手要錢形式多樣
- 員工年度考評即將到來
- 9 直方圖 數字的形狀
- 看來你的分析打動了市議會的議員們
- 分析完畢,準備提交
- 固定模式都具有啟發性
- 是否有更簡單的方法評估邋遢集的成就?
- 使用快省樹
- 啟發法是從直覺走向最優化的橋梁
- 無法建立和運用統一的散亂垃圾計量模型
- 數據邦市的散亂垃圾結構復雜
- 問題刁鉆,回答簡單
- 計量垃圾量不可行
- 他們的任務是減少散亂垃圾量
- 邋遢集已經計量了自己的工作效果
- 邋遢集確實把鎮上打掃得干干凈凈
- 邋遢集向市議會提交了報告
- 8 啟發法 憑人類的天性做分析
- 俄羅斯股民歡欣鼓舞!
- 首席執行官完全知道該怎么處理這條新信息了
- 貝葉斯規則是修正主觀概率的好辦法
- 這條新聞讓你措手不及
- 標準偏差量度分析點與平均值的偏差
- 首席執行官欣賞你的工作
- 首席執行官不明白你在忙些什么
- 分析師們答復的主觀概率
- 主觀概率可能表明:根本不存在真正的分歧
- 主觀概率體現專家信念
- 分析師們相互叫陣
- 背水投資公司需要你效力
- 7 主觀概率 信念數字化
- 放心多了!
- 新信息會改變你的基礎概率
- 新試驗的正確性統計值有變化
- 第二次試驗結果:陰性
- 貝葉斯規則可以反復使用
- 搜集到新數據后,用貝葉斯規則處理基礎概率
- 用簡單的整數思考復雜的概率
- 你患蜥蜴流感的幾率仍然非常低
- 1%的人患蜥蜴流感
- 你需要算算□
- 這些術語說的都是條件概率
- 你計算的是假陽性
- 蜥蜴流感到底有多普遍?
- 讓我們逐條細讀正確性分析
- 醫生帶來惱人的消息
- 6 貝葉斯統計 穿越第一關
- 即將上市!
- 你剛剛收到一條圖片短信……
- 無法一一剔除所有假設,但可以判定哪個假設最強
- 借助診斷性找出否定性最小的假設
- 假設檢驗的核心是證偽
- 用手頭的資料進行假設檢驗
- 假設幾個PodPhone備選方案
- 現實世界中的各種原因呈網絡關系,而非線性關系
- 變量之間可以正相關,也可以負相關
- 電膚得到了機密《戰略備忘錄》
- 電膚的分析與數據相符嗎?
- 我們得知的全部信息
- PodPhone不希望別人看透他們的下一步行動
- 我們何時開始生產新手機皮膚?
- 給我來塊“皮膚”……
- 5 假設檢驗 假設并非如此
- 訂單從四面八方滾滾而來!
- 客戶欣賞你的工作
- 實驗設計師們有自己的假設
- 實驗設計師出聲了
- 優秀的圖形設計有助于思考的原因
- 圖形很棒,但網站掌門人仍不滿意
- 同時展示多張圖形,體現更多變量
- 最優秀的圖形都是多元圖形
- 使用散點圖探索原因
- 你的圖形已經比被打入冷宮的圖形更有用
- 數據圖形化的根本在于正確比較
- 讓數據變美觀也不是你要解決的問題
- 數據太多絕不會成為你的問題
- 這是前一位設計師主動提供的意見
- 體現數據!
- 這些圖形隱含哪些數據?
- 前一位信息設計師提交的三份信息圖
- 結果面世,信息設計師出局
- New Army需要優化網站
- 4 數據圖形化 圖形讓你更精明
- 你的假設立足于不斷變化的實際情況
- 新方案立竿見影
- 提防負相關變量
- 按照分析目標校正假設
- 你的模型只是描述了你規定的情況
- 利潤跌穿地板
- Solver一氣呵成解決最優化問題
- 用電子表格實現最優化
- 新約束條件改變了可行區域
- 合理的選擇都出現在可行區域里
- 在同一張圖形里繪制多種約束條件
- 列出有其他約束條件的產品組合
- 你的目標函數
- 借助目標函數發現目標
- 你碰到了一個最優化問題
- 決策變量是你能控制的因素
- 你能控制的變量受到約束條件的限制
- 現在是浴盆玩具游戲時間
- 3 最優化 尋找最大值
- 星巴仕找到了與經驗吻合的銷售策略
- 結果在此
- 準備就緒,開始實驗
- 隨機訪談
- 隨機選擇相似組
- 精心選擇分組,避免混雜因素
- 實驗照樣會毀于混雜因素
- 一個月后……
- 認真讓我們重新做一次實驗
- 避免解雇123
- 以控制組為基準
- 一個月后……
- 星巴仕降價了
- 星巴仕首席執行官已經急不可待
- 你需要做一個實驗,指出哪種策略最有效
- 情況比預料的更糟!
- 拆分數據塊,管理混雜因素
- 店址可能對分析結果有哪些影響
- 觀察分析法充滿混雜因素
- 一位典型客戶的想法
- 價值感是導致銷售收入下滑的原因嗎?
- 比較是破解觀察數據的法寶
- 務必使用比較法
- 星巴仕調查表
- 星巴仕董事會將在三個月內召開
- 咖啡業的寒冬到了!
- 2 實驗 檢驗你的理論
- 你的分析讓客戶作出了英明的決策
- 回顧你的工作
- 泛美批發公司確認了你的印象
- 深入挖掘數據
- Acme給你發來了一長串原始數據
- 首席執行官承認自己有所不知
- 心智模型應當包括你不了解的因素
- 統計模型取決于心智模型
- 你對外界的假設和你確信的觀點就是你的心智模型
- 首席執行官確信的觀點讓你誤入歧途
- 一則新聞
- 首席執行官欣賞你的工作
- 報告寫好了
- 提出建議
- 分析從你介入的那一刻開始
- 評估組塊
- 現在再來看看了解到的情況
- 把問題和數據分解為更小的組塊
- Acme化妝品公司首席執行官給了你一些反饋
- 客戶將幫助你確定問題
- 確定問題
- 數據分析就是仔細推敲證據
- 首席執行官希望數據分析師幫他提高銷量
- Acme化妝品公司需要你出力
- 1 數據分析引言 分解數據
- 致謝
- 技術顧問組
- 自述
- 我們的做法
- 元認知:對思考的思考
- 我們了解你的大腦在想什么
- 我們了解你在想什么
- 誰適合閱讀本書?
- 序言
- 譯者序
- 作者簡介
- 獻給
- 內容簡介
- 文前
- 深入淺出系列圖書美譽
- 本書薦辭
- 版權信息
- 封面
- 封面
- 版權信息
- 本書薦辭
- 深入淺出系列圖書美譽
- 文前
- 內容簡介
- 獻給
- 作者簡介
- 譯者序
- 序言
- 誰適合閱讀本書?
- 我們了解你在想什么
- 我們了解你的大腦在想什么
- 元認知:對思考的思考
- 我們的做法
- 自述
- 技術顧問組
- 致謝
- 1 數據分析引言 分解數據
- Acme化妝品公司需要你出力
- 首席執行官希望數據分析師幫他提高銷量
- 數據分析就是仔細推敲證據
- 確定問題
- 客戶將幫助你確定問題
- Acme化妝品公司首席執行官給了你一些反饋
- 把問題和數據分解為更小的組塊
- 現在再來看看了解到的情況
- 評估組塊
- 分析從你介入的那一刻開始
- 提出建議
- 報告寫好了
- 首席執行官欣賞你的工作
- 一則新聞
- 首席執行官確信的觀點讓你誤入歧途
- 你對外界的假設和你確信的觀點就是你的心智模型
- 統計模型取決于心智模型
- 心智模型應當包括你不了解的因素
- 首席執行官承認自己有所不知
- Acme給你發來了一長串原始數據
- 深入挖掘數據
- 泛美批發公司確認了你的印象
- 回顧你的工作
- 你的分析讓客戶作出了英明的決策
- 2 實驗 檢驗你的理論
- 咖啡業的寒冬到了!
- 星巴仕董事會將在三個月內召開
- 星巴仕調查表
- 務必使用比較法
- 比較是破解觀察數據的法寶
- 價值感是導致銷售收入下滑的原因嗎?
- 一位典型客戶的想法
- 觀察分析法充滿混雜因素
- 店址可能對分析結果有哪些影響
- 拆分數據塊,管理混雜因素
- 情況比預料的更糟!
- 你需要做一個實驗,指出哪種策略最有效
- 星巴仕首席執行官已經急不可待
- 星巴仕降價了
- 一個月后……
- 以控制組為基準
- 避免解雇123
- 認真讓我們重新做一次實驗
- 一個月后……
- 實驗照樣會毀于混雜因素
- 精心選擇分組,避免混雜因素
- 隨機選擇相似組
- 隨機訪談
- 準備就緒,開始實驗
- 結果在此
- 星巴仕找到了與經驗吻合的銷售策略
- 3 最優化 尋找最大值
- 現在是浴盆玩具游戲時間
- 你能控制的變量受到約束條件的限制
- 決策變量是你能控制的因素
- 你碰到了一個最優化問題
- 借助目標函數發現目標
- 你的目標函數
- 列出有其他約束條件的產品組合
- 在同一張圖形里繪制多種約束條件
- 合理的選擇都出現在可行區域里
- 新約束條件改變了可行區域
- 用電子表格實現最優化
- Solver一氣呵成解決最優化問題
- 利潤跌穿地板
- 你的模型只是描述了你規定的情況
- 按照分析目標校正假設
- 提防負相關變量
- 新方案立竿見影
- 你的假設立足于不斷變化的實際情況
- 4 數據圖形化 圖形讓你更精明
- New Army需要優化網站
- 結果面世,信息設計師出局
- 前一位信息設計師提交的三份信息圖
- 這些圖形隱含哪些數據?
- 體現數據!
- 這是前一位設計師主動提供的意見
- 數據太多絕不會成為你的問題
- 讓數據變美觀也不是你要解決的問題
- 數據圖形化的根本在于正確比較
- 你的圖形已經比被打入冷宮的圖形更有用
- 使用散點圖探索原因
- 最優秀的圖形都是多元圖形
- 同時展示多張圖形,體現更多變量
- 圖形很棒,但網站掌門人仍不滿意
- 優秀的圖形設計有助于思考的原因
- 實驗設計師出聲了
- 實驗設計師們有自己的假設
- 客戶欣賞你的工作
- 訂單從四面八方滾滾而來!
- 5 假設檢驗 假設并非如此
- 給我來塊“皮膚”……
- 我們何時開始生產新手機皮膚?
- PodPhone不希望別人看透他們的下一步行動
- 我們得知的全部信息
- 電膚的分析與數據相符嗎?
- 電膚得到了機密《戰略備忘錄》
- 變量之間可以正相關,也可以負相關
- 現實世界中的各種原因呈網絡關系,而非線性關系
- 假設幾個PodPhone備選方案
- 用手頭的資料進行假設檢驗
- 假設檢驗的核心是證偽
- 借助診斷性找出否定性最小的假設
- 無法一一剔除所有假設,但可以判定哪個假設最強
- 你剛剛收到一條圖片短信……
- 即將上市!
- 6 貝葉斯統計 穿越第一關
- 醫生帶來惱人的消息
- 讓我們逐條細讀正確性分析
- 蜥蜴流感到底有多普遍?
- 你計算的是假陽性
- 這些術語說的都是條件概率
- 你需要算算□
- 1%的人患蜥蜴流感
- 你患蜥蜴流感的幾率仍然非常低
- 用簡單的整數思考復雜的概率
- 搜集到新數據后,用貝葉斯規則處理基礎概率
- 貝葉斯規則可以反復使用
- 第二次試驗結果:陰性
- 新試驗的正確性統計值有變化
- 新信息會改變你的基礎概率
- 放心多了!
- 7 主觀概率 信念數字化
- 背水投資公司需要你效力
- 分析師們相互叫陣
- 主觀概率體現專家信念
- 主觀概率可能表明:根本不存在真正的分歧
- 分析師們答復的主觀概率
- 首席執行官不明白你在忙些什么
- 首席執行官欣賞你的工作
- 標準偏差量度分析點與平均值的偏差
- 這條新聞讓你措手不及
- 貝葉斯規則是修正主觀概率的好辦法
- 首席執行官完全知道該怎么處理這條新信息了
- 俄羅斯股民歡欣鼓舞!
- 8 啟發法 憑人類的天性做分析
- 邋遢集向市議會提交了報告
- 邋遢集確實把鎮上打掃得干干凈凈
- 邋遢集已經計量了自己的工作效果
- 他們的任務是減少散亂垃圾量
- 計量垃圾量不可行
- 問題刁鉆,回答簡單
- 數據邦市的散亂垃圾結構復雜
- 無法建立和運用統一的散亂垃圾計量模型
- 啟發法是從直覺走向最優化的橋梁
- 使用快省樹
- 是否有更簡單的方法評估邋遢集的成就?
- 固定模式都具有啟發性
- 分析完畢,準備提交
- 看來你的分析打動了市議會的議員們
- 9 直方圖 數字的形狀
- 員工年度考評即將到來
- 伸手要錢形式多樣
- 這是歷年加薪記錄
- 直方圖體現每組數據的發生頻數
- 直方圖不同區間之間的缺口即數據點之間的缺口
- 安裝并運行R
- 將數據加載到R程序
- R創建了美觀的直方圖
- 用數據的子集繪制直方圖
- 加薪談判有回報
- 談判要求加薪對你意味著什么?
- 10 回歸 預測
- 你打算怎么花這些錢?
- 以獲取大幅度加薪為目的進行分析
- 稍等片刻……加薪計算器!
- 這個算法的玄機在于預測加薪幅度
- 用散點圖比較兩種變量
- 直線能為客戶指明目標
- 使用平均值圖形預測每個區間內的數值
- 回歸線預測出人們的實際加薪幅度
- 回歸線對于具有線性相關特點的數據很有用
- 你需要用一個等式進行精確預測
- 讓R創建一個回歸對象
- 回歸方程與散點圖密切相關
- 加薪計算器的算法正是回歸方程
- 你的加薪計算器沒有照計劃行事……
- 11 誤差 合理誤差
- 客戶大為惱火
- 你的加薪預測算法做了什么?
- 客戶組成
- 要求加薪25%的家伙不在模型范圍內
- 如何對待想對數據范圍以外的情況進行預測的客戶
- 由于使用外插法而慘遭解雇的家伙冷靜下來了
- 你只解決了部分問題
- 扭曲的加薪結果數據看起來是什么樣子?
- 機會誤差=實際結果與模型預測結果之間的偏差
- 誤差對你和客戶都有好處
- 機會誤差訪談
- 定量地指定誤差
- 用均方根誤差定量表示殘差分布
- R模型知道存在均方根誤差
- R的線性模型匯總展示了均方根誤差
- 分割的根本目的是管理誤差
- 優秀的回歸分析兼具解釋功能和預測功能
- 相比原來的模型,分區模型能更好地處理誤差
- 你的客戶紛紛回頭
- 12 關系數據庫 你能關聯嗎?
- 《數據邦新聞》希望分析銷量
- 這是他們保存的運營跟蹤數據
- 你需要知道數據表之間的相互關系
- 數據庫就是一系列相互有特定關系的數據
- 找到一條貫穿各種關系的路線,以便進行必要的比較
- 創建一份穿過這條路徑的電子表格
- 通過匯總將文章數目和銷量關聯起來
- 看來你的散點圖確實畫得很好
- 復制并粘貼所有這些數據是件痛苦的事
- 用關系數據庫管理關系
- 《數據邦新聞》利用你的關系圖建立了一個RDBMS
- 《數據邦新聞》用SQL提取數據
- RDBMS數據可以進行無窮無盡的比較
- 你上了封面
- 13 整理數據 井然有序
- 剛從停業的競爭對手那兒搞到一份客戶名單
- 數據分析不可告人的秘密
- Head First獵頭公司想為自己的銷售團隊搞到這份名單
- 清理混亂數據的根本在于準備
- 一旦組織好數據,就能修復數據
- 將#號作為分隔符
- Excel通過分隔符將數據分成多個列
- 用SUBSTITUTE替換“^”字符
- 所有的“姓”都整理好了
- 用SUBSTITUTE替換名字模式太麻煩了
- 用嵌套文本公式處理復雜的模式
- R能用正則表達式處理復雜的數據模式
- 用sub指令整理“名”
- 現在可以向客戶交貨了
- 可能尚未大功告成……
- 為數據排序,讓重復數值集中出現
- 這些數據有可能來源于某個關系數據庫
- 刪除重復名字
- 你創建了美觀、整潔、具有唯一性的記錄
- Head First獵頭公司正在一網打盡各種人才!
- 再見……
- 附錄A:尾聲 正文未及的十大要訣
- 其一:統計知識大全
- 其二:Excel技巧
- 其三:耶魯大學教授Edward Tufte(愛德華·塔夫特)的圖形原則
- 其四:數據透視表
- 其五:R社區
- 其六:非線性與多元回歸
- 其七:原假設-備擇假設檢驗
- 其八:隨機性
- 其九:Google Docs
- 其十:你的專業技能
- 附錄B:安裝R啟動R!
- R起步
- 附錄C:安裝Excel分析工具ToolPak
- 在Excel中安裝數據分析工具
- 索引
- 封底 更新時間:2023-12-13 15:23:51