- 數據可視化:從小白到數據工程師的成長之路
- 劉英華
- 1088字
- 2020-07-24 10:01:17
前 言
寫作目的
在當前的大數據時代,數據是一種闡明和支撐觀點的常用手段。為了更準確地理解數據(如數字、文本、圖片、音頻和視頻等),需要從大量的數據中篩選出有用的信息,然后分析數據發現規律,最后將晦澀的數據轉換為易于理解的數據可視化作品,如一個圖表或動態圖片,幾幅地圖、一段動畫,甚至是一段視頻,這些包含多種形式的數據可視化作品可以清晰有效地傳達、溝通和展示數據,讓用戶快速地抓住數據中的重點,發現數據的規律,理解數據背后的深意。
現有的數據可視化相關書籍對讀者有較高的編程要求,入門較難,適合開發人員和相關從業者閱讀和學習,且缺乏數據可視化原則和數據可視化作品發布這兩個重要環節。本書簡化了數據可視化入門難度,提升了數據可視化能力在各個專業和行業的普及,實現了零編程基礎的數據可視化。
本書內容
第1章 基礎知識,闡述學習數據可視化的必要概念,包括模擬和數字、數模轉換、進制、存儲單位、因特網、域名和網絡速度等。
第2章 數據獲取,講解不需編程獲取數據的方法,包括數據搜索、依申請公開數據、數據眾包及import.io和Octoparse兩種抓取工具;需要Python編程獲取數據的方法,包括Python基礎和Beautiful Soup庫;多媒體數據的獲取,包括圖片、音頻和視頻的獲取及其格式轉化方法。
第3章 數據清理,介紹Python基礎編程,通過案例實現缺失值、格式內容、邏輯錯誤和非需求數據的清洗,最后是兩個綜合案例。
第4章 數據分析,通過數據定位案例讓讀者了解基本數據,實現條件篩選和排序以及數據的描述性分析。
第5章 可視化基礎和原則,介紹圖表的種類和圖表設計原則,色彩暗示,通過4個圖表可視化的失敗案例掌握圖表可視化原則,通過5個案例說明設計排版原則。
第6章 數據可視化工具,主要介紹信息圖制作工具、數據可視化工具Gapminder、Datawrapper、Gephi、QGIS、ECharts和Tableau等。
第7章 可視化作品發布,介紹網絡基礎、HTML5和JavaScript基礎知識,以及Web應用框架和模板、數據可視化作品發布流程。
讀前準備
?Windows或Mac操作系統,接入互聯網,Firefox瀏覽器。
?環境配置,具體見2.7.1節。
?安裝Jupyter Notebook,具體見3.1節。
?科研工作者或學生可以申請1年期限的免費Tableau試用許可證,具體見6.7節。
感謝
首先,感謝購買本書的讀者。您的閱讀是我寫作動力的源泉。數據可視化的發展日新月異,真心希望您在閱讀本書后提出寶貴的意見,我們可以共同探討問題,為后續書籍的撰寫提供素材和經驗。
其次,感謝我的愛人和父母。撰寫書稿讓我沒有足夠的時間陪伴他們,感謝家人的理解和支持。
最后,感謝電子工業出版社的編輯們,他們對書稿傾注了大量的心血,并提出了諸多細致的修改意見,保證了本書的順利出版。
聯系作者
如果您對本書有任何想法和建議,或者想與作者探討某個問題,請隨時與我聯系yinghliu@163.com。
劉英華
2019年10月于北京
- InfluxDB原理與實戰
- Learning JavaScriptMVC
- 商業分析思維與實踐:用數據分析解決商業問題
- 數據要素五論:信息、權屬、價值、安全、交易
- Mastering Machine Learning with R(Second Edition)
- 數據庫技術及應用教程
- 深入淺出 Hyperscan:高性能正則表達式算法原理與設計
- MySQL數據庫技術與應用
- Expert Python Programming(Third Edition)
- Access數據庫開發從入門到精通
- 大數據分析:R基礎及應用
- 利用Python進行數據分析(原書第2版)
- 智能與數據重構世界
- Learning Ansible
- ORACLE 11g權威指南