- Jupyter數據科學實戰
- (印)普拉泰克·古普塔
- 365字
- 2020-11-21 11:56:29
1.2 數據科學的定義
眾所周知,數據覆蓋現代經濟的各個領域。麥肯錫咨詢公司在2013年的一份報告中預測大數據在美國醫療中的應用有望使醫療費用每年減少3000億~4500億美元,所節省的資金相當于2011年美國醫療相關支出(2.6萬億美元)基線水平的12%~17%。但是,質量較差的數據或者非結構化數據預計將讓美國每年損失高達3.1萬億美元[1]。
以數據驅動決策的理念越來越受歡迎。從非結構化數據中獲取信息比較復雜,并且也不能簡單地通過商業智能分析工具完成,因此數據科學應運而生。
數據科學是一個專注于從原始數據中提取知識和見解的跨學科領域,主要應用到數學、統計學、計算機科學和編程語言等學科,它們均為數據科學家的必備技能。找到問題的解決方案是數據科學家的職責所在,他們對此充滿好奇與熱情,擁有較強的自我驅動力。圖1-4展示了一名現代數據科學家應具備的技能組合。

圖1-4 現代數據科學家必備技能
推薦閱讀
- PHP 7底層設計與源碼實現
- 用Python實現深度學習框架
- GameMaker Programming By Example
- iOS編程基礎:Swift、Xcode和Cocoa入門指南
- HTML5從入門到精通(第4版)
- Natural Language Processing with Java and LingPipe Cookbook
- Java Web應用開發項目教程
- LabVIEW數據采集
- Functional Python Programming
- Android初級應用開發
- C語言從入門到精通(視頻實戰版)
- Build Your Own PaaS with Docker
- INSTANT Apache Maven Starter
- Neo4j Graph Data Modeling
- Learning Adobe Muse