- 量化投資與Python語言(21世紀經濟管理精品教材)
- 張翔
- 2019-09-09 16:27:00
第2章 大數據
2.1 大數據的定義
如果有人問你到底什么是大數據,可能你也不一定很容易解釋清楚吧,我的意思是至少讓對方覺得你很專業。至少我們不能說就是大的數據,或者說我用Excel操作了幾十萬的數據,也覺得是做的大數據。
這里我們仍然可以從分類的思想進行解釋。
我們面對這個紛繁復雜,充滿競爭的世界,需要一種收智商稅的能力,那就是分類的能力。
想想中國古代,周易是一個很先進的分類方法,把這個客觀世界進行了64種分類。《易傳·系辭上傳》:“易有太極,是生兩儀,兩儀生四象,四象生八卦。”我們可以看作是古人把信息做了一個分類,初步分成了8種。
關于一葉障目和一葉知秋。“一葉障目”相當于是用小樣本分析近似推理,而真理可能存在于全樣本的海量數據之中,借助大數據則可完全克服。“一葉知秋”其實就是反過來說的,小樣本可以預測大數據。
接下來談大數據,為什么我們現在才談大數據呢?這要從兩方面來看,一方面是計算機技術的發展,特別是存儲技術和計算技術的發展,以前不能存儲的數據現在可以存儲了,現在的科學計算技術更多更深入了,運行、計算速度越來越快;另一方面是信息爆炸式增長。而這兩方面就像DNA一樣是螺旋式增長的,是相互促進、相互影響的。
這么來看大數據就很清晰了,為什么提大數據,大數據怎么定義就很清楚了。
維基百科中只有短短的一句話:“巨量資料(big data),或稱大數據,指的是所涉及的資料量規模巨大到無法通過目前主流軟件工具,在合理時間內達到擷取、管理、處理并整理成為幫助企業經營決策更積極目的的資訊。”
維基百科的定義是從大數據的特征入手的。
我們還可以自己定義,比如按照大數據的功能進行定義:大數據是在多樣的或者大量數據中,迅速獲取信息的能力。
推薦閱讀
- 化學基礎實驗操作規范
- 蔡雯《新聞編輯學》(第2版)配套題庫【名校考研真題(視頻講解)+課后習題+章節題庫+模擬試題】
- 沈坤榮《宏觀經濟學教程》(第3版)筆記和課后習題詳解
- Creo Parametric 5.0項目教程(微課版)
- 安全行為學
- 刑事訴訟法學
- 跨國公司經營與管理(第2版)
- 國際關系學院國際關系與國際法專業(含723國際關系與國際法專業基礎、813國際關系與國際法專業綜合)歷年考研真題及詳解
- 龐皓《計量經濟學》(第2版)筆記和課后習題詳解
- 《馬克思主義基本原理》導學與實踐教程
- 劉炳善《英國文學簡史》(第3版)配套題庫【章節題庫(含名校考研真題)+模擬試題】
- DreamweaverCS6網頁設計實用教程
- 偏微分與變分技術在圖像分割中的應用研究
- 價值工程概論
- 管理學