官术网_书友最值得收藏!

第2章 大數據

2.1 大數據的定義

如果有人問你到底什么是大數據,可能你也不一定很容易解釋清楚吧,我的意思是至少讓對方覺得你很專業。至少我們不能說就是大的數據,或者說我用Excel操作了幾十萬的數據,也覺得是做的大數據。

這里我們仍然可以從分類的思想進行解釋。

我們面對這個紛繁復雜,充滿競爭的世界,需要一種收智商稅的能力,那就是分類的能力。

想想中國古代,周易是一個很先進的分類方法,把這個客觀世界進行了64種分類。《易傳·系辭上傳》:“易有太極,是生兩儀,兩儀生四象,四象生八卦。”我們可以看作是古人把信息做了一個分類,初步分成了8種。

關于一葉障目和一葉知秋。“一葉障目”相當于是用小樣本分析近似推理,而真理可能存在于全樣本的海量數據之中,借助大數據則可完全克服。“一葉知秋”其實就是反過來說的,小樣本可以預測大數據。

接下來談大數據,為什么我們現在才談大數據呢?這要從兩方面來看,一方面是計算機技術的發展,特別是存儲技術和計算技術的發展,以前不能存儲的數據現在可以存儲了,現在的科學計算技術更多更深入了,運行、計算速度越來越快;另一方面是信息爆炸式增長。而這兩方面就像DNA一樣是螺旋式增長的,是相互促進、相互影響的。

這么來看大數據就很清晰了,為什么提大數據,大數據怎么定義就很清楚了。

維基百科中只有短短的一句話:“巨量資料(big data),或稱大數據,指的是所涉及的資料量規模巨大到無法通過目前主流軟件工具,在合理時間內達到擷取、管理、處理并整理成為幫助企業經營決策更積極目的的資訊。”

維基百科的定義是從大數據的特征入手的。

我們還可以自己定義,比如按照大數據的功能進行定義:大數據是在多樣的或者大量數據中,迅速獲取信息的能力。

主站蜘蛛池模板: 英德市| 天柱县| 三明市| 石景山区| 蓝田县| 罗甸县| 霍山县| 聂拉木县| 什邡市| 延寿县| 郁南县| 濮阳县| 平陆县| 凤冈县| 洮南市| 应城市| 大悟县| 逊克县| 广水市| 故城县| 康乐县| 嫩江县| 吉安市| 博客| 关岭| 政和县| 泸溪县| 韩城市| 屏东县| 岑巩县| 平湖市| 夏津县| 丹棱县| 朔州市| 富平县| 睢宁县| 绍兴市| 高要市| 永兴县| 巢湖市| 中江县|