書名: 大數據時代管理信息系統作者名: 周蘇 王碩蘋本章字數: 678字更新時間: 2019-10-24 10:29:49
1.2.2 大數據的定義
所謂大數據,狹義上可以定義為:用現有的一般技術難以管理的大量數據的集合。對大量數據進行分析,并從中獲得有用觀點,這種做法在一部分研究機構和大企業中,過去就已經存在。現在的大數據和過去相比,主要有三點區別:第一,隨著社交媒體和傳感器網絡等的發展,產生出大量且多樣的數據;第二,隨著硬件和軟件技術的發展,數據的存儲、處理成本大幅下降;第三,隨著云計算的興起,大數據的存儲、處理環境已經沒有必要自行搭建。
所謂“用現有的一般技術難以管理”,是指用目前在企業數據庫占據主流地位的關系型數據庫無法進行管理的、具有復雜結構的數據。或者也可以說,是指由于數據量的增大,導致對數據的查詢(Query)響應時間超出允許范圍的龐大數據。
研究機構Gartner給出了這樣的定義:“大數據”是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。
麥肯錫說:“大數據指的是所涉及的數據集規模已經超過了傳統數據庫軟件獲取、存儲、管理和分析的能力。這是一個被故意設計成主觀性的定義,并且是一個關于多大的數據集才能被認為是大數據的可變定義,即并不定義大于一個特定數字的數據才叫大數據。因為隨著技術的不斷發展,符合大數據標準的數據集容量也會增長;并且定義隨不同的行業也有變化,這依賴于在一個特定行業通常使用何種軟件,數據集有多大。因此,大數據在今天不同行業中的范圍可以從幾十太字節到幾拍字節。”
隨著“大數據”的出現,數據倉庫、數據安全、數據分析、數據挖掘等圍繞大數據商業價值的利用正逐漸成為行業人士爭相追捧的利潤焦點,在全球引領了又一輪數據技術革新的浪潮。