官术网_书友最值得收藏!

二、數據類型

企業面對的傳統數據主要是交易數據,而互聯網和物聯網的發展,帶來了諸如社交網站、傳感器等多種來源的數據。數據來源于不同的應用系統和設備,因此數據類型多種多樣。通常,我們把數據類型分為三類:結構化數據、半結構化數據和非結構化數據。

1. 結構化數據

結構化數據是按照特定的結構存儲的,通常以表格的形式呈現,每個數據項都有明確的定義和數據類型,數據間的因果關系較強。財務系統、信息管理系統、醫療系統等關系型數據庫產生的數據和Excel表格等都屬于結構化數據。

2. 半結構化數據

半結構化數據的數據結構并不完全固定,但是每個數據項仍然有明確的標識,數據間的因果關系較弱。XML文檔、JSON文檔、郵件、網頁等屬于半結構化數據。

3. 非結構化數據

非結構化數據的數據結構沒有明確的定義,數據項之間的關系也不明確,數據間沒有因果關系。文本、圖片、音頻、視頻等屬于非結構化數據。當前,非結構化數據越來越成為數據的主要部分。知名研究機構IDC的調查報告顯示:企業中80%的數據都是非結構化數據。

主站蜘蛛池模板: 易门县| 罗定市| 武威市| 枣阳市| 曲周县| 松桃| 博爱县| 盐源县| 开远市| 张家界市| 三明市| 墨江| 临沭县| 喜德县| 华安县| 香格里拉县| 苍南县| 石城县| 内黄县| 社旗县| 岐山县| 营山县| 宁南县| 保靖县| 新竹县| 大渡口区| 芦山县| 临武县| 康平县| 田林县| 福安市| 旌德县| 东乌珠穆沁旗| 沂水县| 武威市| 博乐市| 新蔡县| 商河县| 庄浪县| 普洱| 博爱县|