- 大數據財務分析(第2版·微課版)
- 張立軍 李瓊 侯小坤主編
- 422字
- 2024-02-26 14:48:35
二、數據類型
企業面對的傳統數據主要是交易數據,而互聯網和物聯網的發展,帶來了諸如社交網站、傳感器等多種來源的數據。數據來源于不同的應用系統和設備,因此數據類型多種多樣。通常,我們把數據類型分為三類:結構化數據、半結構化數據和非結構化數據。
1. 結構化數據
結構化數據是按照特定的結構存儲的,通常以表格的形式呈現,每個數據項都有明確的定義和數據類型,數據間的因果關系較強。財務系統、信息管理系統、醫療系統等關系型數據庫產生的數據和Excel表格等都屬于結構化數據。
2. 半結構化數據
半結構化數據的數據結構并不完全固定,但是每個數據項仍然有明確的標識,數據間的因果關系較弱。XML文檔、JSON文檔、郵件、網頁等屬于半結構化數據。
3. 非結構化數據
非結構化數據的數據結構沒有明確的定義,數據項之間的關系也不明確,數據間沒有因果關系。文本、圖片、音頻、視頻等屬于非結構化數據。當前,非結構化數據越來越成為數據的主要部分。知名研究機構IDC的調查報告顯示:企業中80%的數據都是非結構化數據。