- 數(shù)據(jù)質(zhì)量管理:數(shù)據(jù)可靠性與數(shù)據(jù)質(zhì)量問題解決之道
- (美)巴爾·摩西等
- 635字
- 2024-08-19 16:20:01
2.1 了解事務(wù)型數(shù)據(jù)和分析型數(shù)據(jù)之間的差異
當你向數(shù)據(jù)工程師詢問其組織內(nèi)數(shù)據(jù)之間的最廣泛區(qū)別時,可能會聽到“事務(wù)型數(shù)據(jù)”和“分析型數(shù)據(jù)”這兩個術(shù)語。事務(wù)型與分析型是在生態(tài)系統(tǒng)中對數(shù)據(jù)進行分類的方法。但該方法非常重要,如果你對數(shù)據(jù)質(zhì)量文化感興趣的話,就需要了解它。
雖然我們會在這里稍微深入研究事務(wù)型數(shù)據(jù),但就本書而言,我們一直都在并將持續(xù)關(guān)注與分析型數(shù)據(jù)相關(guān)的數(shù)據(jù)質(zhì)量。管理事務(wù)型數(shù)據(jù)的質(zhì)量和可靠性通常屬于開發(fā)運營(DevOps)的領(lǐng)域,而站點可靠性工程和其他軟件學科更關(guān)注由分析型數(shù)據(jù)構(gòu)建的軟件產(chǎn)品。
事務(wù)型數(shù)據(jù)
在運營過程中產(chǎn)生的數(shù)據(jù),即組織日常持續(xù)運營過程中(https://oreil.ly/kZmui)所產(chǎn)生的數(shù)據(jù)。某一時刻的庫存快照、客戶曝光次數(shù)和交易記錄都是事務(wù)型數(shù)據(jù)的示例。
分析型數(shù)據(jù)
在分析過程中用到的數(shù)據(jù)。分析型數(shù)據(jù)是由數(shù)據(jù)驅(qū)動的業(yè)務(wù)決策背后的數(shù)據(jù)類型。客戶流失情況、點擊率和在全球地區(qū)的曝光次數(shù)都是分析型數(shù)據(jù)的示例。
簡而言之,事務(wù)型數(shù)據(jù)記錄了來自實際業(yè)務(wù)流程中的數(shù)據(jù),以便快速更新系統(tǒng)和流程,而分析型數(shù)據(jù)則被用于更可靠、更高效的分析。一種更簡單的理解是:事務(wù)型數(shù)據(jù)在運行業(yè)務(wù),而分析型數(shù)據(jù)在管理業(yè)務(wù)。鑒于分析型數(shù)據(jù)在某種程度上推動了商業(yè)智能的發(fā)展,而事務(wù)型數(shù)據(jù)則不然,人們很可能會覺得分析型數(shù)據(jù)對組織的成功更為重要或更為“核心”。但實際上,分析型數(shù)據(jù)往往依賴于事務(wù)型數(shù)據(jù)的轉(zhuǎn)換和聚合。
這種事務(wù)型和分析型的區(qū)別,與聯(lián)機事務(wù)處理(On-Line Transaction Processing,OLTP)和聯(lián)機分析處理(On-Line Analytical Processing,OLAP)之間的比較相同,更多內(nèi)容可參考Designing Data-Intensive Applications(O'Reilly)一書。
- 信息系統(tǒng)與數(shù)據(jù)科學
- Effective Amazon Machine Learning
- 分布式數(shù)據(jù)庫系統(tǒng):大數(shù)據(jù)時代新型數(shù)據(jù)庫技術(shù)(第3版)
- Live Longer with AI
- 大數(shù)據(jù):從概念到運營
- 數(shù)據(jù)驅(qū)動設(shè)計:A/B測試提升用戶體驗
- 大數(shù)據(jù)精準挖掘
- Instant Autodesk AutoCAD 2014 Customization with .NET
- Solaris操作系統(tǒng)原理實驗教程
- Power BI智能數(shù)據(jù)分析與可視化從入門到精通
- 數(shù)據(jù)庫技術(shù)及應(yīng)用
- 聯(lián)動Oracle:設(shè)計思想、架構(gòu)實現(xiàn)與AWR報告
- 貫通SQL Server 2008數(shù)據(jù)庫系統(tǒng)開發(fā)
- 數(shù)據(jù)挖掘競賽實戰(zhàn):方法與案例
- Swift Functional Programming(Second Edition)