官术网_书友最值得收藏!

2.1 了解事務(wù)型數(shù)據(jù)和分析型數(shù)據(jù)之間的差異

當你向數(shù)據(jù)工程師詢問其組織內(nèi)數(shù)據(jù)之間的最廣泛區(qū)別時,可能會聽到“事務(wù)型數(shù)據(jù)”和“分析型數(shù)據(jù)”這兩個術(shù)語。事務(wù)型與分析型是在生態(tài)系統(tǒng)中對數(shù)據(jù)進行分類的方法。但該方法非常重要,如果你對數(shù)據(jù)質(zhì)量文化感興趣的話,就需要了解它。

雖然我們會在這里稍微深入研究事務(wù)型數(shù)據(jù),但就本書而言,我們一直都在并將持續(xù)關(guān)注與分析型數(shù)據(jù)相關(guān)的數(shù)據(jù)質(zhì)量。管理事務(wù)型數(shù)據(jù)的質(zhì)量和可靠性通常屬于開發(fā)運營(DevOps)的領(lǐng)域,而站點可靠性工程和其他軟件學科更關(guān)注由分析型數(shù)據(jù)構(gòu)建的軟件產(chǎn)品。

事務(wù)型數(shù)據(jù)

在運營過程中產(chǎn)生的數(shù)據(jù),即組織日常持續(xù)運營過程中(https://oreil.ly/kZmui)所產(chǎn)生的數(shù)據(jù)。某一時刻的庫存快照、客戶曝光次數(shù)和交易記錄都是事務(wù)型數(shù)據(jù)的示例。

分析型數(shù)據(jù)

在分析過程中用到的數(shù)據(jù)。分析型數(shù)據(jù)是由數(shù)據(jù)驅(qū)動的業(yè)務(wù)決策背后的數(shù)據(jù)類型。客戶流失情況、點擊率和在全球地區(qū)的曝光次數(shù)都是分析型數(shù)據(jù)的示例。

簡而言之,事務(wù)型數(shù)據(jù)記錄了來自實際業(yè)務(wù)流程中的數(shù)據(jù),以便快速更新系統(tǒng)和流程,而分析型數(shù)據(jù)則被用于更可靠、更高效的分析。一種更簡單的理解是:事務(wù)型數(shù)據(jù)在運行業(yè)務(wù),而分析型數(shù)據(jù)在管理業(yè)務(wù)。鑒于分析型數(shù)據(jù)在某種程度上推動了商業(yè)智能的發(fā)展,而事務(wù)型數(shù)據(jù)則不然,人們很可能會覺得分析型數(shù)據(jù)對組織的成功更為重要或更為“核心”。但實際上,分析型數(shù)據(jù)往往依賴于事務(wù)型數(shù)據(jù)的轉(zhuǎn)換和聚合。

這種事務(wù)型和分析型的區(qū)別,與聯(lián)機事務(wù)處理(On-Line Transaction Processing,OLTP)和聯(lián)機分析處理(On-Line Analytical Processing,OLAP)之間的比較相同,更多內(nèi)容可參考Designing Data-Intensive Applications(O'Reilly)一書。

主站蜘蛛池模板: 望奎县| 石泉县| 华阴市| 紫阳县| 磐石市| 广西| 雷州市| 灵丘县| 柳州市| 蒲城县| 和田县| 泌阳县| 修水县| 高淳县| 西青区| 英山县| 铁岭县| 师宗县| 拜城县| 治多县| 铜川市| 达尔| 信丰县| 鹤壁市| 武汉市| 贵南县| 大余县| 西平县| 秀山| 寻乌县| 濮阳市| 江口县| 旌德县| 武宁县| 芒康县| 阜南县| 乌审旗| 商水县| 鸡泽县| 兴海县| 青河县|