官术网_书友最值得收藏!

第3章 大數據:有所為有所不為

3.1 大數據分析最佳實踐

很顯然,與任何其他技術或過程一樣,大數據問題也有最佳實踐。在大多數情況下,最佳實踐通常來自多年的測試和測量結果,以此作為基礎,不斷發展。然而,如今的大數據概念要相對新穎,在推導相關最佳實踐的過程中人們總會去依賴并利用此前經過證明的有效方法。盡管如此,當前各種新的最佳實踐正如雨后春筍般不斷浮現,這意味著我們仍然可以從他人的錯誤和成功中吸取經驗教訓并由此判斷出哪些才是真正有效的方法。

大數據的革命性特質往往會影響最佳實踐,因此今日的最佳到明日可能就不再無懈可擊。也就是說,在大數據分析方面,應該會存在一些核心的成熟技術,它們能夠經受住時間的檢驗。在名詞、技能集、產品和供應商不斷推陳出新的情況下,大數據分析的世界似乎越發讓人感到陌生,但是經過實踐證明的數據管理最佳實踐在這個仍屬新興的領域中依然能夠發揮良好的作用。

和所有商業智能(BI)和/或數據倉庫計劃一樣,除非已經充分了解組織的數據管理要求并制定好完備的戰略,否則任何人都無法在大數據分析這條道路上走得太遠。大數據分析已經被廣泛炒作,而各行各業的公司也已被不斷翻新的數據源和更為龐雜的數據量所淹沒。在沒有充分了解的情況下對大數據領域進行重大投資并認為這能夠為自己的企業帶來實際性增值,這是該領域潛在用戶容易產生的最大誤解之一。

獲得成功的訣竅是從商業角度看待問題,同時不要過度關注技術,要做到這一點可能需要首席信息官(CIO)、數據科學家和其他商務人士之間進行深入的探討以確定業務的目標并找出真正有價值的數據。在具體實踐中,至關重要的是要準確界定可用的數據并為組織設計出資源的最優利用方案。

CIO、IT經理以及BI和數據倉庫專業人員需要檢查當前被保留、整合和使用的數據并將其與正在被丟棄的數據進行比較。另一個關鍵步驟在于考慮目前尚未觸及到的外部數據源中有哪些可能對現有的資源組合產生良好的補充作用。即使公司目前尚不確定自己應在何時以何種方式投入大數據分析的浪潮,但他們也應盡早進行這種評估。

數據積累的量變是為最后的質變做準備,即使一開始你并不清楚大數據的用途。上述過程的訣竅在于盡早地開始數據積累,否則你可能會錯失機會,原因是某些稍縱即逝的數據可能會被錯過,而你在啟動大數據工程后可能沒有足夠的信息追溯能力來找回這些資源。

3.2 從小做起

在大數據分析過程中,我們應該找出微小但高價值的機會,并以這些機會為起點。在理想情況下,組織能夠通過完成這些較小的任務積累必要的專業知識,為將來進行大型的分析做好準備。鑒于作為分析目標的數據源和信息類型會不斷擴展,同時相關公司會開始創建各種重要的分析模型以便更好地揭示結構化和非結構化數據的模式和這兩種數據之間的相關性,相關公司必須要關注的是,要根據其所闡明的業務目標,找出那些重要程度最高的調查結果。

必須要避免的情況是:你最終找到了一種可以確定新模式和數據關系的程序,但這些模式與關系對于業務流程卻沒有任何幫助。上述情況在分析矩陣中被稱為死區,即盡管你能夠發現新的模式,但這些模式與待解決的問題之間卻沒有聯系。

大數據項目的成功,往往始于極具針對性的目標和對量級較小的數據集的關注。只有通過這種方法,才能在獲得項目成功后開發出真正有效的大數據分析方法,此類方法的初始量級不高,但它們會隨著實踐成長。這種模式在實踐中的效果很好,因為企業能夠在為數據分析做準備的同時,以較少的初期投資創造價值。

為實現上述目標,我們可以從“微量數據”開始(即獲取單獨的數據流并將其遷移到不同的系統中,以便進行后續的融合處理)。隨著時間的推移,微量數據會不斷地蓄積、增長并最終帶來大數據的誕生。擴展能力將至關重要:隨著所收集數據的增加,系統的規模也需要不斷擴展以適應不斷增長的數據量。

3.3 關注大局

利用開源Hadoop技術和新興的打包分析工具,能夠使經過SQL培訓的商業分析員更加了解開源的環境。最終,在繪制大數據分析路線圖時,規模將成為最主要的影響要素。商業分析師將需要規避SQL方法,才能掌握在節點和集群上運行的分布式平臺的概念。

此時,至關重要的是思考潛在信息積累的形態。要做到這一點,我們可以先計算出從現在起的6個月內需要收集多少數據,然后確定需要多少臺服務器才能處理這些數據。此外,我們還必須確保使用的軟件能夠滿足數據擴展的需要。此時,有人可能會忽視解決方案的潛在成長能力以及將此類方案投入使用后的潛在受歡迎程度,但這種想法屬于嚴重的誤解。

隨著分析尺度的擴展,數據管理的重要性也將不斷提升,在這一點上,大數據與任何其他大規模網絡運算并沒有什么區別。信息管理實踐也是如此,作為曾經在數據倉庫領域的關鍵要素,該實踐對于如今的大數據也同樣重要。我們必須要記住的是,信息是一種企業資產,我們必須將其視為企業資產加以對待。

3.4 避免最差實踐

有很多潛在原因導致大數據分析項目不能達成原定的目標和期望。在某些情況下,學會“應該怎么做”還不如學會“不應該做什么”。這使我們能夠形成識別“最糟糕做法”的觀念,這樣你就可以避免犯下與別人過去相同的錯誤。與自己犯錯相比,從別人的錯誤中學習要更為可取。需要關注的某些最糟糕的做法如下:

? 認為“只要建成系統就行,問題會自然解決”。很多組織都會犯的錯誤是簡單地認為只要部署了數據倉庫或BI系統就自然能夠解決關鍵業務問題并創造價值。然而,很多IT、BI和分析項目經理都在技術炒作中迷失并忘記了商業價值才是他們的首要任務,數據分析技術只是創造價值的一種工具。與盲目地運營和部署不同,大數據分析的支持者首先應該做的是確定該項技術要達成哪些商業目的,并依此來建立商業案例,只有這時他們才能根據手頭的任務來選擇和利用正確的分析工具。如不能充分理解自己的業務需求,項目團隊最終很可能只是創建了一個對組織而言沒有價值的大數據存儲庫,整個團隊也會陷入“受冷遇”的尷尬境地。

? 認為軟件可以解決所有問題。構建分析系統,尤其是涉及大數據的分析系統是一項復雜且耗費資源的工程。因此,許多組織希望其部署的軟件能成為無所不能的魔豆,并瞬間解決所有問題。人們都知道這種想法并不現實,但在內心中卻又總在期待這種情況發生。軟件的確能產生助益,有時甚至能引起翻天覆地的變化。但大數據分析作為一種工具,它的作用大小要取決于正在分析的數據以及工具使用者的分析技能。

? 不能理解為什么要改變思路。重復采用同一方法并期望不同結果被認為是發瘋的表現,在數據分析的世界中的確存在著某種形式的瘋狂。人們往往會忘記,僅僅重復曾經有效的方法而不考慮情況是否已經發生改變的話,最終迎接他們的會是失敗。在大數據方面,某些組織總是認為其中的“大”只是代表了更大的覆蓋面和數據量,這種想法并不全錯,但是很多大數據分析舉措會涉及非結構化和半結構化信息,在管理和分析模式方面這些數據與企業應用和數據倉庫中的結構化數據有著根本性的不同。由于以上原因,我們在面對大數據,至少是某一部分大數據時可能需要采用新的方法和工具來完成數據的獲取、清洗、存儲、匯總和訪問。

? 忘記過去所有經驗。有時企業又會走向另一個極端,即認為大數據的一切都是全新的,他們必須從頭做起。對大數據分析項目而言,這種誤解對項目成功的破壞力甚至要高于不能改變思路的錯誤。僅僅是待分析的數據在結構上有區別,并不意味著我們需要改寫數據管理的基本規律。

? 不具備必要的業務和專業分析技能。技術萬能論會帶來的錯誤推論是認為自己只需要安排IT人員實施大數據分析軟件即可。首先,正如前文對創造業務價值的討論,除非能在系統設計和實際運行兩個階段整合并覆蓋廣泛的業務和行業知識,否則相應的大數據分析程序并不能真正實現目的。其次,很多組織都低估了所需分析技能的程度。如果大數據分析僅僅涉及報告構建和儀表板,那么相關企業只需利用其現有的BI專業知識即可。然而,大數據分析往往會用到數據挖掘和預測分析等更高級的過程,這就需要相關專業分析人員具備統計、精算和其他高級技能,對于首次進入高級分析領域的組織而言,上述情況意味著它們需要雇用新的職員。

? 以進行科學實驗的態度實施項目。很多時候,公司認為只要能收集數據并對其加以分析就代表自己的大數據分析程序已經獲得了成功。實際上,數據的收集和分析僅僅只是開始。要想通過分析產生業務價值就必須將分析數據納入業務流程,并使業務經理和用戶能夠根據調查結果采取行動,并由此提高組織的績效和業績。要真正達成目標,相應分析程序還需要包含溝通功能,這樣相關人士在依據分析結果取得行動成功后,能提供反饋,此后就可以基于業務成績對分析模型進行深度改良。

? 承諾完成不切實際的目標。許多大數據分析項目都會陷入的一種重大誤區是:支持者過度地夸大了系統的部署速度及其可能帶來的業務收益。承諾過度而實現不足會影響相關企業對技術的信心,這往往會導致這些組織在很長時間內都不再愿意利用所涉及的技術,即使許多其他企業已經利用同等技術取得成功也不例外。除此以外,一旦已經認定自己可以輕易并快速地贏得收獲,企業高管往往會低估了所需要的努力和專注度。在投入的資源不滿足需求時,相關企業會發現收獲并非如預期那般簡單和快速,并由此認定項目已經失敗。

3.5 步步為營

常言道“千里之行,始于足下”,而創造有效大數據分析程序的過程也符合這一道理。然而,要想成功達成目標,我們需要走的不只是一步。推行大數據分析計劃的組織,需要強有力的執行計劃來確保分析流程適合自身需求。要想為大數據計劃做好準備,選擇出將要使用的技術只是旅程的半途。除了確認正確的數據庫軟件和分析工具以外,相關企業還需要落實技術基礎設施,真正為進入下一步驟做好準備,由此才可制定出真切可行的戰略。

高效項目管理過程對創建成功的大數據分析程序有至關重要的作用,這一點也是不可忽視的。為確保系統的順利部署,企業在實施相關步驟時可以參考以下建議。

? 確定應保留和應刪除的數據內容。就其本質而言,大數據分析項目需要使用大規模的數據集。但這并不意味著我們需要分析公司所有的數據源或其中包含的所有信息。組織需要找出在洞察性分析時,能夠帶來真正價值的戰略性數據。例如我們需要哪些信息組合才能了解保留關鍵客戶的要素?或者需要哪些數據才能揭示股票市場交易中的隱藏模式?在規劃階段關注項目的業務目標有助于組織進行必要精確分析,在這些分析完成后相關組織可以并應該努力找出需要哪些數據才能達成上述業務目標。在某些情況下,完成上述過程的確需要涵蓋一切數據。但在其他的情況下我們只需利用一部分的大數據即可滿足需求。

? 構建有效的業務規則并克服此類規則的復雜性。如何克服復雜性是大多數大數據分析計劃的關鍵所在。為了得到正確的分析結果,至關重要的是要在處理過程中涵蓋以業務為中心的數據所有者,由此才可確保能提前確認所有必要的業務規則。一旦能夠確認規則,技術人員就可以評估這些規則所帶來的復雜度,以及需要付諸哪些努力才能將輸入的數據轉換為有相關性且有價值的調查結果。至此我們已經為下一個實施階段做好了準備。

? 以協作方式將業務規則轉換為相關分析數據。業務規則只是開發有效大數據分析應用程序的第一步。接下來,IT或專業分析人員需要創建產生必要輸出所需要的分析查詢條目和算法。但具體的行動需要落到實處。查詢條目的質量和準確性越高,操作時需要返工的次數就越少。在許多項目中,項目團隊和業務部門之間缺乏溝通的情況會導致他們需要不斷地進行重復。持續的溝通和協作能大大減少分析開發過程中的坎坷。

? 制定維護計劃。除了最初的開發工作,成功的大數據分析計劃還需要持續的關注和更新。定期維護查詢條目和始終為業務需求變化做好準備是重要的工作,但它們僅代表管理分析程序的一個方面。數據量會不斷增加,業務用戶對分析過程的熟悉程度也會不斷提升,隨之必然會出現更多的問題。分析團隊必須能夠及時跟進并滿足其他的請求。此外,作為大數據分析硬件和軟件選項評估過程的一部分,我們需要評估這些軟硬件在動態商業環境中能否適應迭代開發過程的需要。只有滿足適應不斷變化的要求,分析系統的價值才不會隨著時間的流逝而流失。

? 考慮到每一名用戶。隨著自助式BI功能的熱度越來越高,可以認為對最終用戶的關注已經成為了大數據分析程序中的關鍵因素。擁有可以處理大型數據集,同時具備分析結構化和非結構化信息的強大IT基礎架構都是相當重要的,但開發好用并且易用的系統也同樣重要,這意味著我們需要考慮到用戶的各種需求。不同類型的人員——從高級管理人員到操作工、業務分析師和統計人員——會以不同的方式訪問大數據分析應用程序并根據自己的需要來使用相關工具以確保其項目整體上的成功。在這種情況下,必須提供不同等級的互動功能,才能滿足用戶的期望,并讓分析工具熟練程度不同的用戶都能加以利用。舉例來說,通過建立儀表板和數據可視化處理,就能以一種容易理解的方式向并不擅長自行查詢大數據分析數據的業務經理和工人呈現調查結果。

沒有一種方法可以確保大數據分析的成功。但是遵循一系列框架和最佳做法(包括本文概述的建議舉措)可以幫助相關組織維持正確的大數據分析規劃方向。大數據安裝的技術細節相當繁雜,我們需要對其進行深入的研究和考量。但僅做到這些還不夠:我們還必須考慮技術和業務方面的各種問題,才能確保組織能通過對大數據分析的投資獲得所期待的結果。

3.6 學會利用異常數據

有人認為在處理大數據時忽略各種異常數據是最好的做法,為此他們創建了復雜的過濾程序,來舍棄那些異常的信息。在處理特定類型的數據時,這可能算是較為穩妥的做法,因為異常往往會導致結果的不準確。但實踐證明,在某些時候和某些特定的情景中,異常數據要比其他的數據更有價值。對此,我們應該認識到的是“在沒有進一步分析的情況下,丟棄數據的做法是不正確的”。

舉例來說,在以數據加密為標準做法并且需要實時進行訪問記錄和數據檢查的高端網絡安全領域,識別并認定符合數據非特征運動的情況(即通過發現異常來檢測安全問題)是至關重要的步驟。上述思想可以應用于從金融審計到科學探究再到檢測網絡威脅等領域,在這些領域,發現和識別非正常現象才是服務的關鍵。

在大數據的世界里,“異常數據”可能只是一個條目,在數百萬的數據量中,這一個條目可能并不值得注意。但是,在對流量、訪問和數據流進行分析時,這一個條目就可能具有無法估量的價值,并可能成為獲取證據的關鍵信息。在計算機安全領域,發現異常具有特別重大的意義。但是很多數據科學家都不愿意為研究異常處理而占用用于其他任務的資源。

事實上,異常現象很可能是某種趨勢的前兆。以網上購物為例,許多購買趨勢在一開始就是早期產品使用者創造的一種孤立異常現象;但這些產品隨后可能成為時尚并最終成為頂級的產品。這種類型的信息——即早期趨勢——可能帶來銷售周期的破與立。在這個方面,沒有任何實例比華爾街更有說服力,在這個市場中任何異常的股票交易都可能帶來不可預料的恐慌和瘋狂,而這一切可能只是源自從一堆大數據中發現的幾個小事件。

通常情況下,只要數據集的規模足夠大,異常現象就總會隨之出現。某些領域中對異常價值的體現更具有意義,社交網絡就是其中之一,在這個領域有大量的帖子、tweet信息和更新被投入大數據和分析程序,相關的企業會查看客戶情緒等信息并以平行的方式對比在眾多不同類型的時間序列中發現的異常現象,其中所涉及的思想就是類似的異常模式可能會出現在不同的維度中。

零售購物便是其中的一個典型案例。某些人群可能會在一年中相對固定地在Safeway、Trader Joe's或Whole Foods購買生活用品,但在年終他們會前往百思買和Toys“R”Us進行假日購物并引致相關商戶年終預期銷售量的增長。而蘋果之類的公司則可能在一年中的大部分時間均維持較為平均的表現,但一旦新的手機產品發布,它們在全球的客戶總會不約而同地為了這一金屬與玻璃構成的工藝品而甘愿排隊采購。

在需要與其他數據元素區分開來的重要數據中,上述信息就如海底針一般的存在。我們可以看出,在一年中,蘋果專賣店有約300天在臨時購買模式(或利潤率)方面都與典型的電子產品零售商均沒有什么區別,但是一旦發生某個能引發兩個或三個年度大事件的異常情況(例如新產品發布),這個異常就成為了蘋果商店和其他電子零售商之間的最大區別。為了能專注于真正具有特異性的事件,我們可以使用各行業中常見的趨勢來抵消可以預期的季節性變化。

在Twitter數據方面,不同維度之間通常有很大的差異。哈希標簽通常與短暫或不規則現象相關,與之相比某個大國的用戶所發布的大量tweet信息則具有規律性。由于在這種維度內部相似性更高的情況,我們應該對每個維度進行分開處理。按維度使用算法有助于在標簽和用戶名(而非位置和時區)成為最主要的異常來源的情況下做出判斷,因為前述情況表明相關各群組中的項目之間幾乎沒有任何相似性。

鑒于異常的數量巨大,找出其中的意義是一項極為艱巨的任務,這也導致了以下問題:是什么導致了正常的流量中出現異常暴增的情況?有哪些領域與此相關?這是否與URL縮短器和Twitter直播視頻流服務有關?按照異常情況的多少來排序的看法不夠精細且有諸多限制;異常之間的聯系通常存在于維度之中以及各維度之間的區域。各種算法可以共同產生強大的協同效應,但我們可能需要采用某種聚類過程才能發現其中的規律。

3.7 速度與精度的抉擇

以往的大數據分析通常需要在性能和精度之間進行折中。造成這種情況的原因是當時的技術往往需要幾個小時或幾天的時間來運行相應的算法,分析大規模的數據集。采用了集群處理的Hadoop解決了部分的存在問題,同時其他可以增強性能的技術也已經開發完成。但是,對于大多數普通組織而言,實時的大數據分析還只是一個夢想,這主要由于此類組織沒有足夠的預算擴展自己的存儲和處理能力,而大數據對這兩種能力則有著近乎無限的需求。

上述約束所帶來的結果就是,要想快速地獲得結果就必須縮小數據分析的范圍,這可能會導致結果準確度的降低。而追求精度的話又不得不選擇規模更大的數據集并投入更多的處理時間。

隨著技術的發展和創新,選擇的空間也在不斷擴大。目前行業正在使用內存中處理技術來解決速度與精度無法共存的問題。該方法的原理是將待處理的數據存入易失性存儲器而不是硬盤。如果使用普通的物理磁盤驅動器,我們需要讀寫磁盤中的所有輸入和輸出數據,與之相比在高速緩存中加載數據集并直接對其應用算法可以節省很多時間。

3.8 內存計算

各種組織開始認識到分析數據的價值,并在努力探尋進一步提高該價值的方法。對于許多人來說,獲得更高價值的途徑就是提高處理的速度。發現趨勢并應用算法來處理信息以形成附加價值,但前提是該分析可以實時產生結果。

然而,磁盤存儲的群集和廣域網連接的延遲使得通過BI解決方案很難實時取得結果。這樣問題就在于實時處理所產生的價值能否抵消為追求更快技術速度而付出的額外費用。要找到這個問題的答案就必須確認實時處理的最終目標是什么,是為某個特定業務流程加快結果生成速度?滿足零售交易的需求?還是獲得競爭優勢?

盡管原因有很多,但最終價值的多少還是要取決于獲得更快處理技術在價格方面的可行性。而內存計算正符合這一需求。此外還有很多其他因素也在推動內存計算技術的采用。舉例來說,《經濟學家》在最近的一項研究中進行估算后得出,人類在2005年創造的信息總量約為150×260位元組,而到了2011年前述本已非常龐大的數額已經猛增到了超過1200×260位元組。

此外,據研究公司IDC(國際數據公司)估計,數字內容的總量每18個月就會翻一番。而相關非結構化數據的增長使得數據處理的復雜程度又進一步提升。事實上,研究機構Gartner預計有高達80%的企業數據都是非結構化的信息數據,其中涵蓋了來自傳統和非傳統來源的數據。

在選擇是否使用內存計算時,數據類型、數據量和數據訪問速度都是影響決策的因素。然而,面對內存中處理能夠為企業帶來的價值,上述因素估計也無法阻擋高級內存中處理解決方案到來的潮流。

要理解內存計算在實際應用中的優勢,我們必須審視迄今為止的大數據處理方式并了解當前對計算能力的物理限制,而后者要取決于訪問關系數據庫中的數據以及處理指令和所有其他大型數據集處理所需元素的速度。

使用基于磁盤的處理意味著涉及多個數據集或算法搜索處理的復雜計算不可能實時進行。數據科學家必須要等待幾個小時到幾天才能獲得有意義的結果,對于講求高效的業務流程和決策而言顯然不是最佳的解決方案。

如今的企業需要以更快的速度獲得結果以便以更快的速度進行決策,同時它們還可以將其余工具配合使用以更好地進行信息的訪問、分析、管理和共享。所有這些都可為大數據帶來更多的價值。

內存計算的使用提升了分析的速度并最終帶來增值,相關技術價格的下降會使這種增值更加明顯。內存系統的銷售范圍和每美元容量在過去數年中一直在上升,存儲和處理大量數據的成本也因此得到了重新定義。

在價格下降和容量增加之后,現在企業已經可以將主數據庫存儲在硅基的主存儲器中,這帶來了指數級的性能提升并使全新應用程序的開發成為可能。而物理硬盤驅動器限制處理速度的時代也將徹底結束。

在業務決策者可以實時獲得信息和分析結果的情況下,人們能夠以之前無法想象的方式獲得新的見解并執行業務流程。內存計算在大數據集領域的應用,代表了處理BI和業務分析的IT作業模式正在發生關鍵性的變革。

內存計算可以創造一個業務管理的新時代,相關的管理者將能夠對復雜的數據進行實時分析,并作出決策,這種方法的主要優點如下:

? 數據處理的多重改進提高了數據處理的速度,擴大了數據處理的容量,相對于過去,性能有了數百倍的提升。

? 內存計算可應付迅速擴展的信息量,提供比傳統物理磁盤存儲快數千倍的訪問速度。

? 對比基于硬盤的處理方法,內存計算在具有更好的性價比(可以抵消總成本的上升)的同時還具有實時分析這一大優勢。

? 近年來中央處理單元和存儲器的成本顯著降低,再結合多核和刀片架構可以在實現數據操作現代化的同時提供可測量的結果。

利用內存計算我們得以將分析過程從成組硬盤驅動器和獨立CPU轉移至可以實時處理所有的日常事務、更新以及分析請求的單一綜合數據庫,由此也得以產生包括上述幾點在內的諸多優勢。

內存計算技術使我們可以在服務器的主內存計算大量交易數據并通過此類交易分析實時獲得結果。

由于內存計算允許直接訪問內存中的數據,獲得查詢結果的速度要遠遠高于傳統磁盤倉庫方法。此外,更新數據庫所需的時間也顯著減少,同時系統還能一次處理更多的查詢請求。

由于流程速度、查詢質量和業務洞察力方面的巨大改進,內存數據庫管理系統的性能預期要比傳統上基于磁盤的模型提升10到20倍。

盡管構成內存計算的元素早已存在,但直到現在,它們才達到可以普遍使用的程度。近年來的硬件改善和軟件創新使得當今的內存計算能夠在幾秒鐘內對大量的數據進行篩選、關聯和更新。主存儲器、多核處理和數據管理的技術進步共同帶來了性能上的大幅進步。

內存計算可以為眾多領域帶來顯著增益,其中最重要的是成本節約、效率提升以及改善決策的可視化速度提升。

不同規模和行業的企業都可以通過內存計算帶來的成本節約中受益。目前大多數公司IT預算的25%以上都被用于數據庫管理。內存計算數據庫所采用的硬件系統在能耗上要遠優于傳統的數據庫管理系統,這可以大大降低硬件和維護成本。

內存計算數據庫還能減輕公司的整體IT負擔并釋放以前需要用于響應報告要求的資源。由于作為依據的技術已經成熟,內存計算解決方案可以無中斷的方式獲得實現,這樣相關公司可以輕松并快速地恢復運營。

任何在經營上依賴頻繁數據更新的公司都能夠借助內存計算技術實現高效的運轉。轉向內存計算使相關公司能夠從其IT架構中移除系統所需的一整個技術層級并由此降低了系統的復雜性和基礎設施需求。上述簡化使得幾乎實時的數據檢索成為可能,所有業務團隊的效率也將因此得以提升。

利用內存計算,任何商業用戶都可以輕易地挖掘出便于各部門調用的BI子集。工作組可以在中央數據倉庫承載工作量不受影響的情況下自主作業。但也許最為關鍵的改進在于業務用戶不再需要IT支持就可以洞悉業務數據的意義。

上述性能提升還使商業用戶在旅途中能夠通過自己的移動設備檢索更多有用的信息。隨著越來越多的企業開始將移動技術融入業務,上述功能的重要性正在不斷提升。

通過以上幾點可以明顯看出,內存計算的出現使組織不再需要局限于在數據倉庫中劃分的數據子集,他們能夠以更為全面的方式編譯其業務數據。

借助上述數據庫可視性方面的改良,企業能夠從事后分析(被動)轉變為實時決策(主動),并在隨后創建基于預測而非響應的業務模型。企業可以從一開始就將易用的分析解決方案與分析平臺配合使用并由此產生更多的價值。通過上述方法,即使沒有多少專業知識的公司人員也可以構建查詢條目和儀表板,由此又可能創造出很多內容方面的專家,他們無需外部支持就能自主提升行動的積極性。

對企業而言,內存計算的另一優勢在于這種技術能帶來信息特異性的提升,由此我們可以根據客戶和企業用戶的個人需求對數據元素進行定制。這樣具體的部門或業務線就可以自主處理具體需求,由此產生的結果可以惠及管理鏈的上游和下游并為客戶主管、供應鏈管理和財務運營帶來影響。

利用內存計算技術,客戶團隊可以從幾乎任何位置(包括辦公或旅行位置以及攜帶的移動設備)快速輕松地組合不同的數據集并用其分析客戶過去和當前的業務狀況。商業用戶可以使用最新的信息直接與客戶進行交互;在由此創建的交互場景中業務用戶可以直接與數據交互。通過實時的數據獲取,業務用戶能夠更加了解相關情況并依此來開展銷售和營銷活動。而銷售團隊也可即時訪問他們需要的信息,其掌握客戶情況的能力將得到全面的提升,由此可實現更為高效的上行和交叉銷售,并最大限度地提高收入增長速度。

在基于磁盤的傳統系統中,數據的處理通常需要在夜間進行,這可能導致企業無法及時對重要的供應警報做出反應。內存計算技術完全解決了這個問題,因為該技術使企業能夠充分掌握其供應鏈在每一秒鐘的變化。借助上述實時洞察的能力,相關企業能夠及時對不斷變化的業務條件做出反應。舉例來說,相關企業可以創建特定產品預存量預警和其他警報并在發生問題時從容應對。

對于財務總監來說,日益增長的數據量、數據處理不夠迅速、分析延后和數據響應速度慢都會帶來挑戰。財務總監往往只有幾天而非幾個月、幾個季度的時間來應對這些挑戰。這可能使各方面出現延遲,而在每個財季結束時,這種情況愈加明顯。然而,內存計算、大容量數據分析和靈活的建模環境可以加快財政季度結束階段的處理速度,并在更長的期限內使更多的詳細財務數據透明化。

從消費產品和零售到制造業和金融服務,任何行業的企業都能借助內存計算提升運營效率。消費品公司可以使用內存計算來管理自己的供應商、跟蹤和追蹤產品、管理促銷互動并提供支持,以更好地遵守環境保護局的標準并對有缺陷和不合格的產品進行分析。

零售公司可以同時管理多個地點的商店運營,分析銷售點的情況,執行多渠道定價分析并跟蹤損壞、污染和退回的產品。制造企業可以使用內存計算保證運營績效管理,進行生產和維護分析并開展實時資產利用研究。金融服務公司可以進行對沖基金交易分析,具體包括管理客戶對貨幣、股票、衍生工具和其他票據的風險敞口。借助通過內存計算獲得的信息,上述企業可以實時管理系統風險并根據市場交易風險提交報告。

隨著大數據分析的普及,內存計算將會成為很多企業在尋求競爭優勢過程中的主要依靠。

主站蜘蛛池模板: 罗城| 南部县| 上饶县| 从化市| 抚宁县| 肇州县| 渑池县| 晋宁县| 玛曲县| 顺平县| 瓦房店市| 民权县| 龙川县| 临澧县| 夏邑县| 滁州市| 临猗县| 章丘市| 绥化市| 芦溪县| 弥渡县| 内黄县| 瑞金市| 黄山市| 葵青区| 大姚县| 香格里拉县| 班戈县| 宣城市| 丰宁| 增城市| 盐源县| 江山市| 万源市| 桦川县| 浮梁县| 南丹县| 吴桥县| 彰化市| 新宾| 同仁县|