官术网_书友最值得收藏!

第2章 數據的藝術

2.1 評估可能性的藝術

害怕落后是向前發展的強大動力。在今天,很多組織都致力于構建大數據和物聯網,僅僅因為他們擔心自己的競爭對手已經開始進行這項工作。利用差異化解決方案進入市場,吸引風險資本家的投資,是這些公司的共同目標。很多公司創業失敗了,但是有些公司卻在新興市場中發展起來,甚至對部分成熟公司構成威脅。而成熟公司的CEO和高層們沒有忘記在早期的市場上利用新型解決方案獲得的巨大利益。

許多這樣的組織開始把發展的核心集中到事實問題而不是過去的經驗以及直覺方面。數據開始成為企業發展的關鍵,同時,從數據中得到的信息也被人們認為是關鍵性的東西。上述組織必須具備對所發生的事進行反思并評估的能力,而在評估一項新的選擇或者決策的潛在影響時,數據分析能力變得越來越重要。

從表面來看,大數據應該幫助組織機構判斷未來的發展方向。畢竟,更多的數據種類和更大的數據容量會有助于揭露新的真相,有很多公司高管也樂于相信這種價值。而且物聯網似乎也開拓了新的業務可能,不僅可以用來作為對抗傳統競爭者的方法,也可以應用于同質市場的新戰略的開發。

因此,許多IT組織的任務是制定一個使用大數據開發新解決方案的戰略,這將對業務產生重要影響。由于相似的原因,物聯網也受到了同樣高度的關注。如果想要確定這些舉措是否有價值,常見的首要方法就是找一家在相同行業的其他公司中發生的精彩實例。另一個方法就是去查閱大量各種各樣的數據,并期待好運降臨,從而直接嘗試得到有重要價值的意外業務發現。然而,對于通過分析數據(包括來自傳感器、社交媒體、網站和其他流式數據源的數據)可能解決的業務問題,這些方法很少能在沒有假設的情況下工作。

為了發展這種假說,你的公司或組織里也許應該組織一場遠景規劃的會議。無疑,IT的高管、企業構架師、IT架構師們會對未來IT的發展方向有著自己的觀點,也充分認識到大數據和物聯網的巨大潛力。然而,這些大家都想要的用例更可能只是存在于企業家們的心里。巧合的是,他們或許也會對這些項目支付預算。

在本節中,我們描述了如何探索在以后的信息構建中可能出現的東西,并且通過評估“可能的藝術”來推動未來項目的發展。當你的組織中舉辦過這樣的會議時,也許會發現許多有潛力的項目。而且本節所概述的技巧,也會讓你對這種項目的可行性形成一種可靠的預測評估。因此,你就能夠將精力集中到能得到應有支持且會促進業務發展的項目上了。

圖2-1強調了在我們的方法中現在所處的階段,以及本節所涉及的內容。在遠景規劃會議中討論的內容應該包括現在和未來的業務構建、數據構建、應用構建和技術構建。考慮到這只是探索過程的開始,一旦我們具備了洞察力,并確信有值得探求的項目,就會有很多后續的階段。

圖2-1 合理想象的藝術階段

2.2 了解現狀

在制定愿景之前,明白我們當前所處的階段是非常重要的。面對這些問題時,往往總是會出現商業角度的看法和技術角度的看法。從商業角度,我們需要知道企業高管和分析師是否對現有的信息和數據滿意。這常常會引起一場圍繞著他們為什么和怎么樣使用數據、數據粒度、可訪問的時間范圍以及數據質量的討論。我們會討論數據的來源缺失和數據歷史,以及增加這些數據對容量需求在未來的影響。我們還會討論即時數據的需求和什么是能被接受的好時機。

從技術角度,我們需要明白當前的關鍵數據的來源,知道這些數據是怎樣移動的以及它們將去往哪里,了解現在使用的數據管理系統,以及現階段常用或缺失的商業分析工具。除了軟件之外,我們還應該知道服務器和存儲器組件在當前狀態結構中的功能和壽命。我們還應該了解,當業務必須響應不斷變化的條件時,是否滿足業務的服務級別協議以及技術基礎設施的靈活性和變通性。

2.3 自我評估、完善度、信息架構

一個早期的對當前信息架構完善程度的自我評估,能使一個組織深刻認識到擴展自我當前結構的能力。如果一個組織還停留在基礎數據倉庫的落實階段,那就最好不要期望通過實施大數據的項目來解決所有問題了。事實上,這樣的項目可能會妨礙業務線希望盡快解決更高優先級的問題。

在出版物中我們發現了各種各樣的關于信息架構的完善度評定量表。一般的組織通常走這樣的路線:數據和信息倉庫,數據和信息的標準化,高端業務優化,信息服務。圖2-2展示了這種路徑。

圖2-2 信息構架完善度階段

下面是每個階段過程的詳細闡述。

? 數據和信息倉庫:數據在很多數據集市和工具中重復出現,主要在業務范圍內進行管理,而且經常會產生哪個數據集才是真的數據集的爭論。所以,所有來自數據的結論都會受到質疑。

? 數據和信息的標準化:集中管理的獨立數據集和企業數據庫由于注重數據的質量、一致性和安全性,通常被用到報告和即席查詢上。IT和商業會在數據集拓展和新市場推廣上進行合作。

? 高端業務優化:引入流數據來增強傳統數據源。預測分析用于更好地理解和預測決策結果上。

? 信息服務:內部開發的可信賴的數據存儲和分析工具,在公司和企業以外也極具價值。客戶可以通過對生意伙伴提供支持,從業務運營中收益。用戶樂于為享受服務而付費。

這些階段并不總是按照一個連貫的順序,一些組織可能同時經歷好幾個階段。例如,一些組織經常在數據的存儲和標準化這兩個階段之間周旋,尤其是IT行業的發展速度不足以滿足來自行業不斷改變的分析需求。當這種周旋發生的時候,預測分析和流動數據的增加有時會得以開發和實施。

當然,那些成功通過前三個階段的組織會創造出難以置信的商業價值。在這一點上,一些人考慮建立“訂閱”,這樣就可以和他們行業的數據整合者展開競爭,因為他們開始作為服務商而提供信息了。

當你對組織的完善程度進行評估的時候,很重要的一點就是要認識到,當你作為一個服務商從存儲發展到信息服務時,IT必須產生的角色和技巧變得越來越高端。開展新項目時,你應該考慮:為組織所采用的是不是一個有重要區別的技能,以及在獲取這些技能時所需要的投資,是應該花在這個地方,還是應該花在其他同樣賺錢卻要求比較少的項目上。

在傳統數據環境中,數據被存儲于“倉庫”里,這限制了人們獲取數據的途徑。與其不同的是,大數據環境建立在分布式存儲的系統之中。

接下來通過運用來自各個產業的具體案例,分析了大數據對于不同產業的影響,強調了數據倉庫與大數據系統這兩種應用方式的不同。

了解目前的產業趨勢以及最佳競爭者是如何重新定義這一產業趨勢的信息構架的,對于我們構建未來信息構架是很重要的。大數據和物聯網(IOT)正在許多產業中引領一場重新定義誰是真正競爭者的潮流。有些公司使用了能使受眾了解數據的新方法,這種新方法使他們獲得了新的業務切入點和解決方案。

最有效的信息構建方式總是與特定某類商業問題的解決相關聯。下面是根據不同行業得出的數據倉庫項目和包括Hadoop和IOT的信息構架清單。這份清單可能會給你帶來些許探索新項目的啟發,當你從事其中的某項業務時,可能會獲得巨大的投資回報。

? 農業

數據倉庫:農業生產和優化成本分析,產量分析,農產品定價分析,農產品貿易分析。

Hadoop/IOT:分析并優化耕作模式,施肥模式,收獲時節,水分含量(數據來自土地里的傳感器和天氣預測)。

? 汽車制造業

數據倉庫:汽車制造的成本和數量分析,供應鏈,汽車的保修期,市場和營銷分析,人力資源管理。

Hadoop/IOT:顧客心理分析,車聯網,服務需要和服務調度,駕駛歷史,司機緊急監測和反應程度。

? 銀行業

數據倉庫:客戶對金融產品渠道的感覺,財務分析,欺詐檢測,信用價值,人力資源管理,營業網點優化。

Hadoop/IOT:欺詐檢測,風險分析和客戶情緒分析。

? 通信業

數據倉庫:定價策略和財務,客戶支持和服務,營銷分析,供應鏈,物流和流程優化,合規性,營業網點優化和人力資源管理。

Hadoop/物聯網:分析社交數據,移動設備使用,網絡質量和可用性(使用傳感器數據),網絡欺詐檢測,物聯網中的擴展網絡管理和優化。

? 消費性包裝品(快速消費品)

數據倉庫:銷售,營銷,供應商,制造,物流,消費趨勢和風險分析。

Hadoop/IOT:促銷有效性分析(通過社交媒體和店內傳感器),供應鏈,運輸過程中制成品的狀態,零售產品的擺放和風險分析。

? 教育和科研

數據倉庫:教育科研機構的財務或設施分析,人員配置和人力資源管理,校友介紹和捐贈形式。

Hadoop/IOT:風險學生分析(通過傳感器數據),科研數據以及設備監控分析和優化。

? 醫保承擔者

數據倉庫:護理成本,護理質量,風險和欺詐的分析。

Hadoop/IOT:客戶情緒,風險和欺詐的分析。

? 醫療機構

數據倉庫:護理成本,護理質量,人員配置和人力資源以及風險的分析。

Hadoop/IOT:疾病和流行病傳染模式研究,患者檢測,設備檢測和優化,患者情緒以及風險分析。

? 高科技制造業

數據倉庫:供應商和分銷商分析,物流管理,產品質量和產品保修分析。

Hadoop/IOT:車間生產和質量分析,部件組裝產品質量分析,產品故障和待定故障分析,自動化服務的服務請求分析。

? 保險(財產保險和人身保險)

數據倉庫:市場營銷分析,人力資源和風險分析。

Hadoop/IOT:客戶情緒分析,風險分析。

? 執法狀況

數據倉庫:執法暢通,犯罪數據統計,執法人員配置優化分析。

Hadoop/IOT:威脅執法現狀分析(信息來源于社交媒體和視頻收集)。

? 媒體和娛樂

數據倉庫:觀看者偏好,頻道收視率,廣告銷售額和營銷促銷的分析。

Hadoop/IOT:觀看習慣分析(數據來自機頂盒),娛樂場所顧客娛樂方式分析,顧客情緒分析。

? 油氣資源

數據倉庫:鉆井勘探成本分析,潛在勘探點,油氣生產,人力資源和運輸優化分析。

Hadoop/IOT:鉆井檢測分析(包括鉆探故障預防)。

? 藥品

數據倉庫:臨床試驗(包括藥物相互作用研究),藥物測試對象結果分析,藥物銷售分析以及人力資源分析。

Hadoop/IOT:從來自醫用傳感器、普通大眾的日常生活、疾病跟蹤和基因組學研究的臨床數據進行分析。

? 零售業

數據倉庫:市場籃子分析,銷售分析,供應鏈、倉庫及物流派送優化分析。

Hadoop/IOT:全渠道零售分析和顧客情緒分析。

? 運輸和物流業

數據倉庫:物流和客運路線分析,營銷分析,倉庫選址優化,人力資源分析和優化。

Hadoop/IOT:交通流量分析(數據來自高速公路傳感器),交通安全的分析和控制,設備性能和潛在故障分析(數據來自車載傳感器),物流管理(數據來自物流傳感器),以及客戶情緒分析。

? 公用事業

數據倉庫:傳送方式的改善,(電、氣等資源)運輸網絡供應能力的分析和提高,客戶能源利用分析,人力資源分析和優化。

Hadoop/IOT:為了優化傳輸網絡并時常進行維護,對來自智能電表的數據進行分析。

需要注意的是,上述清單僅列出了2015年決定實施或已經實施的部分項目。隨著各種企業逐漸發現新方法并找到解決問題的方案,這份清單也會隨之改變。

在本書的后面,我們將會討論這些項目的優先順序。一個項目要想獲得優先地位,必須要從事與計算機信息技術(IT)相關的業務。當一個項目有了優先地位時,該項目獲得成功的概率將大大提高。

在這一點上,我們已經對信息構架的成熟度進行了自我評估,同時審議了一些未來可能發展的項目。為了拓展這些項目,我們會小幅度修改現有的信息構架。舉例來說,如果需要的數據大部分為結構化,并且數據倉庫的基本構架是健全的,那么僅基于這一構架做出的分析可能就是完美的。然而,基本構架往往不能滿足現實的業務需求,所以,當務之急是想出該如何應對日益增長的需求。

對現有構架進行修改的一個重要原因(你可能已經從本書的主題猜到)是為了新業務的需要,因為這些新型數據在傳統的數據倉庫中很難被分析。例如,新型數據可能包括流式數據和半結構化數據,這種數據會引入高速、大容量的數據攝取要求。這一要求可能使之前不需要的NoSQL數據庫和Hadoop也被列入信息構架之中。研究Hadoop的數據科學家們也希望推進新興數據收集工具和數據分析引擎的采用。

如何收集外界的數據需求?如何與他人合作開發未來的信息構架?一般是定期舉行會議(有時稱作研討會)規劃未來事物、收集客戶需求。收集客戶的初步需求可能只需要兩到三小時,但它卻可以確定我們今后要遵循的方向。

在研討會中,參加者們會討論當前的數據倉庫、商業智能以及ETL工具和數據處理的解決方案等問題。也可能討論包括服務器和存儲器在內的基礎設施,其中,對現有組件進行升級或替換往往是第一項討論的內容。舉例來說,如果目標數據倉庫上的ETL所需的性能和資源出現問題,那么考慮利用流數據源所需的Hadoop集群也稱為ETL引擎可能是有意義的。

事實上,Hadoop集群可以成為所有數據的初始著陸點。如果想知道如何進行預測分析或者如何重新評估預測分析的可行性,可以查閱Hadoop集群進行深入了解。

在這一階段,很多技術工作人員可能會擔心,當前我們進行信息構架的成熟度與正在規劃的前景可能極度不符。IT或業務線上的技術與規劃中要求的技術有明顯差距,數據管理和操作問題也可能會隨之出現。潛在成本和對預算的影響往往是IT高管們最關心的問題。

在初始階段就對這些問題予以關注是有好處的。然而這只是最初階段,我們正在構建未來信息架構可能成為什么樣的愿景。我們所了解的業務案例還不足以確保全面地開展項目。同樣,我們對數據細節的了解也很少。在后面的階段中,我們將對前述業務案例和數據進行全面理解,同時也會更頻繁地評估所需要的技能。在我們開始構建未來的信息架構時,將更充分地考慮潛在成本。

現在,我們只是在探索可能性的藝術。

2.4 愿景部署

這一愿景往往在促進規劃的白板會議期間得到部署構建。即使是在一步步修改信息架構的最初階段,也需要和大量主要的利益相關者進行溝通。要想了解當前架構及其組件,你應該認識架構師和IT管理員。但同時,為了應對可能出現的新問題,你們自己的業務主管和分析師也必須清楚地知道數據來源是什么。業務分析員對于數據顆粒度以及數據需要保留多長時間,與IT界可能看法完全不同。請記住,現在不是兩方爭辯的時候,這是匯集每個人想法的時候。

當然,這對你的會前準備工作是沒有影響的。如果CIO(首席信息官)或其他高級IT領導者不定時參加業務規劃會議,你就需要看一下這個組織的頂端業務優先等級,這些在收益報告、盈余報表、公司內部廣播和其他的論壇里都有清晰的陳述。你也許會對競爭做同樣的調查,因為公司的業務高管可能強烈地意識到競爭的存在。

在一些信息技術與業務線已經斷開的公司和組織中,他們基本已失去了其他公司的信任。只有IT團隊還在試圖追求他們認為的能產生巨大利益的信息架構。這種努力一般只存在于單純的研究中,因為在重新建立合作之前,他們只有少量可用資金。

為了使你的會議獲得良好效果,你應該在會議之前說明會議目標和會議議程。例如,你的目標可以是希望在5年內獲得早期投入,這將使公司能提供更好的服務與產品。請注意,除了IT目標,我們還有一個業務目標,如果想要讓業務人員參加會議,需要提前告訴他們我們的業務目標。

會議上將要討論的問題大致是這樣的:

? 會議的總體目標;

? 與會者進行個人介紹,并介紹自己的參會目標;

? 對要收集的信息類型進行概括;

? 討論當前信息構架的成熟度及其影響;

? 回顧信息構架的發展并討論業務解決方案;

? 討論什么需要改變以及為什么;

? 信息構架以及業務解決方案的發展愿景;

? 討論下一步發展計劃以及其他需要討論的問題。

你應該在會議開始時就告訴大家計算機中輸入的數據和白板上的內容都會被記錄保存。你還應該在會議開始前承諾,會議結束后會將收集的信息和得出的分析報告發給大家。

2.5 現在和將來的數據倉庫

IT團隊可能已經列出了目前信息架構的詳細圖表。當我們開始研究信息架構的發展過程時,這些圖表可以成為有用的參考資料。然而,在下面的介紹中,我們將簡化這些圖表并重點關注與前景部署有關的業務領域。

圖2-3表明了當關注的焦點放在提高一家零售公司的促銷和營銷時,一個當前狀態的足跡是怎樣可能被闡明的。我們將使用同樣的或類似的圖表進行分析。在這個例子中,EDW(Enterprise Data Warehouse,公司數據倉庫)平臺提供過去的數據,多個OLTP系統(ERP(企業資源計劃)和CRM(客戶關系管理)系統如圖所示)提供現有的數據。數據集市將EDW包圍,為其提供資源。業務分析員使用報告、即席查詢和分析工具進入數據集市搜集數據。圖表還指出了當前我們正努力發展的部分關鍵技術,后面的章節將討論這些技術。

圖2-3 典型的信息架構圖

在討論這個架構圖的同時,我們還可以討論很多其他的問題,例如:

? 數據的當前粒度以及EDW實際保存的歷史信息的廣度(以及期望的廣度)。

? 數據集市的有效性,包括數據之間的重疊、擴展或在開發新興市場中發揮的作用,以及反映的數據的歷史變化。

? 當前數據報告,商業智能工具以及數據儀表板的有效性。

? 出現重疊功能和相關用戶團體,對商業智能工具所提出的要求。

? 在數據集市中需要的具有相似內容的數據模型。

? 數據預測和數據挖掘。

? 客戶對當前數據查詢和數據分析性能的滿意程度調查。

? 提出問題或建議。

? 第三方數據源的重要性以及該部分數據對數據集市的適用性。

? 解決新問題所依靠的新數據。

? EDW和數據集市中對于數據質量的當前要求和未來要求。

? 數據更新頻率以及向EDW或數據集市及時傳送數據以做出業務決策的能力。

? 對數據安全性的關注,包括靜態和動態的數據。

? 對更高可用性的EDW和數據集市的需要。

注意

如果其他的架構師對你的架構提出修改,你應該感到高興,做出標記,并讓他們畫出自己的版本。他們所畫的信息架構可能與我們本章中提供的插圖有很大不同,你可以從他們的版本中受到啟發。這將匯集共同智慧,并更好地合作以構建一個我們未來架構的共同愿景。


你應該盡可能多地收集信息,并根據需要在白板上做出標記。為了使每個參會者都能理解會議內容,你應隨時記錄數據集市、數據來源和其他數據組件的名稱。

就像上文中指出的那樣,我們在會議中也可能會討論數據安全的問題。一些討論將由該組織所屬行業的獨特需求驅動。如果你在某些特定領域或者政府機構中工作,你可能對該特定行業的安全要求有所了解。但是,如果你在許多不同的行業中進行咨詢,表2-1可以提供對常用標準的一些有用的描述。

表2-1 不同領域的數據安全標準示例

你還可以根據需要向業務分析員咨詢,他們會根據你的要求在沙箱的隔離下瀏覽各種數據。以前,這些沙箱一般會應用在EDW或一次性數據集市中。現在,出現了使用自己的數據管理引擎或使用Hadoop進行數據管理的信息發現工具,這些新型工具有利于更靈活、更及時地探索新數據,因為它們是“無模式”的,也就是在使用前不需要預先設置它們的模式。

圖2-4將信息發現工具添加到我們當前的數據倉庫體系結構中。了解這些工具帶來的商業智能可以幫助我們更好地利用Hadoop集群中的數據,使用這些工具也可以推動數據集市和傳統商業智能工具的發展。

圖2-4 從架構圖中發現的信息

你應該從業務分析員那里收集他們認為能帶來有形商業利益的數據報告和分析視角。他們能夠告訴你不同行業中最具實用性的數據,或者提供一些有助于研究自己所在組織的分析效率的信息。這些信息在今后詳細討論如何確定具有競爭力的項目業務時會顯得更為重要。

1.確定Hadoop和NoSQL的適用范圍

我們現在正在探索擴展信息架構,使其能夠包含Hadoop和NoSQL數據庫。與使用關聯數據庫相比,這一技術在處理流數據源和半結構化數據源時可能會更為有效。

你的公司可能與許多其他組織一樣,已經開始研究這項技術的價值。如果你們有這樣的項目,你需要記錄試驗過程并在此基礎上探索新問題。舉例來說,如果Hadoop原型正在進行或者Hadoop已經是生產環境的一部分,那么你可以探索下列問題:

? 將數據源導入數據集群。

? 加載于Hadoop集群的數據所代表的歷史長度和容量。

? 需要加載到Hadoop集群中的其他數據源。

? 被存儲的數據對數據量的影響。

? 當前和未來的計劃數據攝取率。

? Hadoop集群的計劃工作量(包括MapReduce、SQL查詢、Solr/搜索、預測分析、ETL等)。

? 當前和未來計劃使用的分析工具(商業智能、信息發現、搜索、預測分析、ETL等)。

? 現有的數據處理能力以及所帶來的商業價值。

? 數據(包括靜態數據和流動數據)的安全問題。

? 集群數據的可恢復性和可用性。

圖2-5說明了有多少具體項目利用Hadoop來進行分析。該圖展示了一個零售商店的Hadoop分析模式。其中,以大數據分析為基礎的努力,被看作與之前存在的數據庫和它周圍的基礎設施是完全分離的。

圖2-5 在獨立的研究和發展努力中的Hadoop和NoSOL數據庫

在上述零售店的例子中,我們的目標就是要更好地理解和促進銷售。當購物者進入網頁或者進入實體店購買商品時,各種數據就會被捕獲然后被Hadoop收集,購物者的情緒數據也從社交媒體上收集于Hadoop中。這些流數據會先進入NoSQL的數據集群(可以輕松地擴展到高吞吐量需求),然后再進入Hadoop中獲得初步分析。

這些來自傳感器的數據在物聯網的架構視圖中被大大簡化,缺少了很多內容,包括配置、安全性能和其他必要服務等。我們要努力去做的,就是盡量促使所有分析工具以及各項流程相互配合、互相協作,從而發揮更大的作用。

2.鏈接Hadoop和數據倉庫的基礎構架

接下來,我們將討論是否需要在同一時間查詢和分析傳統數據倉庫和Hadoop集群中的數據,以及為了滿足業務需要,收集結合數據源的頻率等。了解這些內容將有助于我們確定未來最佳分析方式。

例如,如果我們的業務分析員為了展開業務,需要維度建模,那么我們要將有用的數據從Hadoop集群移動到數據倉庫中,或者創造一個基礎構架,使Hadoop集群作為數據倉庫的擴展存儲空間。如果我們計劃構建一個包含Hadoop和數據倉庫的預測性分析平臺,就要在Hadoop集群中完成對所有數據的分析工作。正如之前提到的,我們將從商業分析師那里,收集那些通過整合分析這些來源各異的數據而得到的潛在商業利益。

圖2-6說明了Hadoop和NoSQL數據庫是如何成為當前信息架構中數據倉庫的一部分的。因為我們會利用Hadoop進行ETL處理,所以可以將企業數據倉庫的直接數據源映射為Hadoop的數據源。下圖同樣也是較為簡化的版本。

圖2-6 Hadoop和NoSQL數據庫與數據倉庫基本構架的鏈接

引申出來,可能會出現關于應將數據存儲于什么地方的爭論。這些新數據是否應該先在云中進行分析?數據是否應該被儲存于包括數據倉庫和Hadoop集群在內的內部基礎架構上?

數據量和在網絡(有線寬帶)傳輸中所需的流量將幫助你確定在云、本地部署以及混合模型中的數據是否是最合適的。為了了解數據移動量,你需要了解各種數據管理系統以及如何利用它們進行數據查詢和分析。這些問題隨著以后構建信息技術架構的展開,我們會再詳細討論,到那時,你將會對業務用例有更深的了解。

注意

很多組織使用云來加快Hadoop、NoSQL或數據倉庫的研究和開發工作,尤其是在不了解業務價值的情況下,考慮到日益增長的數據容量和全部生產基礎設施的用戶化要求,企業一般會選擇自建基礎設施。

2.6 實時建議和操作

圖2-6所示的基礎設施呈現出數據因為點對點的移動所帶來的時間延長,而對于業務遇到的某些問題,可能需要實時的建議和響應行動。比如說,你希望購物者在進入購物頁面時就能看到你推薦的產品,而不是已經離開購物頁面才看到推薦的產品。

實時推薦引擎的作用就是在網絡商店里引導購物者購買特定的商品。在Hadoop集群或數據倉庫中可以構建關于購買行為的預測分析模型。構建模型的目的在于對購物者進行更巧妙的指引,使他們能夠買得更多并且更快地找到想要的東西。推薦引擎中的模型會隨著購買模式的變化不斷更新,也會不斷完善。

在配置智能傳感器和控制器的地方,對及時行動的迫切需要或許表明有些規則的建立是為了在所有分析發生前促進行動。這就是為什么事件處理和業務規則引擎通常被列為智能傳感器解決方案的一部分。舉例來說,如果實體店中的傳感器在與收銀員和那些由于感到不滿而放棄購物的顧客取得聯系時出現延遲,預先設定的規則就會觸發裝置來通知那些忙于其他事情的收銀員再開一個新的收銀臺。

圖2-7說明了在網站中加入實時推薦引擎,該推薦引擎由在Hadoop集群中運行的數據支撐構建并根據數據的變化定期更新,購物者的個人資料和定位信息由此被傳到引擎中。具體的實時建議最后由網站傳遞給購物者。

圖2-7 信息構架中的實時推薦和事件處理系統

我們還在圖中展示了實體店中的閉環系統和業務規則。當購物者們進入他們手機上的購物app(應用軟件)時,我們就開始監控他們的瀏覽蹤跡,這樣銷售人員就可以根據購物者在網站上最近的瀏覽信息來向他們推薦商品。

剛才所列的示意圖帶有一定的技術性,所以業務分析員要想理解它可能是有些困難的。但是我們認為正是這樣的示意圖,才有助于業務分析員了解當前基礎設施和數據流的局限性,并且可以幫助他們尋找當前問題的解決方案。這些示意圖還可以使業務分析員盡早修改需要的業務解決方案。

2.7 驗證提出的愿景

規劃會議在結束時往往會在白板上繪制當前和未來狀態的信息架構圖,這些架構圖在最后都會被手機拍下。有時這些圖表也會被保存在從活動掛圖撕下來的活頁上。會議進行時,主辦者還應對業務線、IT業高管層、架構師以及其他任何人員的發言進行記錄并作出相應注釋。這些記錄中可能會包含一旦未來信息架構部署好后,對商業決策產生有利影響的假設。

下面我們來介紹如何對所收集的信息進行總結。首先,這些信息應該以報告或演示的方式反饋給參加會議的人員,這種形式既可以驗證主辦方是否記錄了會議中各方表達的所有重要信息,同時,如果總結中有不清楚的地方,發言人也可以及時得知并作出相應澄清。通常情況下,在一周或兩周內將信息報告分發給參會者是最有益的,因為這樣可以加強在討論會議中形成的團隊合作精神。

在一些場合中,有人向我們提出,應該邀請大量不同的受眾參加以總結前期規劃會議為目的的后續會議。這種情況時有發生,因為參會者會就在會議中討論的未來信息架構等問題與別人進行分享,所以很多其他涉及此方面利益的人在了解到我們討論的內容以后也會產生興趣。隨著影響逐漸擴大,很多其他業務領域的人也希望能夠參加并記錄他們的想法和要求。這是一個好現象,人們會認為這一項目越來越有價值并予以更多資助。后續會議更側重于進一步的探索,而不是解讀、驗證前期工作。所以要想解讀、驗證前期工作,較好的方法是提前修訂報告并另行安排會議討論對報告的驗證和修訂問題。

基于規劃會議所做的報告或演示應包括以下內容:

? 目前的業務難題,包括信息構架帶來的難題。

? 對當前的信息結構所做的描述和繪制的圖表。

? 新興業務需求,業務模式變化預期以及如何運營業務。

? 可以滿足需求并應對挑戰的未來信息架構圖。

? 通過未來的信息架構可能獲得的商業利益(理想情況下包括這些收益的可能財務規模)。后續步驟將會在本書的后續章節中介紹。

我們注意到個別組織的IT架構師想在收集完信息后立即開始詳細設計信息架構的工作。然而,對于信息架構,很多問題目前仍然處于未知狀態。例如,我們還不知道如何展開運營,關鍵的績效指標是什么,該采取怎樣的措施。我們也不知道在各個階段如何實施解決方案以及有沒有階段實施優先級等。

雖然對于如何尋找業務案例會有一些初步想法,但是目前為止,我們還沒有一個可靠的指導案例。并且我們對于哪些數據源將提供有效措施,哪些數據反映KPIs(關鍵績效指標)了解得太少。再者,我們還不能確定我們缺少的技能對于實施和管理解決方案并利用它有效地運營業務有什么影響。

通過這一點我們得知,要想對一個項目獲得充分了解,我們仍需要更多的實際探索和書面佐證。但至少現在,我們已經對修改信息架構的實用性和可能性有了一些初步概念。而且我們還知道應該去哪里尋找商業贊助。因此,我們接下來要做的就是與業務鏈伙伴合作,進一步發掘需求。

主站蜘蛛池模板: 辽阳市| 团风县| 舒兰市| 长兴县| 马尔康县| 台湾省| 长泰县| 长沙市| 隆尧县| 城固县| 龙口市| 宝清县| 瑞安市| 景东| 任丘市| 大城县| 荃湾区| 金川县| 云安县| 大田县| 洛阳市| 长治市| 旬邑县| 闽侯县| 淮阳县| 金平| 无棣县| 承德市| 兴安县| 同心县| 玉环县| 阳朔县| 吐鲁番市| 巨野县| 湟中县| 沾化县| 南岸区| 和平区| 洛宁县| 林西县| 彰武县|