官术网_书友最值得收藏!

第五節 應用案例

阿里巴巴數據委員會自建立以來,數據質量就成了該部門的核心工作,車品覺[2]認為數據質量是大數據的命門,如果將大數據比作水流,來自任何支流的數據,如果質量有問題,都會帶來整個水源的污染。由于淘寶等平臺上的數據良莠不齊,存在不少虛假數據,會帶來很大的干擾。有時,在淘寶平臺上,對于一個人,我們會看到2部手機、1個iPad、3張信用卡、5個淘寶賬號,收集數據時,以為是多個人,但實際上就是一個人。但如果依照這個數據,商家可能就將紅包給了一個不活躍的賬戶。為此,阿里巴巴數據委員會試圖剔除虛假的數據,讓收集的數據能反映真實的消費情景。比如上面的案例,就要鑒定所有這些賬戶、信用卡等是否為同一個人所有。再如,阿里巴巴數據委員會經常要做產品界面測試,有時它會臨時修改界面,會突然多出一個按鈕,這就會帶來大量誤點擊操作,數據收集時,就會得到很多失真的用戶行為數據。阿里巴巴數據委員會的數據管理人員目前的工作就是要將這些失真的數據剔除,或者將數據還原到真實的場景。為了更好地管理和利用大數據資源,阿里巴巴數據委員會采取的具體措施如下。

打破分割統一數據標準。統一數據標準,就是讓凈化后的數據流得以匯集。阿里巴巴下屬各個部門業務重點不同,對數據的理解不同,因此數據標準往往各不相同。要將這些數據匯集成大數據之海,就必須統一標準,這也是阿里巴巴數據委員會目前重點推行的項目。

精細化管理數據。“目前,我們需要的用戶數據,平臺還給不了。”阿里巴巴平臺上的一個企業如是說。很多企業希望阿里巴巴能將用戶屬性的標簽分得更細(不僅分男、女用戶,還進一步按不同消費特點、收入細分)。小也化妝品創始人肖尚略認為,“平臺數據的細分是基礎,細分好,企業才能用好”。如何讓數據精細化?阿里巴巴數據委員會根據各個商家的應用場景,將原始數據打上更細致、對商家更有參考價值的標簽。以淘寶平臺為例,一方面收集用戶信息時,專注對商家更實用的內容,比如對于在外租房的大學生用戶,除了收集他們的地址信息外,還會通過其他渠道收集其房租的租金,從而了解對方的消費水平,將這些數據提供給相應的商家。另一方面根據商家的應用情景,對數據材料做初加工。比如我們從中篩選出一個人是否戴眼鏡,戴的眼鏡是多少度的數據,就對賣眼鏡的商家起到了很大作用。

在數據精細化思路下,2011年底,阿里巴巴的支付寶平臺開發黃金策產品,車品覺帶領團隊處理了1億多活躍的消費者數據后,篩選出500個變量,用它們來描述消費者,最終讓企業能夠隨時調用變量,獲得用戶信息,比如某一類包含使用信用卡數量和手機型號等具體信息的客戶數目。2013年,天貓開始研發適用于天貓商家的系統,通過對會員標簽化,讓商戶了解店鋪會員在天貓平臺的所有購物行為特點。

收集更多的外部數據。在阿里巴巴平臺上,大多時候收集的是顧客的顯性需求數據,如購買的商品和瀏覽等數據,但顧客在購買之前,就可能通過微博、論壇、導購網站等流露出隱性需求,所以僅僅做好自己的大數據是不夠的,還要納入更多外部數據。

阿里巴巴曾嘗試通過收購掌握中國互聯網的底層數據。2013年4月,阿里巴巴收購新浪微博18%的股權,獲得了新浪微博幾億用戶的數據足跡。5月,阿里巴巴收購高德軟件28%股份,分享高德的地理位置、交通信息數據以及用戶數據。其他的并購包括墨跡天氣、友盟、美團、蝦米、快的、UC瀏覽器等,阿里巴巴也從中獲得了大量的數據。通過這些并購,阿里在試圖拼出一份囊括互聯網與移動互聯網,涵蓋用戶生活方方面面的全景數據圖。

加強數據安全管理。淘寶賣家希望阿里巴巴能加大數據開放的步伐,對于阿里平臺來說,這并不是一件容易的事情,因為這關乎商家和消費者的隱私,商家不希望競爭對手獲得自己的機密信息,消費者也不希望被更多干擾。因此,阿里巴巴內部專門成立了一個小組,來判斷數據的公開與否,把握“誰應該看什么,誰不應該看什么,誰看什么的時候只能看什么”。

主站蜘蛛池模板: 精河县| 隆昌县| 皋兰县| 综艺| 宜昌市| 伽师县| 龙胜| 壶关县| 东源县| 阿拉尔市| 和龙市| 班戈县| 手机| 芒康县| 泰安市| 广昌县| 高密市| 本溪市| 石嘴山市| 汽车| 九龙县| 临泉县| 铁力市| 宜丰县| 确山县| 清新县| 通榆县| 阿克| 麦盖提县| 紫阳县| 甘肃省| 剑川县| 莱西市| 孟州市| 大竹县| 广南县| 沁源县| 上犹县| 拉孜县| 德昌县| 牟定县|