1.7 大數據應用案例
1.7.1 案例之一:滴滴出行
目前,滴滴已成為整個中國甚至全球發展最快的互聯網公司。擁有3億用戶,在中國400多個城市開展服務,司機超過1400萬人,1400萬的司機是整個中國所有機動車總量的10%。每天服務的訂單超過1300萬個,這個訂單量讓滴滴成為僅次于淘寶的中國第二大互聯網交易平臺。目前,滴滴平臺上每天產生超過50TB的數據(相當于5萬部電影),超過90億路徑規劃次數。截至2015年12月,滴滴出行占據我國網約車市場46.6%的市場份額,神州專車以39.9%的比例排名第二,Uber占7.2%,排名第三。滴滴、Uber合并之前,快車市場基本算是兩家的二人轉;合并之后,占據專車市場90%以上的份額,算是快車市場的唯一選擇。2015年,滴滴出行平臺完成14.3億訂單,這相當于在中國平均每個人都使用滴滴打過一次車;累計行駛里程達128億公里,相當于環繞中國行駛29萬圈,累計行駛時間達4.9億小時,相當于晝夜不歇地行駛56000年。所以滴滴的“數據大腦”對弈的是現實出行的海量數據,通過對每天24小時不間斷產生的新數據,以及檢測這些數據本身產生的二度數據,包括ETA、路徑規劃、實際路線、匹配時間等,進行研究、學習,最終實現訂單匹配效率的提升,使司機取得更多收入,乘客更加快捷出行。
在業界看來,這巨大訂單量背后實則體現的是滴滴出行超強的大數據計算能力。比如,如何將信息推送給更適合區域內的司機、誰優先獲得訂單,如何給乘客和司機補貼等策略,都要依靠大數據的支持。滴滴根據成交率和應答率來進行智能激勵,以此增加用戶的叫車意愿,而通過大數據計算,則讓訂單匹配更加智能,實現了智能派單。例如,以前司機需要開3公里才能接到1個客人,但現在可能0.5公里就能接到客人,在節省時間的同時,每天的訂單成交量也會增加。
1.滴滴大數據與平臺運營管理
1)供需預測
大數據的神奇之處就在于可以通過搜集到的數據,進行處理分析后,得到規律,然后利用這個規律對未來進行預測。在交通方面,大數據預測的能力極為重要,可以預測什么時間什么地方會擁堵。
大數據預測的關鍵是有足夠多的、高質量的數據。當前滴滴每日峰值訂單超過2000萬單、每日處理數據超過2000TB,覆蓋了交通路況、用戶叫車信息、司機駕駛行為、車輛數據等多個維度,它所掌握的真實數據除了可以幫助預測路況外,還能對供需進行預測,供需預測越準確,越能更好地解決供需不平衡問題。
滴滴目前對15分鐘后供需預測的準確度已經達到85%,基于這樣的準確率,平臺可以調度司機滿足未來的打車需求,有效降低未來該區域供需不平衡的概率。
2)路徑規劃
路徑規劃和ETA兩項地圖技術是實現智能派單的關鍵,也將直接影響到司乘雙方的使用體驗。通過海量歷史數據,可以對未來路況做預測,實現A點到B點的路徑規劃,它是派單的核心,工程師圍繞最低的價格、最高的司機效率和最佳交通系統運行效率來做算法。
ETA是指預估任意起終點所需的行駛時間,要求精準性。滴滴將機器學習應用到ETA,這是解決“訂單高效匹配”和“司機運力調度”的關鍵技術。當前滴滴ETA可以預測每一單出行的時長以及預估在每一個路口前的等待時長,這項技術可以幫助滴滴在更合適的時間對運力進行更好的調度。ETA/路徑規劃及其學習系統如圖1.13所示。

圖1.13 ETA/路徑規劃及其學習系統
3)智能派單
滴滴叫車和搜索商品的邏輯不同。網上的商品、資訊等信息都是靜態停留在那里,計算方式只是將這個商品、信息挖掘出來;而滴滴的計算則類似于動態打靶,車輛永遠在運動當中,要在眾多運動的車輛中,給乘客一個最優的選擇,不光是距離,還有時間。滴滴研發的基本原則是想辦法撮合乘客和司機,滿足他們的需求,保證他們的體驗。簡單點說,就是將訂單發送給合適的司機。以滴滴專車業務為例,目前還要用到人為制定的規則,例如如何將信息推送給最適合區域內的司機、誰優先獲得訂單等。在數據量較小的情況下,可以基于規則、人的經驗來設定算法,但是在數據量更大更豐富的情況下,這樣的做法可能和現實存在一定程度的脫節。
這是一個頗為繁雜的過程。除了推薦算法要準確、匹配效率要高、計算要快、推送要及時外,還要在推送訂單到這位司機之前,通過對小費、長短途、時間、方向敏感等靜態特征和司機與訂單之間的位置關系、時間關系等動態特征進行綜合分析來預測他對訂單感興趣的程度。智能派單對訂單量和司機數進行預測,然后通過大規模分布式計算來實現上述的最優撮合。為了實現這一目的,供需預測、動態調價、路徑規劃以及服務分的算法技術要一起發揮作用,它們最終為實現最優派單而服務,它們的算法都將結合到智能派單系統中,幫助在動態環境中撮合乘客與司機的交易。
高峰期滴滴平臺每分鐘接收超過3萬乘客需求,每2秒鐘做一次訂單匹配,每一次發單背后,滴滴大腦運算次數為百億次級別。此外,滴滴還可使用大數據技術來預估每個司機的服務分值,包括乘客打分、乘客評價、取消率等因素,并利用算法模型來計算不同服務水平的司機對用戶產生的長期影響。
4)九霄
九霄是滴滴大數據孵化的出行領域智能決策技術產品,能夠把錯綜復雜的時間、空間、業務維度的N次元出行領域數據,轉化成易于理解的二次元數據,搭建數據理解的橋梁,幫助運營、產品、BI、研發人員發現問題、分析問題、解決問題,產生切實的業務收益。
滴滴將出行領域的數據,進行整理、挖掘、智能聚合,在地圖空間和時間軸上進行合理的呈現,使用戶能夠直觀地感知在什么時間、什么地點、各個業務線的什么業務維度(乘客、訂單、運力、體驗等),發生了什么,方便深入追蹤、探尋業務痛點和原因分析。
例如,通過九霄,對地圖上任意區域的供需平衡狀況、訂單滿足情況能夠一目了然,并且結合九霄的精細化分析能力,能夠細化到某個地理圍欄的供需策略,進行圍欄級別的運力調度策略配置;(在代駕場景上)基于機器學習進行供需預測,判斷哪些區域存在運力缺口,自動化調度司機調節供需平衡。實際上,九霄是憑借科學可視化技術能力、算法能力和高性能架構能力,將數據變為知識,作為決策依據。
此外,給乘客什么樣的補貼、給司機什么樣的補貼、誰更敏感、多少金額影響更積極,這些策略的背后都是大數據在起作用。
2.滴滴大數據與城市智慧交通建設
1)城市道路優化
對大多數用戶而言,網約車只是一個打車工具。實際上,網約車背后能做的遠遠不止這些。每一次的出行背后都是數據的調動和積累,都是對一座城市更為深入的了解。對一座城市而言,尤其是一線城市,網約車有著重大的存在意義。
其一,優化用戶出行體驗,為用戶的出行需求插上互聯網的翅膀。
其二,參與優化城市道路交通。習慣網約車后,越來越多的用戶正在逐步減少開車次數,一定程度上緩解了道路交通壓力和減少了汽車尾氣排放。
其三,優化城市道路交通基礎規劃。
當用戶打開滴滴出行APP叫車時,毫秒之間,滴滴大腦平均需要CPU運算576億次,才能為用戶匹配出最優的車輛。這個讓人難以置信的數字,深刻反映出滴滴大腦驚人的大數據運算處理能力。推薦上車點“黑科技”上線后,截至2016年,滴滴平臺上超過30%的司機和乘客,按照小綠點不需要通話就可以找到對方,司機的通話量平均下降10%,乘客等候時間平均減少1分鐘。這些黑科技的背后,其實就是滴滴對一座城市的學習,并且是動態的學習。更好地了解學習城市動態,才能為用戶提供更準確的出行服務體驗。
2)滴滴交通云
以武漢為例,滴滴大數據顯示,武漢有超過50%的乘客愿意與別人分享,選擇拼車出行。2016年1—10月,武漢有超過2900萬人次通過拼車和順風車出行。據測算,一輛充分使用的分享汽車,如果每次行程能夠載2~3組目的地相近的拼車乘客,每天可減少20~40輛私家車上路,因而會大大降低機動車空駛率和上路率。武漢市每天的快車拼車和順風車出行達10.2萬人次,如果按私家車平均每輛車每天出行2次,每次載客1.5人計算,這相當于武漢每天減少3.4萬輛小汽車出行。
這些龐大的海量數據,都正實時上傳到滴滴秘密打造的一朵云——滴滴交通云上。滴滴大腦在這朵云上,根據交通度量體系設定,分析海量數據,讓分析結果為乘客、司機、交通主管部門等所有出行參與方都帶來價值。滴滴出行正與武漢市交管局共同持續推進武漢“互聯網+交通”建設,雙方將在路況服務、智能交通云服務等方面進行深度合作。章文嵩介紹,被植入滴滴交通云的城市將發生至少三大變化。
第一,滴滴交通云可以利用智能調度優勢幫助改善城市交通擁堵問題。比如,在空間維度,A到B點有很多乘客,滴滴交通云有可能規劃不同的行駛道路,讓每個路網的車流量均衡。而在時間維度,滴滴交通云可以嘗試對早高峰出行的人做精準營銷,比如9點出行的乘客,如果8點出行,補貼5元,從而在時間維度上,達到削峰填谷的作用。
第二,滴滴交通云未來還可協助設計智能交通管控方案,提高道路利用率。比如,滴滴交通云可以實現智能信號燈控制,通過數據模型算出整個區域的車流量情況,靠區域的紅綠燈協調,讓城市各條道路的通行效率更高、更流暢。
第三,滴滴交通云的價值還將體現在,為城市的路網優化提供決策依據。比如,4個車道,左轉彎應該一個還是兩個,滴滴交通云都可以給出精準建議。滴滴交通云也會對新建路網做規劃建議,比如,應該在哪里建路,或者要不要建一座橋等。
對大眾用戶而言,很難通過打車去切身體會滴滴大數據的作用,但對于城市交通規劃部門而言,交通大數據的采集或許能夠針對性解決一些實質問題,尤其是對一些缺乏大型城市交通規劃能力的城市而言。
案例小結:滴滴是一個移動互聯網產品,依托移動支付,有幾乎100%的支付接入率,滴滴的互聯網金融想象空間很大。滴滴將出行連接結構化、數據化,意味著全程可追溯、可評價、可反饋,形成一個促進司機服務不斷優化的正向循環生態。滴滴生態里有大量司機資源,滴滴企業平臺也是互聯網金融好場景,滴滴賬戶余額也可以變身滴滴版余額寶,只要有海量信任連接的用戶,一切都是可以想象的。
1.7.2 案例之二:大數據與美團外賣的精細化運營
美團最初是一個互聯網公司,美團的團隊之前做校內網(人人網的前身),后來做飯否網,再后來因為某些原因飯否網被關掉之后,開始轉做美團網。2013年11月上線的美團外賣,在兩年半的時間內成為中國最大的外賣平臺,最近日訂單已經突破400萬份,這個數字放在所有電商交易平臺里也能輕松排到前列。而這種高速發展的背后,與大數據技術的支撐和精細化運營是分不開的。美團外賣首先是一個線下商戶與線下消費者的線上交易平臺,對商戶來說,一方面美團可以幫商戶解決知名度的問題,可以通過這個平臺觸達更多的用戶。另一方面,由于很多的消費不是發生在線下,商戶不需要租用一個大面積、好地段的商鋪,可以減少店鋪的租金。對消費者來說,可以有更多的選擇,并且對現在很多追求生活享受的“宅男”“宅女”或一些生活節奏較快的人也非常方便。
外賣O2O和傳統的電商存在一些差異。可以簡單總結為如下幾點。
一是新事物,快速發展。這意味著很多用戶對外賣的認知較少,對平臺上的新品類缺乏了解,對自身的需求也沒有充分意識。平臺需要去發現用戶的消費意愿,以便對用戶的消費進行引導。
二是高頻。外賣是個典型的高頻O2O應用。一方面,消費頻次高,用戶生命周期相對好判定;另一方面,消費單價較低,用戶決策時間短、隨意性大。
三是場景驅動。場景是特定的時間、地點和人物的組合下的特定的消費意圖。不同的時間、地點,不同類型的用戶的消費意圖會有差異。例如,白領在寫字樓中午的訂單一般是工作餐,通常在營養、品質上有一定的要求,且單價不能太高;而到了周末晚上的訂單大多是夜宵,追求口味且價格彈性較大。場景辨識越細致,越能了解用戶的消費意圖,運營效果就越好。
四是用戶消費的地理位置相對固定。結合地理位置判斷用戶的消費意圖是外賣的一個特點。
1.大數據在美團外賣畫像技術中的應用
美團外賣經過3年的飛速發展,品類已經從單一的外賣擴展到了美食、夜宵、鮮花、商超等多個品類。用戶群體也從早期的以學生為主擴展到白領、社區以及商旅,甚至包括在KTV等娛樂場所消費的人群。隨著供給和消費人群的多樣化,如何在供給和用戶之間做一個對接,就是用戶畫像的一個基礎工作。所謂千人千面,畫像需要刻畫不同人群的消費習慣和消費偏好。
1)外賣產品運營對畫像技術的要求
我們大致可以把一個產品的運營分為用戶獲取和用戶拓展兩個階段。在用戶獲取階段,用戶因為自然原因或一些營銷事件(如廣告、社交媒體傳播)產生對外賣的注意,進而產生了興趣,并在合適的時機下完成首購,從而成為外賣新客。在這一階段,運營的重點是提高效率,通過一些個性化的營銷和廣告手段,吸引到真正有潛在需求的用戶,并刺激其轉化。在用戶完成轉化后,接下來的運營重點是拓展用戶價值。這里有兩個問題。第一個問題是提升用戶價值,具體而言就是提升用戶的單均價和消費頻次,從而提升用戶的LTV(life-time value)。基本手段包括交叉銷售(新品類的推薦)、向上銷售(優質高價供給的推薦)以及重復購買(優惠、紅包刺激重復下單以及優質供給的推薦帶來下單頻次的提升)。第二個問題是用戶的留存,通過提升用戶總體體驗以及在用戶有流失傾向時通過促銷和優惠將用戶留在外賣平臺。所以用戶所處的體驗階段不同,運營的側重點也需要有所不同。而用戶畫像作為運營的支撐技術,需要提供相應的用戶刻畫以滿足運營需求。如圖1.14所示為美團用戶體驗過程。

圖1.14 用戶體驗過程
2)外賣畫像系統架構
畫像服務的架構包括:數據源包括基礎日志、商家數據和訂單數據。數據完成處理后存放在一系列主題表中,再導入kv存儲,給下游業務端提供在線服務。同時會對整個業務流程實施監控。主要分為兩部分,第一部分是對數據處理流程的監控,利用內部自研的數據治理平臺,監控每天各主題表產生的時間、數據量以及數據分布是否有異常。第二部分是對服務的監控。目前畫像系統支持的下游服務包括廣告、排序、運營等系統。如圖1.15所示為美團畫像系統架構。

圖1.15 美團畫像系統架構
2.大數據在美團外賣客戶挖掘和預測中的應用
1)新客運營
新客運營主要需要回答下列3個問題。
(1)新客在哪里?
(2)新客的偏好如何?
(3)新客的消費力如何?
回答這3個問題是比較困難的,因為相對于老客而言,新客的行為記錄非常少或者幾乎沒有。這就需要通過一些技術手段做出推斷。例如,新客的潛在轉化概率,受到新客的人口屬性(職業、年齡等)、所處地域(需求的因素)、周圍人群(同樣反映需求)以及是否有充足供給等因素的影響;而對于新客的偏好和消費力,從新客在到店場景下的消費行為可以做出推測。另外用戶的工作和居住地點也能反映他的消費能力。
對新客的預測大量依賴于他在到店場景下的行為,而用戶的到店行為對于外賣是比較稀疏的,大多數用戶是在少數幾個類別上有過一些消費行為。這就意味著需要考慮選擇什么樣的統計量描述,如消費單價,總消費價格,消費品類,等等。然后通過大量的試驗來驗證特征的顯著性。另外,由于數據比較稀疏,需要考慮合適的平滑處理。
美團在做高潛新客挖掘時,融入了多方特征,通過特征的組合最終做出一個效果比較好的預測模型。美團能夠找到一些高轉化率的用戶,其轉化率比普通用戶高若干倍。通過對高潛用戶有針對性的營銷,可以極大提高營銷效率。
2)流失預測
新客來了之后,接下來需要把他留在這個平臺上,盡量延長生命周期。營銷領域關于用戶留存的兩個基本觀點是:獲取一個新顧客的成本是維系現有顧客成本的5倍;如果將顧客流失率降低5%,公司利潤將增加25%~85%。
用戶流失的原因通常包括:競爭對手的吸引、體驗問題和需求變化等。美團借助機器學習的方法,構建用戶的描述特征,并借助這些特征來預測用戶未來流失的概率。這里有兩種做法:第一種是預測用戶未來若干天是否會下單這一事件發生的概率。這是典型的概率回歸問題,可以選擇邏輯回歸、決策樹等算法擬合給定觀測下事件發生的概率。第二種是借助于生存模型,例如COX-PH模型,做流失的風險預測。圖1.16左邊是概率回歸的模型,用戶未來T天內是否有下單作為類別標記y,然后估計在觀察到特征X的情況下 y的后驗概率P(y|X)。右邊是用 COX模型的例子,我們會根據用戶在未來T天是否下單給樣本一個類別,即觀測時長記為 T。假設用戶的下單的距今時長 t<T,將t作為生存時長t';否則將生存時長t’記為T。這樣一個樣本由三部分構成:樣本的類別(flag)、生存時長(t')以及特征列表。通過生存模型雖然無法顯式得到P(t' | X)的概率,但其協變量部分實際反映了用戶流失的風險大小。

圖1.16 流失預測模型
生存模型(見圖1.17)中,βT x反映了用戶流失的風險,同時也和用戶下次訂單的時間間隔成正相關。在箱線圖中,橫軸為β Tx,縱軸為用戶下單時間的間隔。

圖1.17 生存模型
美團做了 COX模型和概率回歸模型的對比。在預測用戶××天內是否會下單上面,兩者有相近的性能。美團外賣通過使用用戶流失預警模型,顯著降低了用戶留存的運營成本。
3.大數據在美團外賣用戶補貼中的應用
美團外賣吸引顧客的一個方式是用戶補貼。用戶補貼對于平臺而言是一筆巨大的運營成本。但是在很多情況下,用戶補貼是很有必要的。平臺都希望吸引更多的新用戶以及留住老客戶,這是業務發展的重中之重。那么,怎樣進行用戶補貼才能有助于平臺吸引客戶,之后源源不斷地在平臺上消費,這就需要大數據分析作為支撐。
首先,以客戶留存率和自動轉化意愿將用戶群體劃分為四個象限(見圖1.18)。第一個維度是客戶留存率。在互聯網行業中,用戶在某段時間內開始使用應用,經過一段時間后,仍然繼續使用應用的被認作是留存客戶;這部分用戶占當時新增用戶的比例即是客戶留存率。需要關注的是,對于剛開始使用美團外賣的新用戶,有多大可能性會一直留在平臺,在平臺不給補貼的情況下,還會不會繼續留在平臺。有的用戶在只有給紅包的情況下才會留下,這就是留存率低的情況。另一個維度是用戶的自動轉化意愿。平臺上每天都會有很多新客戶,有的新客戶沒使用紅包就開始使用平臺的服務,有的客戶只有給他發紅包才能完成轉化,但是轉化之后會成為平臺的忠實客戶,有的客戶一旦沒有紅包就會自動流失。那么,對于自動轉化意愿高的用戶,不給紅包也愿意使用,如果能識別出來這類客戶,就可以不給補貼。還有一些只有收到紅包才使用,之后又會流失,如圖中第三象限,這部分用戶最好不發補貼。平臺需要識別給了紅包就可以一直留在平臺,即使以后沒有紅包也會一直保持消費忠誠的客戶。要知道客戶屬于哪個象限的,就需要用大量數據做挖掘。

圖1.18 用戶群體劃分
為了識別不同類型的用戶,需要做用戶畫像(見圖1.19),首先通過各種渠道了解用戶的年齡、婚姻狀況、收入水平、消費習慣、常住地等,了解這些信息后,需要做一次用戶模型的訓練,即把各種參數跟四個象限做一次訓練,就知道給什么樣的用戶推紅包。以下分析如何使用用戶畫像來尋找補貼對象。

圖1.19 用戶畫像要素
圖1.20是數據挖掘的流程示意圖。美團外賣也是一個大數據公司,每天有大量用戶瀏覽網頁、大量用戶在網站上購買、用戶的位置屬性和手機型號這些數據也都可以獲得,另外還有用戶自己填寫的性別、年齡等,這些都可以用來做用戶數據的挖掘。有了這些數據之后,通過數據挖掘的算法,對用戶進行深入的挖掘之后,再去完善用戶的各種畫像,就可以得到一個模型。然后對于任何一個特定的用戶,將其瀏覽購買歷史的信息輸入模型中,就可以知道這個用戶很多具體的特征。例如,用戶的年齡為25到30,可能是一個剛畢業沒多久的白領。例如,用戶是一個夜貓子,那么平臺就在晚上向其推薦一些夜宵。再比如,單身理工男,他可能就不太喜歡甜食、水果。這就是平臺通過大數據挖掘得到的很多用戶畫像的信息,之后將這些信息用于平臺用戶營銷、用戶補貼等方面,可以快速提高平臺識別和分析用戶的精準度。如果理想情況下,把原來隨便撒紅包的形式,限制在一個象限,平臺資金的使用效率就會更高,這就是大數據在用戶補貼方面的使用。

圖1.20 用戶畫像流程
4.大數據在美團外賣供應鏈中的應用
“外賣 O2O”是一種特殊的O2O形態,多了一個配送和調度的部分。其他如信息發布、用戶信息的搜索以及支付和以往都一樣,只是履約部分由消費者到商家店里消費改成配送上門。配送團隊首先報告給平臺,每一個配送員的位置在什么地方,平臺根據這個定位和訂單的信息發起調度,告訴配送員去取哪個訂單,然后這個配送員就可以去商戶那邊把訂單取回來,送給消費者,這是外賣O2O的模式。
1)O2O閉環
外賣O2O模式的真正價值在于通過線上工具與云服務器、CRM、餐飲管理系統的信息化無縫閉合回路,依靠云計算功能處理、轉化、應用大數據。所以,只有無縫整合線上線下資源,形成O2O閉環才是企業能否踏入大數據時代的關鍵。外賣O2O閉環的難點和痛點在于,如何收集線下消費者體驗的反饋信息,并將線下用戶引到線上交流,進行線上體驗。有的商家以為自己促使消費者完成線上的支付就是O2O閉環,這是膚淺的想法。把消費者從線下送到線上,這個線上不僅僅是支付,而是要形成線上的消費者與消費者、消費者與商家之間的互動。
互動需要一個能夠容納消費者和商家的平臺。現在看來,微信平臺是一個不錯的選擇。可以在微信上建立一個公眾平臺,與消費者進行互動交流。互動的話題可以是讓消費者自己來設計喜歡的菜單,讓消費者自己來設計喜歡的菜品。一旦得到采納,消費者可以獲得獎品,或者是此菜品永遠對該設計者免費。這樣,除了在平臺上完成訂餐、點菜、支付等功能外,還能根據消費者的消費行為有針對性地進行推廣和促銷。更重要的是,能充分發揮粉絲經濟的作用,讓粉絲參與到服務改進、菜品改進中來,提高顧客的滿意度并提升商家的銷量和形象。
自此,把消費者從線下引到線上的途徑就達成了,這樣才是一個真正的O2O閉環(見圖1.21)。從線上到線下,再從線下到線上,消費者在被引導,數據和信息才會流入商家的口袋中。

圖1.21 大數據庫O2O閉環
2)配送的智能調度系統
如圖1.22所示為配送調度的示意圖,黑色的袋鼠是配送員(騎手)。一般而言,平臺沒法預測用戶下單的位置。每個用戶下單的頻率不一樣,下單的餐館也不一樣。這些騎手站位要怎么站位,這么多訂單要讓哪個騎手取哪個訂單,用什么順序送這個訂單,這些在極大程度上影響了騎手的能效。如圖1.23所示為配送要考慮的因素。

圖1.22 美團外賣配送調度圖

圖1.23 外賣配送問題
如果考慮一個數學模型(見圖1.24),目標函數就會優化很多的變量,比如說每一單平均的行駛距離,因為平臺根據這個給配送員付工資;配送時間,這個決定了用戶的體驗;運單的準時率;如果訂單很多,騎手有限,實在送不過來,希望最壞的體驗也不要太壞;還有騎手的滿意度,在平臺技術團隊看來,騎手也是平臺的客戶,所以預期在分派訂單的時候騎手也是滿意的。

圖1.24 配送調度問題的數學模型
如圖1.25所示為美團外賣現在使用的一套系統。平臺同樣會用很多的特征數據來挖掘,包括給騎手畫像,即騎手的騎程速度、送多少,他的箱子能送什么,騎什么車送外賣,等等。給商家畫像,即這個商家一天最多出多少單,可以做多少盒外賣,商家從接到訂單到準備好訂單平均大約幾分鐘,等等。還有各種配送指標,包括統計指標、騎手上報的各種路徑,然后都會放在其中進行挖掘。挖掘之后會結合所做的一個數學模型在一個仿真平臺上運行,運行之后發現這個算法可以,就放到一個實時的海量計算平臺上給實時的這些訂單做實時調度。調度算法是基于一個多目標的運籌優化的數學模型。在做調度的過程中,會同時監控每一個訂單,監控實際配送時間跟預期的配送時間是否相同,騎手實際走什么樣的路徑,跟系統預期的最佳路徑是否相同,還包括一些騎手給平臺反饋一些不好的調度方案等。平臺把這些信息都收集回來,再輸入到回放平臺,找到那個時間點再回放一下,這樣可以指導這個算法有什么地方可以優化,或者需要添加哪些新的數據參數。

圖1.25 美團外賣配送的智能調度系統
這個系統數據量特別大,同時包括騎手的數據,十幾萬騎手,每十秒上報一個位置,所以有特別多的點。再加上給全國很多城市做配送,美團專門跟氣象部門合作,購買了每個城市的實時氣象數據,然后系統會根據氣象數據知道城市的雨雪情況,根據這個天氣情況做調度,在這里需要輸入的數據特別多。基于這種情況,平臺使用大數據技術對配送的調度方案進行不斷的探索和優化。
5.大數據在扼制惡意刷單套現中的應用
有用戶補貼往往會帶來刷單作弊,一般有利益的地方就容易產生這種情況。刷單就是一種行業毒瘤,簡單來說就是一些作弊的訂單和作弊的交易。刷單者有很多不同的目的,比如說用大量虛假的訂單套取補貼的利率、套現,以及制造一些虛假的訂單量。例如,一個店鋪入駐美團外賣之后,本來一個月賣三單五單,通過大量的虛假訂單,一個月一下子能有1000單的銷量。因為美團外賣網站按照銷量對商家進行排名,通過刷單把月銷量刷上去,店鋪排名就在上面,就會帶來更多的流量,這就是制造虛假訂單。還有一部分是利用虛假訂單寫一些虛假的評論來誤導用戶。跟補貼相關的,主要是補貼套現。
與刷單行為做斗爭對O2O行業的發展是非常重要的一件事情。美團最初的做法,是在網頁上面放了一個鏈接,讓大家舉報刷單,運用群眾的力量抑制刷單。然而這種方法沒有什么用,因為真正刷單的人,如在家里用“貓池”刷單的人,別人是無法知道的。事實證明,通過這種方式接到的舉報很少,而接到的舉報經查,往往是商家的一些競爭對手為了打擊對方的虛假舉報。在這種情況下,只有靠大數據的技術手段才能抑制刷單,如圖1.26所示。

圖1.26 美團外賣防刷單模型
圖1.26只是一個簡單的示意圖,美團外賣平臺會收集大量的數據,包括每個月用戶所有的下單歷史、瀏覽歷史,商家的銷售歷史,例如一個商家銷售1000單,這1000單到底是賣給了一個用戶還是賣給很多個用戶,這里面可以找到很多規律。美團現在每個訂單都是由配送員配送的,每個配送員的APP要每隔10秒匯報一次他的地理位置,所以平臺有所有配送員的路徑記錄。同時有一支運營團隊去人工分析,哪些訂單是刷單的,有哪些特征。利用這些人工的樣本作為種子,加上上面的一些數據,同樣的把它們輸入到整個系統的大數據庫里面。最后有一個防刷單模型,基于這個刷單模型就可以判斷某個用戶刷單的可能性和商家刷單的可能性。對可能性比較高的,平臺運營人員會介入并分析,如果是真的就予以比較嚴厲的懲罰,情節較輕就追回刷單的贓款,對于情節較重的行為將以欺詐的罪名,上報相關法律機構。
案例小結:互聯網企業具有高速的發展潛力,互聯網企業的競爭正在從資本驅動,慢慢走向技術驅動、數據驅動。對這些企業而言,整體上由原來的補貼導向的競爭,慢慢變成靠公司整體的運營治理、技術和數據導向的競爭。