- Python廣告數(shù)據(jù)挖掘與分析實戰(zhàn)
- 楊游云 周健
- 626字
- 2021-04-02 14:21:17
2.2.6 指數(shù)分布
目前指數(shù)分布被廣泛用于生存分析中,從機器的預期壽命到人類的預期壽命,指數(shù)分布都能較成功地提供結果。假設你現(xiàn)在在呼叫中心工作,可以使用指數(shù)分布模擬呼叫中心每次呼叫之間的時間間隔。其他類似的例子還有地鐵到達的時間間隔、到達加油站的時間間隔、空調的壽命等。
對于任意隨機變量x,若其密度函數(shù)為以下表達式f(x),則稱它是服從指數(shù)分布的:

其中,參數(shù)λ>0,λ也稱為速率。
對于生存分析,假定它已經(jīng)存活到t時刻,則稱λ為任何時刻t設備的故障率。
服從指數(shù)分布的隨機變量x的均值和方差分別如下。
·均值:E(x)=1/λ
·方差:Var(x)=(1/λ)2
此外,速率越大,曲線下降越快,速率越小,曲線越平坦。
前面我們分別介紹了幾種常見的數(shù)據(jù)分布形式,但很難說廣告數(shù)據(jù)到底服從哪一種分布,因為廣告交易的場景非常多,需要根據(jù)具體情況具體分析。例如要研究按CPC計費的廣告點擊量與廣告費用的關系,結果可能是一條線性的曲線,表示廣告費用會隨著廣告點擊量的增加而增加;但研究單個用戶廣告曝光次數(shù)與點擊概率的關系時,結果可能就是一條類長尾的非線性曲線,也就是說,隨著曝光次數(shù)的增加,用戶的點擊概率總體呈下降的衰退趨勢。這其實也很好理解,如果相同的廣告重復曝光給同一個用戶很多次,當超過一定次數(shù)之后就會引起用戶的排斥和反感,進而影響其對廣告的響應率。再比如我們想研究某媒體平臺一天當中的用戶廣告請求量,你可能會發(fā)現(xiàn)凌晨的用戶請求數(shù)比白天少,這是因為凌晨絕大部分用戶都在睡覺,所以研究結果是一條根據(jù)時間實時變化的非線性曲線。
推薦閱讀
- 數(shù)據(jù)分析實戰(zhàn):基于EXCEL和SPSS系列工具的實踐
- Access 2016數(shù)據(jù)庫教程(微課版·第2版)
- Voice Application Development for Android
- 虛擬化與云計算
- Visual Studio 2015 Cookbook(Second Edition)
- 分布式數(shù)據(jù)庫系統(tǒng):大數(shù)據(jù)時代新型數(shù)據(jù)庫技術(第3版)
- SQL查詢:從入門到實踐(第4版)
- 大數(shù)據(jù)架構和算法實現(xiàn)之路:電商系統(tǒng)的技術實戰(zhàn)
- Python金融實戰(zhàn)
- Starling Game Development Essentials
- Lego Mindstorms EV3 Essentials
- 爬蟲實戰(zhàn):從數(shù)據(jù)到產(chǎn)品
- 聯(lián)動Oracle:設計思想、架構實現(xiàn)與AWR報告
- 改變未來的九大算法
- Oracle 11g數(shù)據(jù)庫管理員指南