- 大數(shù)據(jù)分析處理(慕課版)
- 郭永洪 賀萌主編
- 4字
- 2024-04-23 17:42:56
任務(wù)實現(xiàn)
任務(wù)1.1 根據(jù)業(yè)務(wù)需求選擇合適的大數(shù)據(jù)分析技術(shù)
本任務(wù)的主要內(nèi)容:
●對大數(shù)據(jù)分析案例進行業(yè)務(wù)需求分析;
●為大數(shù)據(jù)分析案例選擇合適的大數(shù)據(jù)分析技術(shù)。
1.1.1 業(yè)務(wù)需求分析
在前面的相關(guān)知識中,我們介紹了大數(shù)據(jù)分析的概念、發(fā)展過程、應(yīng)用場景、流程等。那么,當(dāng)我們在現(xiàn)實中遇到需要使用大數(shù)據(jù)分析技術(shù)來進行分析、得出結(jié)論、給出建議的案例時,我們應(yīng)該怎么做呢?
國內(nèi)某電信運營商,業(yè)務(wù)覆蓋全國,客戶量極其龐大。但這些年來,隨著其他運營商的發(fā)展,移動通信業(yè)務(wù)競爭非常激烈,該運營商的客戶也出現(xiàn)了嚴(yán)重的流失。是什么因素導(dǎo)致客戶流失呢?怎么做才能減少這樣的流失?這是該運營商目前亟待解決的問題。
那么,我們就來討論一下,類似這樣的對運營商客戶流失因素進行分析的案例應(yīng)該如何解決。
運營商客戶流失因素,一定會涉及多個方面,我們拿到一份關(guān)于運營商客戶的數(shù)據(jù),其中包括以下特征:
●信用等級;
●VIP等級;
●本月話費;
●通話時長;
●通話次數(shù);
●短信發(fā)送數(shù);
●上網(wǎng)流量;
●性別;
●年齡。
接下來,我們需要做以下工作:
(1)數(shù)據(jù)導(dǎo)入;
(2)數(shù)據(jù)探索與預(yù)處理;
(3)數(shù)據(jù)特征分析;
(4)數(shù)據(jù)分析與建模;
(5)模型評估;
(6)分析結(jié)果的可視化展示。
要想完成這些工作,我們需要選擇哪些大數(shù)據(jù)分析技術(shù)呢?
1.1.2 選擇大數(shù)據(jù)分析技術(shù)
隨著大數(shù)據(jù)分析技術(shù)的發(fā)展,大數(shù)據(jù)分析工具也層出不窮。正如前面相關(guān)知識中所講到的,從傳統(tǒng)的統(tǒng)計分析軟件,到大數(shù)據(jù)分析編程語言,再到大數(shù)據(jù)可視化分析工具,大數(shù)據(jù)分析工具的使用越來越方便,分析結(jié)果的展示方式也越來越多樣化。
在本次任務(wù)一開始,我們就提出了關(guān)于運營商客戶流失因素分析的案例,在1.1.1小節(jié)我們已經(jīng)提出了該案例的業(yè)務(wù)需求。那么應(yīng)該為這個案例選擇什么樣的大數(shù)據(jù)分析技術(shù)呢?
在當(dāng)今大數(shù)據(jù)及人工智能領(lǐng)域中,Python語言憑借自身的優(yōu)勢脫穎而出,成為使用非常廣泛的程序設(shè)計語言。說到Python,就不得不提創(chuàng)造這個語言的人,也就是被稱為Python之父的吉多·范羅蘇姆。1989年,范羅蘇姆為了打發(fā)時間,決心開發(fā)一個新的腳本解釋程序,作為ABC語言的一種繼承。Python這個單詞的意思是蟒蛇,所以它的logo是由兩條蟒蛇組成的,如圖1-4所示。

圖1-4 Python的logo
Python具有以下特點。
第一,開源。Python是一種開源編程語言,使用基于社區(qū)的模型開發(fā)。它可以在Windows和Linux平臺中運行。除此之外,也可以將其移植到其他平臺,因為它支持多個平臺。
第二,速度快。Python是一種高級語言,它契合原型設(shè)計思想,開發(fā)者可以使用它快速編碼,同時保持代碼與執(zhí)行過程之間的高度透明性。由于這種透明性,代碼的維護以及將其添加到多用戶開發(fā)環(huán)境中的代碼庫變得容易。
第三,支持多種數(shù)據(jù)處理。Python提供了對文本、圖像和多媒體數(shù)據(jù)的高級支持,它支持對非結(jié)構(gòu)化數(shù)據(jù)和非常規(guī)數(shù)據(jù)的數(shù)據(jù)處理,這是分析社交媒體數(shù)據(jù)時的常見大數(shù)據(jù)需求。這是Python能夠與大數(shù)據(jù)分析相結(jié)合的另一個原因。
第四,也是非常重要的一點,就是Python語言支持多種庫。Python廣泛應(yīng)用于各個行業(yè)領(lǐng)域的科學(xué)計算,它包含大量經(jīng)過良好測試的第三方庫,主要包括以下幾類:
(1)數(shù)值計算;
(2)數(shù)據(jù)預(yù)處理;
(3)統(tǒng)計分析;
(4)機器學(xué)習(xí);
(5)可視化。
這些第三方庫里面有很多函數(shù),完全可以用來解決運營商客戶流失因素分析案例中需要解決的問題。因此,在本教材中,我們將使用Python語言的庫來完成每一個任務(wù)。那么使用Python語言的庫需要哪些準(zhǔn)備呢?在任務(wù)1.2中,我們將詳細(xì)地進行介紹。
- 華東師范大學(xué)外語學(xué)院211翻譯碩士英語[專業(yè)碩士]歷年考研真題及詳解
- 襯衫制板·工藝·設(shè)計
- 中國政法大學(xué)801法理學(xué)原理歷年考研真題視頻講解【12小時高清視頻】
- 電影基礎(chǔ)史論與經(jīng)典案例導(dǎo)讀
- 旅游市場營銷
- 運輸系統(tǒng)規(guī)劃與設(shè)計
- 微觀經(jīng)濟學(xué)學(xué)習(xí)指導(dǎo)與習(xí)題精解
- 仲偉合《英語口譯教程(上)》復(fù)習(xí)筆記與實例詳解
- 信息與通信綜合實驗指導(dǎo)書
- 大學(xué)生職業(yè)發(fā)展與就業(yè)指導(dǎo)
- 商務(wù)禮儀與溝通(微課版)
- 2020年安徽公務(wù)員錄用考試專項教材:數(shù)量關(guān)系【考點精講+典型題(含歷年真題)詳解】
- 單片機原理與接口技術(shù)(第2版)
- 環(huán)境設(shè)計:手繪表現(xiàn)效果圖
- 南京大學(xué)外國語學(xué)院211翻譯碩士英語[專業(yè)碩士]歷年考研真題及詳解