官术网_书友最值得收藏!

任務(wù)實現(xiàn)

任務(wù)1.1 根據(jù)業(yè)務(wù)需求選擇合適的大數(shù)據(jù)分析技術(shù)

本任務(wù)的主要內(nèi)容:

●對大數(shù)據(jù)分析案例進行業(yè)務(wù)需求分析;

●為大數(shù)據(jù)分析案例選擇合適的大數(shù)據(jù)分析技術(shù)。

1.1.1 業(yè)務(wù)需求分析

在前面的相關(guān)知識中,我們介紹了大數(shù)據(jù)分析的概念、發(fā)展過程、應(yīng)用場景、流程等。那么,當(dāng)我們在現(xiàn)實中遇到需要使用大數(shù)據(jù)分析技術(shù)來進行分析、得出結(jié)論、給出建議的案例時,我們應(yīng)該怎么做呢?

國內(nèi)某電信運營商,業(yè)務(wù)覆蓋全國,客戶量極其龐大。但這些年來,隨著其他運營商的發(fā)展,移動通信業(yè)務(wù)競爭非常激烈,該運營商的客戶也出現(xiàn)了嚴(yán)重的流失。是什么因素導(dǎo)致客戶流失呢?怎么做才能減少這樣的流失?這是該運營商目前亟待解決的問題。

那么,我們就來討論一下,類似這樣的對運營商客戶流失因素進行分析的案例應(yīng)該如何解決。

運營商客戶流失因素,一定會涉及多個方面,我們拿到一份關(guān)于運營商客戶的數(shù)據(jù),其中包括以下特征:

●信用等級;

●VIP等級;

●本月話費;

●通話時長;

●通話次數(shù);

●短信發(fā)送數(shù);

●上網(wǎng)流量;

●性別;

●年齡。

接下來,我們需要做以下工作:

(1)數(shù)據(jù)導(dǎo)入;

(2)數(shù)據(jù)探索與預(yù)處理;

(3)數(shù)據(jù)特征分析;

(4)數(shù)據(jù)分析與建模;

(5)模型評估;

(6)分析結(jié)果的可視化展示。

要想完成這些工作,我們需要選擇哪些大數(shù)據(jù)分析技術(shù)呢?

1.1.2 選擇大數(shù)據(jù)分析技術(shù)

隨著大數(shù)據(jù)分析技術(shù)的發(fā)展,大數(shù)據(jù)分析工具也層出不窮。正如前面相關(guān)知識中所講到的,從傳統(tǒng)的統(tǒng)計分析軟件,到大數(shù)據(jù)分析編程語言,再到大數(shù)據(jù)可視化分析工具,大數(shù)據(jù)分析工具的使用越來越方便,分析結(jié)果的展示方式也越來越多樣化。

在本次任務(wù)一開始,我們就提出了關(guān)于運營商客戶流失因素分析的案例,在1.1.1小節(jié)我們已經(jīng)提出了該案例的業(yè)務(wù)需求。那么應(yīng)該為這個案例選擇什么樣的大數(shù)據(jù)分析技術(shù)呢?

在當(dāng)今大數(shù)據(jù)及人工智能領(lǐng)域中,Python語言憑借自身的優(yōu)勢脫穎而出,成為使用非常廣泛的程序設(shè)計語言。說到Python,就不得不提創(chuàng)造這個語言的人,也就是被稱為Python之父的吉多·范羅蘇姆。1989年,范羅蘇姆為了打發(fā)時間,決心開發(fā)一個新的腳本解釋程序,作為ABC語言的一種繼承。Python這個單詞的意思是蟒蛇,所以它的logo是由兩條蟒蛇組成的,如圖1-4所示。

圖1-4 Python的logo

Python具有以下特點。

第一,開源。Python是一種開源編程語言,使用基于社區(qū)的模型開發(fā)。它可以在Windows和Linux平臺中運行。除此之外,也可以將其移植到其他平臺,因為它支持多個平臺。

第二,速度快。Python是一種高級語言,它契合原型設(shè)計思想,開發(fā)者可以使用它快速編碼,同時保持代碼與執(zhí)行過程之間的高度透明性。由于這種透明性,代碼的維護以及將其添加到多用戶開發(fā)環(huán)境中的代碼庫變得容易。

第三,支持多種數(shù)據(jù)處理。Python提供了對文本、圖像和多媒體數(shù)據(jù)的高級支持,它支持對非結(jié)構(gòu)化數(shù)據(jù)和非常規(guī)數(shù)據(jù)的數(shù)據(jù)處理,這是分析社交媒體數(shù)據(jù)時的常見大數(shù)據(jù)需求。這是Python能夠與大數(shù)據(jù)分析相結(jié)合的另一個原因。

第四,也是非常重要的一點,就是Python語言支持多種庫。Python廣泛應(yīng)用于各個行業(yè)領(lǐng)域的科學(xué)計算,它包含大量經(jīng)過良好測試的第三方庫,主要包括以下幾類:

(1)數(shù)值計算;

(2)數(shù)據(jù)預(yù)處理;

(3)統(tǒng)計分析;

(4)機器學(xué)習(xí);

(5)可視化。

這些第三方庫里面有很多函數(shù),完全可以用來解決運營商客戶流失因素分析案例中需要解決的問題。因此,在本教材中,我們將使用Python語言的庫來完成每一個任務(wù)。那么使用Python語言的庫需要哪些準(zhǔn)備呢?在任務(wù)1.2中,我們將詳細(xì)地進行介紹。

主站蜘蛛池模板: 舟曲县| 比如县| 临桂县| 三亚市| 昭通市| 陵水| 长治市| 无棣县| 九龙县| 富源县| 仲巴县| 沧州市| 南郑县| 玛曲县| 兰考县| 菏泽市| 西吉县| 甘肃省| 喜德县| 凤山县| 奉贤区| 平乡县| 承德市| 荆州市| 呼伦贝尔市| 鸡东县| 巴林右旗| 房产| 美姑县| 广安市| 东宁县| 宁阳县| 南投市| 秦皇岛市| 花莲市| 烟台市| 冀州市| 淮北市| 凌云县| 清河县| 乌审旗|