官术网_书友最值得收藏!

前言

為何寫作本書

“工欲善其事,必先利其器。”

首先,當你考慮如何將數據應用到經營管理當中,如何從數據角度診斷業務發展中存在的問題,如何用數據指導業務發展,以及如何進行數據資產變現時,你會發現必須有一套數據加工工具以及可應用的工作流程作為支撐。當前市面上的數據分析工具十分豐富,有支持分布式計算的,有提供操作界面的,有免費開源的,有提供自動建模功能的,甚至兼而有之的。SAS EM與Python是其中十分優秀和流行的工具。SAS EM功能強大,操作簡便,自動化程度高;而Python應用范圍廣,框架豐富,使用靈活,編寫效率高。二者在分析過程中可以互相印證,在實際應用中可以互為補充。

其次,當前市面上有很多的數據建模分析書籍,絕大多數圖書的目錄組織方式無外乎兩種類型:一種是工具型,以介紹建模分析軟件、語言、框架為主;另一種是算法型,以介紹模型算法、調參、優化等為主。而以案例為主的建模分析圖書較少,且其中往往以算法為主干,配合行業典型案例進行講解。這樣的材料組織方式有助于開闊眼界,但容易“博而不專”,無法讓讀者將案例融入具體行業。對于具體行業的新手來說,一本以案例為主的金融垂直領域的算法手冊會更有幫助。

最后,數據建模分析的目的是服務業務。縱向來看,其縱貫業務經營的全流程,這需要我們使用一系列模型來支持獲客營銷、客戶畫像、價值預測、交叉銷售、風險控制、運籌優化、客戶維系等工作;橫向來看,建模分析師要對接業務前端需求與后臺的應用部署,這就要求建模分析師不僅要懂業務、懂數據、懂模型,還要了解數據治理體系、工程化實現等,這對工作流程中的協同有重要作用。從這個角度看,市場上也需要能涵蓋分析框架、算法案例、工程化實現的圖書。

鑒于以上原因,筆者認為需要寫一本專注于金融垂直領域、支持業務全流程需求、以業務引領的建模分析手冊,為廣大從業者的工作和學習提供便利。本書以Python和SAS EM為工具,致力于為熟悉金融業務的你打造一套工具模板,使你可以輕松地根據需求展開分析工作,并能對當前工作的上下游流程加深理解,以便更好地開展協同工作。

本書主要內容

本書主要內容如下。

(1)金融數據挖掘的九大分析模板

本書從業務需求角度出發,探討統計建模、機器學習模型在金融領域的應用,包括客戶價值預測、營銷響應預測、細分畫像、交叉銷售、申請反欺詐、違規行為識別、預測技術、運籌優化、流程挖掘等九大分析模板,形成模板化的工作流。同時,對模型算法做了重點講解,方便讀者理解模型本身,并在實際工作中應用。

(2)實踐案例

本書主要涉及SAS EM以及Python建模分析實踐,一方面介紹如何結合案例背景形成分析思路,以及在面對特定問題時調優模型,另一方面介紹工具的基本使用,使不熟悉SAS EM和Python的讀者能夠快速上手。

(3)算法工程化

本書為編程新手構建良好的工程代碼結構和編寫優雅的工程代碼提供建議。

讀者對象

本書主要面向金融行業的廣大業務分析師、咨詢師、數據建模師、算法工程師,同樣適合有志于從事金融行業的在校學生和數據建模分析愛好者閱讀。數據建模分析在金融行業的應用歷史悠久,相關研究十分深入,因此對于從事電商、通信、傳統貿易、制造等行業的從業者來說本書也有重要的借鑒價值。

內容特色

本書更多地從業務應用場景來組織內容,意在更加貼近業務,而非單純羅列算法。經過與業內專家的反復探討,本書提取了在行業應用中價值最大、最常用的9類場景,力圖提供不同場景中構建數據應用的最佳實踐。本書涉及的算法不局限于傳統統計分析,也結合了金融業務的需求,解構了機器學習、深度學習的前沿方法,并提供了豐富的示例代碼,以方便讀者借鑒。

如何閱讀本書

本書的定位是“手冊”,這意味著你可以根據需求單獨查閱相關章節的內容。不過,筆者仍然建議你通讀全書,不僅因為本書涉及的算法存在一定的前后關聯性,而且因為這可以讓你在大腦中構建一套商業分析工作的全流程。如果你擁有充足的時間并希望建立完整的數據建模分析體系,筆者建議你合理分配時間,反復閱讀本書。

第一遍,快速通讀,形成印象。這一步其實非常重要,當你能夠在大腦中構建本書的一個大致的體系框架時,你已經理解了金融建模分析的工作內容和要求,并能在本書中快速定位所需的解決方案。你可以在這一步跳過算法公式和程序代碼。

第二遍,選擇性地精讀相關章節。具體選擇哪部分取決于你工作中遇到的實際問題,只有結合實踐才能更好地理解并發散思維。精讀意味著需要耗費時間研究業務問題的特點、數據特征和模型細節,一方面最好能結合實際數據進行擴展,另一方面在某些重點、難點上需要閱讀大量相關參考資料進行佐證。雖然本書不是純粹的編程技術書,但代碼仍然非常重要,并且使用了多個數據建模分析框架。尤其對于新手來說,一定不要只是“跑”代碼,而是要“敲”代碼。

第三遍,通讀全書,并關注其中的一些細節,例如數學公式、參數調優等。這有助于你加深對模型的理解,并更好地運用模型。需要注意的是,自然語言永遠沒有數學語言表述得精確,因此建議讀者盡量結合數學公式來理解模型。

技能是從不斷重復中得來的。我們可以通過一些技巧在減少重復次數的情況下更快地掌握技能,但根本上,重復是掌握技能的唯一有效手段。共勉!

資源和勘誤

請關注微信公眾號“數據資管”,下載書中的演示數據和腳本,觀看教學視頻,交流問題和反饋意見,也歡迎發送郵件至453288431@qq.com,期待得到你們的真摯反饋。

主站蜘蛛池模板: 吴旗县| 宽城| 忻城县| 那坡县| 乌什县| 新疆| 休宁县| 南岸区| 泸溪县| 昌江| 辉南县| 大理市| 长丰县| 天等县| 独山县| 新乐市| 河津市| 普陀区| 天长市| 肥东县| 肇州县| 兴安盟| 铁岭市| 吉木萨尔县| 通许县| 商城县| 仲巴县| 陆河县| 泸州市| 莒南县| 怀柔区| 历史| 江口县| 荥阳市| 桦南县| 崇阳县| 天峻县| 百色市| 松原市| 邵武市| 庄浪县|