- 零基礎入門Python數據分析與機器學習
- 王國平
- 425字
- 2022-07-27 18:22:42
1.4 一個簡單的數據分析案例

為了讓讀者更好地認識數據分析,下面介紹一個企業員工流失預測的例子。我們知道員工主動離職的原因多種多樣,一般是員工覺得薪資不合理或者自己受到委屈等。但是,企業培養人才需要大量的成本,為了防止人才流失,員工流失分析就顯得十分重要。
這里我們收集了部分離職員工的相關數據,共有6個字段,包括影響員工離職的主要因素(員工滿意度、績效考核、每月工作時長、工作年限、薪資)以及員工是否已經離職。
首先導入數據,示例代碼和輸出如下:

由于這里的數據已經在Excel中清洗過,沒有缺失值和異常值等,因此下面直接進行描述性統計分析,以進一步了解數據的分布情況,示例代碼和輸出如下:

此外,為了研究員工的平均每月工作時長與是否離職兩者之間的關系,下面使用可視化的方法進行深入分析,示例代碼如下:

通過運行上面的代碼,可以繪制出平均每月工作時長與是否離職的箱線圖,如圖1-19所示。可以看出離職人員的平均每月工作時長相對較長,也就是說加班可能會導致部分員工離職。

圖1-19 箱線圖
推薦閱讀
- Developing Mobile Web ArcGIS Applications
- Hands-On Image Processing with Python
- Machine Learning with R Cookbook(Second Edition)
- Magento 2 Development Cookbook
- PhoneGap Mobile Application Development Cookbook
- Serverless架構
- Python機器學習算法與實戰
- C語言程序設計教程
- ExtJS高級程序設計
- Learning AWS
- C編程技巧:117個問題解決方案示例
- C++程序設計
- 嵌入式Linux C語言程序設計基礎教程
- PHP 8從入門到精通(視頻教學版)
- 菜鳥成長之路