官术网_书友最值得收藏!

1.4 一個簡單的數據分析案例

為了讓讀者更好地認識數據分析,下面介紹一個企業員工流失預測的例子。我們知道員工主動離職的原因多種多樣,一般是員工覺得薪資不合理或者自己受到委屈等。但是,企業培養人才需要大量的成本,為了防止人才流失,員工流失分析就顯得十分重要。

這里我們收集了部分離職員工的相關數據,共有6個字段,包括影響員工離職的主要因素(員工滿意度、績效考核、每月工作時長、工作年限、薪資)以及員工是否已經離職。

首先導入數據,示例代碼和輸出如下:

由于這里的數據已經在Excel中清洗過,沒有缺失值和異常值等,因此下面直接進行描述性統計分析,以進一步了解數據的分布情況,示例代碼和輸出如下:

此外,為了研究員工的平均每月工作時長與是否離職兩者之間的關系,下面使用可視化的方法進行深入分析,示例代碼如下:

通過運行上面的代碼,可以繪制出平均每月工作時長與是否離職的箱線圖,如圖1-19所示。可以看出離職人員的平均每月工作時長相對較長,也就是說加班可能會導致部分員工離職。

圖1-19 箱線圖

主站蜘蛛池模板: 大关县| 遵义市| 玉溪市| 贵州省| 石泉县| 香格里拉县| 孟村| 沅陵县| 白朗县| 应城市| 右玉县| 林芝县| 兰考县| 昭通市| 巨鹿县| 海原县| 新津县| 中阳县| 大厂| 北海市| 呼图壁县| 阳春市| 江西省| 台北县| 凤城市| 乌兰县| 富民县| 涞水县| 即墨市| 通江县| 莒南县| 临湘市| 江门市| 珠海市| 喜德县| 屯门区| 克拉玛依市| 铁力市| 长岛县| 德保县| 英山县|