官术网_书友最值得收藏!

1.4.2 員工離職預測數據集

員工離職預測問題來自DataCastle數據競賽平臺中的賽題,數據集中的數據分為訓練數據和測試數據,其中訓練數據包括1100條記錄,每條記錄有31個字段。

各字段及說明如下:

1)Age:員工年齡。

2)Label:員工是否已經離職,1表示已經離職,2表示未離職,這是目標預測值。

3)BusinessTravel:商務差旅頻率,Non-Travel表示不出差,Travel_Rarely表示不經常出差,Travel_Frequently表示經常出差。

4)Department:員工所在部門,Sales表示銷售部,Research&Development表示研發部,Human Resources表示人力資源部。

5)DistanceFromHome:公司與家之間的距離,值的范圍為1~29,1表示最近,29表示最遠。

6)Education:員工的受教育程度,值的范圍為1~5,5表示受教育程度最高。

7)EducationField:員工所學習的專業領域,Life Sciences表示生命科學,Medical表示醫療,Marketing表示市場營銷,Technical Degree表示技術,Human Resources表示人力資源,Other表示其他。

8)EmployeeNumber:員工號碼。

9)EnvironmentSatisfaction:員工對工作環境的滿意程度,值的范圍為1~4,1表示滿意程度最低,4表示滿意程度最高。

10)Gender:員工性別,Male表示男性,Female表示女性。

11)JobInvolvement:員工的工作投入度,值的范圍為1~4,1為投入度最低,4為投入度最高。

12)JobLevel:職業級別,值的范圍為1~5,1為最低級別,5為最高級別。

13)JobRole:工作角色,Sales Executive是銷售主管,Research Scientist是科學研究員,Laboratory Technician是實驗室技術員,Manufacturing Director是制造總監,Healthcare Representative是醫療代表,Manager是經理,Sales Representative是銷售代表,Research Director是研究總監,Human Resources是人力資源。

14)JobSatisfaction:工作滿意度,值的范圍為1~4,1代表滿意度最低,4代表滿意度最高。

15)MaritalStatus:員工婚姻狀況,Single代表單身,Married代表已婚,Divorced代表離婚。

16)MonthlyIncome:員工的月收入,值的范圍為1009~19999。

17)NumCompaniesWorked:員工曾經工作過的公司數。

18)Over18:年齡是否超過18歲。

19)OverTime:是否加班,Yes表示加班,No表示不加班。

20)PercentSalaryHike:工資提高的百分比。

21)PerformanceRating:績效評估。

22)RelationshipSatisfaction:關系滿意度,值的范圍為1~4,1表示滿意度最低,4表示滿意度最高。

23)StandardHours:標準工時。

24)StockOptionLevel:股票期權水平。

25)TotalWorkingYears:總工齡。

26)TrainingTimesLastYear:上一年的培訓時長,值的范圍為0~6,0表示沒有培訓,6表示培訓時間最長。

27)WorkLifeBalance:工作與生活的平衡程度,值的范圍為1~4,1表示平衡程度最低,4表示平衡程度最高。

28)YearsAtCompany:在目前公司工作的年數。

29)YearsInCurrentRole:在目前崗位工作的年數。

30)YearsSinceLastPromotion:距離上次升職的年數。

31)YearsWithCurrManager:與目前的上級共事的年數。

主站蜘蛛池模板: 淮滨县| 龙泉市| 都匀市| 靖州| 镇宁| 富川| 纳雍县| 昆明市| 吉首市| 洛宁县| 喀喇沁旗| 樟树市| 宁陵县| 黄浦区| 稷山县| 永仁县| 石屏县| 新田县| 拜泉县| 海兴县| 达州市| 富顺县| 济源市| 石棉县| 河间市| 东阿县| 石嘴山市| 应城市| 综艺| 郁南县| 开封县| 杂多县| 嘉荫县| 松潘县| 昌吉市| 法库县| 井冈山市| 新安县| 宜兴市| 大同县| 焉耆|