- 數據挖掘算法實踐與案例詳解
- 丁兆云 沈大勇 徐偉 周鋆
- 921字
- 2025-04-09 18:12:40
1.4.2 員工離職預測數據集
員工離職預測問題來自DataCastle數據競賽平臺中的賽題,數據集中的數據分為訓練數據和測試數據,其中訓練數據包括1100條記錄,每條記錄有31個字段。
各字段及說明如下:
1)Age:員工年齡。
2)Label:員工是否已經離職,1表示已經離職,2表示未離職,這是目標預測值。
3)BusinessTravel:商務差旅頻率,Non-Travel表示不出差,Travel_Rarely表示不經常出差,Travel_Frequently表示經常出差。
4)Department:員工所在部門,Sales表示銷售部,Research&Development表示研發部,Human Resources表示人力資源部。
5)DistanceFromHome:公司與家之間的距離,值的范圍為1~29,1表示最近,29表示最遠。
6)Education:員工的受教育程度,值的范圍為1~5,5表示受教育程度最高。
7)EducationField:員工所學習的專業領域,Life Sciences表示生命科學,Medical表示醫療,Marketing表示市場營銷,Technical Degree表示技術,Human Resources表示人力資源,Other表示其他。
8)EmployeeNumber:員工號碼。
9)EnvironmentSatisfaction:員工對工作環境的滿意程度,值的范圍為1~4,1表示滿意程度最低,4表示滿意程度最高。
10)Gender:員工性別,Male表示男性,Female表示女性。
11)JobInvolvement:員工的工作投入度,值的范圍為1~4,1為投入度最低,4為投入度最高。
12)JobLevel:職業級別,值的范圍為1~5,1為最低級別,5為最高級別。
13)JobRole:工作角色,Sales Executive是銷售主管,Research Scientist是科學研究員,Laboratory Technician是實驗室技術員,Manufacturing Director是制造總監,Healthcare Representative是醫療代表,Manager是經理,Sales Representative是銷售代表,Research Director是研究總監,Human Resources是人力資源。
14)JobSatisfaction:工作滿意度,值的范圍為1~4,1代表滿意度最低,4代表滿意度最高。
15)MaritalStatus:員工婚姻狀況,Single代表單身,Married代表已婚,Divorced代表離婚。
16)MonthlyIncome:員工的月收入,值的范圍為1009~19999。
17)NumCompaniesWorked:員工曾經工作過的公司數。
18)Over18:年齡是否超過18歲。
19)OverTime:是否加班,Yes表示加班,No表示不加班。
20)PercentSalaryHike:工資提高的百分比。
21)PerformanceRating:績效評估。
22)RelationshipSatisfaction:關系滿意度,值的范圍為1~4,1表示滿意度最低,4表示滿意度最高。
23)StandardHours:標準工時。
24)StockOptionLevel:股票期權水平。
25)TotalWorkingYears:總工齡。
26)TrainingTimesLastYear:上一年的培訓時長,值的范圍為0~6,0表示沒有培訓,6表示培訓時間最長。
27)WorkLifeBalance:工作與生活的平衡程度,值的范圍為1~4,1表示平衡程度最低,4表示平衡程度最高。
28)YearsAtCompany:在目前公司工作的年數。
29)YearsInCurrentRole:在目前崗位工作的年數。
30)YearsSinceLastPromotion:距離上次升職的年數。
31)YearsWithCurrManager:與目前的上級共事的年數。
- 數據產品經理高效學習手冊:產品設計、技術常識與機器學習
- Test-Driven Development with Mockito
- Python金融大數據分析(第2版)
- 業務數據分析:五招破解業務難題
- 大數據:規劃、實施、運維
- 商業分析思維與實踐:用數據分析解決商業問題
- The Game Jam Survival Guide
- Spark大數據編程實用教程
- 圖數據實戰:用圖思維和圖技術解決復雜問題
- 從實踐中學習sqlmap數據庫注入測試
- Oracle 11g+ASP.NET數據庫系統開發案例教程
- Unity Game Development Blueprints
- MySQL性能調優與架構設計
- 全球智庫評價報告(2015)
- Working with OpenERP