- 機器學習實戰:基于Sophon平臺的機器學習理論與實踐
- 星環科技人工智能平臺團隊
- 382字
- 2020-01-07 16:02:43
2.1.4 時間特征
時間特征廣泛存在于各種實際的數據集中,比如交易產生的時間、用戶上線時間、歌曲播放時間、用戶分享文章的時間等。原始的時間特征通常以字符串的形式表示,比如“2019年4月10日17點29分”;或者以時間戳的方式表示(BigInt),比如“1451664824123”。Sophon中提供了格式化時間日期的算子,可以將原始時間特征轉化成格式化的時間日期類型值(比如Spark提供的DateType和Timestamp-Type)。
原始時間特征與機器學習的目標通常沒有直接關聯,因此需要進行特定的變換。我們把有關時間特征的提取方法大致分為以下三類:
? 連續型變換:比如計算用戶聽一首歌的持續時間,或者計算兩個交易之間的時間間隔等。這類變換輸出一個連續型的值,計算方法通常是求兩個時間戳的差。
? 離散型變換:比如提取出日期中的年份、月份、季度和星期幾等。
? 提取時間窗口:比如我們需要得到過去一周的交易數據,則可根據交易時間這一特征對數據進行過濾,最終得到時間窗口內的記錄。
推薦閱讀
- 輕松學C語言
- Google Cloud Platform Cookbook
- 控制與決策系統仿真
- 空間機器人遙操作系統及控制
- Visual Basic從初學到精通
- PostgreSQL Administration Essentials
- Mastering ServiceNow Scripting
- RedHat Linux用戶基礎
- 邊緣智能:關鍵技術與落地實踐
- Learning ServiceNow
- 從零開始學JavaScript
- 與人共融機器人的關節力矩測量技術
- Hands-On Business Intelligence with Qlik Sense
- RealFlow流體制作經典實例解析
- 系統安裝、維護與數據備份技巧