- 大數據分析與應用實戰:統計機器學習之數據導向編程
- 鄒慶士編著
- 426字
- 2022-07-28 20:15:36
1.3.8 R語言衍生數據對象
基于前述的基本數據對象,可以衍生出定制化的結構。例如,套件{DMwR}中1970-01-02到2009-09-15的SP500每日收盤股價指數GSPC,此數據對象存儲多變量時間序列數據,其類別名稱為定義在套件{xts}中的同名類別xts。從對象的結構信息中可看出,xts類的時間序列數據是用10 022×6的數值矩陣存放10 022筆樣本,每筆有開盤價、最高價、最低價、收盤價、成交量與調整后的價格這六個變量。這類對象可以時間值進行索引,并帶有數據源(Yahoo)與更新時間(2009-10-06 23:47:09)等屬性。


{xts}套件有許多處理時間序列數據的函數,nmonths()、nquarters()、ndays()返回時間序列數據周期的月份、季度與天數。endpoints()函數可獲取數據周期中秒、分、時、日、周、月、季或年等的起止點,結合period.apply()函數(參見1.5節向量化與隱式循環),可對各時間區間的數據進行統計,例如下例中的算術平均數。



接下來運用邏輯值索引取出超出這段周期收盤平均指數加上2.15倍標準偏差的數據,程序代碼先使用套件{quantmod}中的Cl()函數取出收盤指數,計算平均值與標準偏差后,再按2.15倍標準偏差界線進行邏輯判斷后取值(收盤價高于1542者)。

推薦閱讀
- Visual C++串口通信開發入門與編程實踐
- Hands-On Machine Learning with scikit:learn and Scientific Python Toolkits
- Game Programming Using Qt Beginner's Guide
- Apache Spark 2.x Machine Learning Cookbook
- Scala Design Patterns
- AIRAndroid應用開發實戰
- 看透JavaScript:原理、方法與實踐
- 網頁設計與制作教程(HTML+CSS+JavaScript)(第2版)
- AngularJS深度剖析與最佳實踐
- Java Web應用開發技術與案例教程(第2版)
- Learning Vaadin 7(Second Edition)
- Web Development with MongoDB and Node(Third Edition)
- Learning AWS
- App Inventor少兒趣味編程動手做
- C編程技巧:117個問題解決方案示例