官术网_书友最值得收藏!

第2章 多元數據可視化

圖形是進行數據探索的重要工具,可以直觀地反映數據的分布情況以及各變量之間的相關關系。當變量較少時,常用的圖形有直方圖、箱線圖、條形圖、散點圖等。這些圖形在變量個數不超過3個的情況下是簡單、有效的。由于受到二維平面的限制,多變量的圖形展示方法比較有限。20世紀70年代以來,統計學家陸續提出了一些多變量的圖示方法,用以描述多元數據的統計特性,使圖形直觀、簡潔的優點延伸到多元數據的分析中。本章介紹常用的多變量圖示法的基本思想和作圖方法。

本章的繪圖示例將使用第1章表1-2中的數據,為此我們先讀入數據:

>cirr<-read.csv('cirrhosis.csv')#讀入數據并存為數據框cirr
>names(cirr)#查看數據框cirr中的變量名
[1]"sex""agegrp""FIB""lnPT""PTA""lnCHE"
>bio<-cirr[,3:6]#將數據框cirr的后4列存為對象bio
主站蜘蛛池模板: 革吉县| 南靖县| 通榆县| 白朗县| 克山县| 株洲市| 敦煌市| 钟祥市| 聂荣县| 临洮县| 永吉县| 莱芜市| 内黄县| 汕尾市| 乐业县| 蓬莱市| 肥城市| 东丰县| 加查县| 易门县| 高州市| 监利县| 济宁市| 陵川县| 祁门县| 体育| 宣威市| 仪征市| 庄浪县| 东阿县| 定兴县| 兰州市| 金寨县| 子长县| 新民市| 宣恩县| 泽库县| 永修县| 莱芜市| 涿鹿县| 瑞金市|