官术网_书友最值得收藏!

2.2 常見統計分析方法

在學術圖表中,除了將數據進行圖形可視化展示,往往還需要對數據進行統計分析和判斷,并將分析結果在圖形上面標注出來,所以統計分析也是繪制學術圖表時不可或缺的一部分。在大多數情況下,如果沒有統計分析,再精美的圖表也不符合投稿要求。所以,在很多繪圖軟件中,都會先使用統計分析軟件(如SPSS、SAS、STATA等)進行統計分析,得到分析結果后再繪制圖形。

而GraphPad Prism將統計分析和圖表繪制合為一體,在繪圖過程中可以完成常見的絕大多數統計分析,這種一體化分析給用戶帶來了極大的便利。但這對軟件介紹和學習帶來了麻煩,因為這時不可避免地要介紹統計學知識,對于整個篇章結構的安排就增加了難度。好在國內的理工科專業都開設了“統計學”的課程,很多讀者基本都學過常見的統計方法。因此,本書并沒有對統計學知識進行詳細介紹,而是注重結合實例介紹常用統計方法在GraphPad Prism中的應用目的和實現過程,將其完全融合在繪圖過程中。如果讀者完全沒有相關統計學知識,只是想要繪圖,則可以直接跳過統計分析相關的步驟。

單擊工具欄中的圖標,進入Analyze Data(分析數據)界面,可以看到GraphPad Prism內置的統計分析方法共有11類,還有1類是Recently used(最近使用),便于快速選擇統計分析方法,如圖2-2-1所示。在這11類統計分析方法中,有8類是與8種數據表相對應的,是整個軟件進行數據分析的重點,另外還有Transform, Normalize(變換,歸一化)、Generate curve(生成曲線)和Simulate data(模擬數據)3類,可以進行常見的數據變換或輔助使用。

圖2-2-1 GraphPad Prism內置的統計分析方法

1. Transform, Normalize(變換,歸一化)

Transform, Normalize主要針對數據變換和歸一化,其下的統計分析方法如表2-2-1所示,變換結果將在左側導航欄的Results部分以綠色網格線的新表格表示。如果用戶能夠熟練使用Excel進行數據預處理,則基本可以在Excel中完成這里的功能,而且Excel使用函數進行數據變換的功能更加強大。但是,在這里進行數據變換的過程會更加簡單,絕大多數常見函數只需要簡單單擊就能完成數據變換。

表2-2-1 Transform,Normalize下的統計分析方法

圖2-2-2 數據變換和對基線行列進行計算

2. XY analyses(XY表分析)

XY表展示的是XY兩個變量的關系。而變量間常見的關系有平行關系和因果關系兩種。平行關系是指兩個或兩個以上變量之間共同受到其他因素的影響,如男/女性身高和體重之間的關系,一般使用相關性分析(Correlation)進行研究。因果關系是指一個變量的變化受到另一個或幾個變量的制約,如細胞的生長速度受到溫度、CO2濃度、生長因子等因素的影響,一般使用回歸分析進行研究。

根據平行關系和因果關系涉及的變量數量,相應的研究方法有很多,如圖2-2-3所示。XY表只涉及兩個變量,圖2-2-3中藍色部分的研究方法,包括簡單相關(Pearson系數)、秩相關(Spearman系數)簡單線性回歸(Simple linear regression)、非線性回歸(Nonlinear regression)、簡單Logistic回歸(Simple logistic regression)都可以在XY analyses下完成。

圖2-2-3 變量關系研究方法

圖2-2-3中的多元線性回歸(Multiple linear regression)、多元Logistic回歸(Multiple logistic regression)等則需要在多變量數據表下完成。具體而言,XY表統計分析方法如表2-2-2所示。

表2-2-2 XY表統計分析方法

3. Column analyses(縱列表分析)

Column(縱列表)又稱為一維分組表,以列的形式安排一個分組因素。根據分組后的樣本數量,可將樣本為單樣本、兩樣本和多樣本,分別對應不同的統計分析方法,常見的有單樣本t檢驗、成組t檢驗、配對t檢驗、單因素方差分析及對應的非參數檢驗方法。縱列表涉及的統計分析是整個統計學的基礎部分,在學術圖表繪制中使用頻率較高,而且在不同前提條件下使用的檢驗方法也不同,顯得特別繁雜。如圖2-2-4所示,總結了對連續變量進行差異分析時,在不同前提條件下GraphPad Prism所使用的方法。

圖2-2-4 差異分析方法

縱列表統計分析方法如表2-2-3所示。

表2-2-3 縱列表統計分析方法

4. Grouped analyses(行列分組表分析)

Grouped(行列分組表)又稱為二維分組表,以行和列結合的形式安排2個或3個分組因素。以行列分組表安排2個或3個分組因素對應的統計分析方法主要是二因素方差分析(Two-way ANOVA)和三因素方差分析(Three-way ANOVA)(見圖2-2-4)。此外,如果試驗過程中對同一受試對象進了多次觀察和測量,則還需要使用重復度量的方差分析,GraphPad Prism也支持此類分析。Grouped analyses下具體的統計分析方法除了Two-way ANOVA(二因素方差分析)、Three-way ANOVA(三因素方差分析)和Row means with SD or SEM(帶SD或SEM的行平均值),還有Multiple t tests-one per row(每行之間的多重t檢驗)。

5. Contingency table analyses(列聯表分析)

Contingency table analyses下的統計分析方法主要包括Chi-square(and Fisher’s exact)test(卡方(Fisher精確)檢驗),相關內容見6.2節;而Row means with SD or SEM(帶SD或SEM的行平均值)在XY analyses、Column analyses、Grouped analyses下重復出現;Fraction of total(局部占總體比例)在Transform, Normalize和Parts of whole analyses下重復出現。

6. Survival analyses(生存表分析)

Survival(生存表)主要用于生存分析和生存曲線繪制,相關內容見第7章。

7. Parts of whole analyses(局部整體表分析)

Fraction of total(局部占總體比例)在Transform, Normalize和Contingency table analyses下重復出現。還有一種分析方法是Compare observed distribution with expected(比較觀察分布和期望分布),用來推斷兩個總體率或構成比之間有無差別,相關內容見8.1節。

8. Multiple variable analyses(多變量表分析)

Multiple variable(多變量表)是GraphPad Prism 8新增的數據表,每一列代表一個變量,每一行代表一個個體或一次試驗,常用于安置高級統計分析方法,如多元線性回歸(Multiple linear regression)、多元Logistic回歸(Multiple logistic regression)、泊松回歸(Poisson regression)及相關性矩陣計算(Correlation matrix)。多變量表統計分析方法如表2-2-4所示。

表2-2-4 多變量表統計分析方法

9. Nested analyses(嵌套表分析)

Nested(嵌套表)主要用于解決嵌套數據的統計分析和圖形繪制。因此,在該表中,數據格式和統計分析方法是配套專用的,其中同名的Descriptive statistics(描述性統計)等描述的都是子列的數據,所以表2-2-5里面的部分統計分析方法都加了“子列”二字以示區別。嵌套表適用于既有試驗重復又有技術重復的數據結構,可以同時判斷分組內部單元和分組之間是否存在統計學差異。

表2-2-5 嵌套表統計分析方法

10. Generate curve(生成曲線)

根據軟件內置的函數模型和自行指定的參數生成曲線,如圖2-2-5所示。

圖2-2-5 生成曲線

11. Simulate data(模擬數據)

可以根據要求模擬數據,如模擬XY表、縱列表、列聯表數據,主要用于研究軟件的使用和統計分析方法,如表2-2-6所示。

表2-2-6 模擬數據統計分析方法

主站蜘蛛池模板: 襄城县| 皮山县| 辽阳市| 万州区| 龙州县| 定远县| 武乡县| 台北市| 资兴市| 冕宁县| 平湖市| 益阳市| 灵川县| 河津市| 茂名市| 柏乡县| 巨野县| 临潭县| 邢台县| 鹤壁市| 林芝县| 旅游| 锡林郭勒盟| 万盛区| 怀化市| 龙游县| 桦川县| 十堰市| 东丽区| 桐庐县| 和龙市| 宁海县| 同心县| 睢宁县| 方城县| 杭锦旗| 麻城市| 莎车县| 榆树市| 炎陵县| 常宁市|