不朽情缘四滴血是多少倍

書名： GraphPad Prism學術圖表（全彩）
作者名：張敏
本章字數： 2379字
更新時間： 2021-05-19 17:55:47

2.2　常見統計分析方法

在學術圖表中，除了將數據進行圖形可視化展示，往往還需要對數據進行統計分析和判斷，并將分析結果在圖形上面標注出來，所以統計分析也是繪制學術圖表時不可或缺的一部分。在大多數情況下，如果沒有統計分析，再精美的圖表也不符合投稿要求。所以，在很多繪圖軟件中，都會先使用統計分析軟件（如SPSS、SAS、STATA等）進行統計分析，得到分析結果后再繪制圖形。

而GraphPad Prism將統計分析和圖表繪制合為一體，在繪圖過程中可以完成常見的絕大多數統計分析，這種一體化分析給用戶帶來了極大的便利。但這對軟件介紹和學習帶來了麻煩，因為這時不可避免地要介紹統計學知識，對于整個篇章結構的安排就增加了難度。好在國內的理工科專業都開設了“統計學”的課程，很多讀者基本都學過常見的統計方法。因此，本書并沒有對統計學知識進行詳細介紹，而是注重結合實例介紹常用統計方法在GraphPad Prism中的應用目的和實現過程，將其完全融合在繪圖過程中。如果讀者完全沒有相關統計學知識，只是想要繪圖，則可以直接跳過統計分析相關的步驟。

單擊工具欄中的圖標，進入Analyze Data（分析數據）界面，可以看到GraphPad Prism內置的統計分析方法共有11類，還有1類是Recently used（最近使用），便于快速選擇統計分析方法，如圖2-2-1所示。在這11類統計分析方法中，有8類是與8種數據表相對應的，是整個軟件進行數據分析的重點，另外還有Transform, Normalize（變換，歸一化）、Generate curve（生成曲線）和Simulate data（模擬數據）3類，可以進行常見的數據變換或輔助使用。

圖2-2-1　GraphPad Prism內置的統計分析方法

1. Transform, Normalize（變換，歸一化）

Transform, Normalize主要針對數據變換和歸一化，其下的統計分析方法如表2-2-1所示，變換結果將在左側導航欄的Results部分以綠色網格線的新表格表示。如果用戶能夠熟練使用Excel進行數據預處理，則基本可以在Excel中完成這里的功能，而且Excel使用函數進行數據變換的功能更加強大。但是，在這里進行數據變換的過程會更加簡單，絕大多數常見函數只需要簡單單擊就能完成數據變換。

表2-2-1　Transform，Normalize下的統計分析方法

圖2-2-2　數據變換和對基線行列進行計算

2. XY analyses（XY表分析）

XY表展示的是X和Y兩個變量的關系。而變量間常見的關系有平行關系和因果關系兩種。平行關系是指兩個或兩個以上變量之間共同受到其他因素的影響，如男/女性身高和體重之間的關系，一般使用相關性分析（Correlation）進行研究。因果關系是指一個變量的變化受到另一個或幾個變量的制約，如細胞的生長速度受到溫度、CO2濃度、生長因子等因素的影響，一般使用回歸分析進行研究。

根據平行關系和因果關系涉及的變量數量，相應的研究方法有很多，如圖2-2-3所示。XY表只涉及兩個變量，圖2-2-3中藍色部分的研究方法，包括簡單相關（Pearson系數）、秩相關（Spearman系數）簡單線性回歸（Simple linear regression）、非線性回歸（Nonlinear regression）、簡單Logistic回歸（Simple logistic regression）都可以在XY analyses下完成。

圖2-2-3　變量關系研究方法

圖2-2-3中的多元線性回歸（Multiple linear regression）、多元Logistic回歸（Multiple logistic regression）等則需要在多變量數據表下完成。具體而言，XY表統計分析方法如表2-2-2所示。

表2-2-2　XY表統計分析方法

3. Column analyses（縱列表分析）

Column（縱列表）又稱為一維分組表，以列的形式安排一個分組因素。根據分組后的樣本數量，可將樣本為單樣本、兩樣本和多樣本，分別對應不同的統計分析方法，常見的有單樣本t檢驗、成組t檢驗、配對t檢驗、單因素方差分析及對應的非參數檢驗方法。縱列表涉及的統計分析是整個統計學的基礎部分，在學術圖表繪制中使用頻率較高，而且在不同前提條件下使用的檢驗方法也不同，顯得特別繁雜。如圖2-2-4所示，總結了對連續變量進行差異分析時，在不同前提條件下GraphPad Prism所使用的方法。

圖2-2-4　差異分析方法

縱列表統計分析方法如表2-2-3所示。

表2-2-3　縱列表統計分析方法

4. Grouped analyses（行列分組表分析）

Grouped（行列分組表）又稱為二維分組表，以行和列結合的形式安排2個或3個分組因素。以行列分組表安排2個或3個分組因素對應的統計分析方法主要是二因素方差分析（Two-way ANOVA）和三因素方差分析（Three-way ANOVA）（見圖2-2-4）。此外，如果試驗過程中對同一受試對象進了多次觀察和測量，則還需要使用重復度量的方差分析，GraphPad Prism也支持此類分析。Grouped analyses下具體的統計分析方法除了Two-way ANOVA（二因素方差分析）、Three-way ANOVA（三因素方差分析）和Row means with SD or SEM（帶SD或SEM的行平均值），還有Multiple t tests-one per row（每行之間的多重t檢驗）。

5. Contingency table analyses（列聯表分析）

Contingency table analyses下的統計分析方法主要包括Chi-square（and Fisher’s exact）test（卡方（Fisher精確）檢驗），相關內容見6.2節；而Row means with SD or SEM（帶SD或SEM的行平均值）在XY analyses、Column analyses、Grouped analyses下重復出現；Fraction of total（局部占總體比例）在Transform, Normalize和Parts of whole analyses下重復出現。

6. Survival analyses（生存表分析）

Survival（生存表）主要用于生存分析和生存曲線繪制，相關內容見第7章。

7. Parts of whole analyses（局部整體表分析）

Fraction of total（局部占總體比例）在Transform, Normalize和Contingency table analyses下重復出現。還有一種分析方法是Compare observed distribution with expected（比較觀察分布和期望分布），用來推斷兩個總體率或構成比之間有無差別，相關內容見8.1節。

8. Multiple variable analyses（多變量表分析）

Multiple variable（多變量表）是GraphPad Prism 8新增的數據表，每一列代表一個變量，每一行代表一個個體或一次試驗，常用于安置高級統計分析方法，如多元線性回歸（Multiple linear regression）、多元Logistic回歸（Multiple logistic regression）、泊松回歸（Poisson regression）及相關性矩陣計算（Correlation matrix）。多變量表統計分析方法如表2-2-4所示。

表2-2-4　多變量表統計分析方法

9. Nested analyses（嵌套表分析）

Nested（嵌套表）主要用于解決嵌套數據的統計分析和圖形繪制。因此，在該表中，數據格式和統計分析方法是配套專用的，其中同名的Descriptive statistics（描述性統計）等描述的都是子列的數據，所以表2-2-5里面的部分統計分析方法都加了“子列”二字以示區別。嵌套表適用于既有試驗重復又有技術重復的數據結構，可以同時判斷分組內部單元和分組之間是否存在統計學差異。

表2-2-5　嵌套表統計分析方法

10. Generate curve（生成曲線）

根據軟件內置的函數模型和自行指定的參數生成曲線，如圖2-2-5所示。

圖2-2-5　生成曲線

11. Simulate data（模擬數據）

可以根據要求模擬數據，如模擬XY表、縱列表、列聯表數據，主要用于研究軟件的使用和統計分析方法，如表2-2-6所示。

表2-2-6　模擬數據統計分析方法

官术网_书友最值得收藏!

GraphPad Prism學術圖表（全彩）

2.2 常見統計分析方法

2.2　常見統計分析方法