T 檢驗(yàn)即 student’s t test, 是統(tǒng)計(jì)學(xué)中常用的檢驗(yàn)方法之一,主要適用于小樣本量(n<30),總體標(biāo)準(zhǔn)差未知的正態(tài)分布。本期文章將會(huì)介紹T檢驗(yàn)的由來(lái), T檢驗(yàn)的分類以及在流式數(shù)據(jù)研究中的應(yīng)用。
T檢驗(yàn)的由來(lái)
1876年William Sealy Gosset 出生于英國(guó)坎特伯雷。他曾就讀于溫徹斯特學(xué)院,之后被牛津大學(xué)自然科學(xué)學(xué)院錄取。1899年從牛津畢業(yè)后加入了愛爾蘭都柏林的Arthur Guinness & Son啤酒廠參與研究工作。
圖 1 William Sealy Gosset舊照
在研究產(chǎn)酒量最優(yōu)的大麥品種時(shí),由于樣本量不足,不適合使用傳統(tǒng)的統(tǒng)計(jì)學(xué)方法(Z檢驗(yàn))。Gosset通過自學(xué),反復(fù)試驗(yàn),與他人合作以及在1906年至1970年在統(tǒng)計(jì)學(xué)泰斗Karl Pearson 的生化實(shí)驗(yàn)室進(jìn)修時(shí)得到了Pearson在數(shù)學(xué)推導(dǎo)上的指導(dǎo)與幫助,開發(fā)了新的統(tǒng)計(jì)學(xué)方法。但是酒廠老板因擔(dān)心該研究論文會(huì)泄露關(guān)于啤酒釀造的商業(yè)機(jī)密,不允許員工公開發(fā)表研究成果。經(jīng)過溝通,酒廠董事會(huì)允許使用筆名以及在不能提及啤酒和Guinness的前提下發(fā)表論文。最后Gosset使用student 為筆名在Pearson 主編的 journal Biometrika 上發(fā)表了這一研究。這就是student’s t test方法和名字的由來(lái)。
T檢驗(yàn)的分類
T檢驗(yàn)是用于衡量?jī)蓚€(gè)均值是否有顯著差異的統(tǒng)計(jì)量。那為什么不直接觀察兩個(gè)均值呢?因?yàn)橹苯颖容^均值只能看出數(shù)值上的差異,但是不能知道這個(gè)差異是否顯著或可靠。比如A和B擲骰子100次,分別得到52個(gè)正面和49個(gè)正面。這可以得出在將來(lái)A也比B更容易擲到骰子正面的結(jié)論嗎?顯然不能!實(shí)際上這兩個(gè)結(jié)果的差異并不顯著,這個(gè)結(jié)果可能是偶然事件。統(tǒng)計(jì)學(xué)分為描述統(tǒng)計(jì)和推斷統(tǒng)計(jì)。描述統(tǒng)計(jì)只能描述我們現(xiàn)有樣本的一個(gè)情況,比如說(shuō)樣本均值。但是不能告訴我們這個(gè)結(jié)果是否在將來(lái)會(huì)再次出現(xiàn)。相反,推斷統(tǒng)計(jì)學(xué)不僅僅對(duì)樣本進(jìn)行描述,它還可以將結(jié)果遞推到新樣本中。T test就是推斷統(tǒng)計(jì)學(xué)的方法之一。下面來(lái)看看它的三個(gè)分類:
1.單樣本均值檢驗(yàn)
當(dāng)我們只有一組數(shù)據(jù),并且我們想要將這組數(shù)據(jù)與一個(gè)假設(shè)檢驗(yàn)值對(duì)比或者將數(shù)據(jù)與已知的總體均值對(duì)比。計(jì)算公式如下:
圖 2 t臨界值表
上述例子中提到了雙邊假設(shè)。什么時(shí)候使用雙邊假設(shè)和單邊假設(shè)取決于研究問題。比如:
1.為研究某種治療兒童貧血新藥的療效,以常規(guī)藥作為對(duì)照,治療一段時(shí)間后,檢驗(yàn)施以新藥的兒童血紅蛋白的增加量是否比常規(guī)藥的大(單側(cè)檢驗(yàn))
2.檢驗(yàn)兩種藥物對(duì)治療高血壓的效果,檢驗(yàn)兩組藥物的降壓水平是否相等(雙側(cè)檢驗(yàn))
2.兩獨(dú)立樣本均值檢驗(yàn)(independent-samples t-test)
2.1.當(dāng)總體方差相等且未知,樣本方差滿足下述關(guān)系時(shí):
該檢驗(yàn)是最常用的T檢驗(yàn),目的是檢驗(yàn)兩獨(dú)立樣本的均值是否相等。 要求樣本獨(dú)立且近似正態(tài)分布。
比如:藥物研究員研發(fā)了一款新藥,希望該新藥可以降低膽固醇。于是進(jìn)行一項(xiàng)對(duì)照組研究,將志愿者分為兩組,一組給予新藥(Tetesterol),一組給予安慰劑(Control),如圖3。
圖 3 對(duì)照組實(shí)驗(yàn)
一個(gè)月后,研究員測(cè)量?jī)山M的膽固醇值。然后發(fā)現(xiàn)安慰劑組的膽固醇平均值為36,給藥組的膽固醇的平均值為34。從描述性統(tǒng)計(jì)量(均值) 看來(lái),兩組數(shù)據(jù)確有不同,但這個(gè)不同是偶然還是藥物確實(shí)起作用了?用推斷統(tǒng)計(jì)學(xué)方法(T test)會(huì)知道這個(gè)不同是否可靠或只是偶然。用圖4的公式計(jì)算得到t 值,查詢相應(yīng)的t檢驗(yàn)表,就可以得出相應(yīng)的結(jié)論。此處的自由度=兩組樣本量相加減2.
圖 4 兩獨(dú)立樣本T值計(jì)算
2.2.當(dāng)總體方差不相等時(shí),t值和自由度計(jì)算如下:
3.配對(duì)樣本均值檢驗(yàn)
該方法適用于檢驗(yàn)將同一組樣品測(cè)試兩次后的分析。這種情況常常出現(xiàn)在生物醫(yī)學(xué)研究中,常見的情形有:
配對(duì)的受試對(duì)象分別接受不同的處理(如將小白鼠配對(duì)為兩組,分別接受不同的處理,檢驗(yàn)處理結(jié)果的差異)
同一受試對(duì)象的兩個(gè)部分接受不同的處理(如對(duì)于一批血清樣本,將其分為兩個(gè)部分,利用不同的方法接受某種化合物的檢驗(yàn),檢驗(yàn)結(jié)果的差異)
同一受試對(duì)象的自身前后對(duì)照(如檢驗(yàn)癌癥患者術(shù)前、術(shù)后的某種指標(biāo)的差異)
該方法要求:數(shù)據(jù)總體方差相等且近似正態(tài)。目的是判斷不同的處理是否有差別。
計(jì)算公式如下:
其中為樣本中各配對(duì)差值的均值,為樣本中各配對(duì)差值的標(biāo)準(zhǔn)差,自由度為配對(duì)數(shù)減1。
舉個(gè)例子:
假設(shè)研究某種解毒藥對(duì)大白鼠血中膽堿酯酶含量的影響,將20只小白鼠按性別、體重、窩別配成對(duì)子。每對(duì)中隨機(jī)抽取一只服用解毒藥,另一只作為陰性對(duì)照,服用生理鹽水。經(jīng)過一定時(shí)間,測(cè)量大白鼠血中膽堿酯酶含量,數(shù)據(jù)如表1,求問大白鼠服用解讀藥和生理鹽水后血中膽堿酯酶含量有無(wú)不同?
Table 1配對(duì)小鼠實(shí)驗(yàn)數(shù)據(jù)
根據(jù)問題可知應(yīng)該選擇雙邊配對(duì)t檢驗(yàn),根據(jù)公式計(jì)算得到:
自由度為10-1=9。選取檢驗(yàn)水平為0.05(置信水平95%)查詢t臨界值表可知臨界值為2.262。因?yàn)?.620>2.262,所以認(rèn)為配對(duì)子之間的差異是顯著的。因此我們認(rèn)為:大白鼠服用解毒藥和生理鹽水后血中膽堿酯酶含量不同,服用解毒藥后大白鼠血中膽堿酯酶含量高于生理鹽水對(duì)照。(例子來(lái)源于流行病學(xué)與統(tǒng)計(jì)學(xué))
雖然t 檢驗(yàn)是強(qiáng)有力的統(tǒng)計(jì)工具之一,但是也有其局限性。T檢驗(yàn)的局限性包括:
1. 只能將從樣本得到的結(jié)果擴(kuò)大到同類目標(biāo)人群中。
2. 樣本和總體需要近似正態(tài)分布
3. 每組需要有一樣的數(shù)據(jù)量
4. 所有數(shù)據(jù)必須是獨(dú)立的
流式數(shù)據(jù)中的T檢驗(yàn)應(yīng)用
T檢驗(yàn)也在流式數(shù)據(jù)研究中被廣泛應(yīng)用。近期Cell Stem Cell上刊登了一篇關(guān)于“追蹤出生后骨形成過程中的骨骼組細(xì)胞的轉(zhuǎn)變”的文章。文章通過t檢驗(yàn)得到了“強(qiáng)迫跑步顯著增加圍產(chǎn)期軟骨細(xì)胞的成骨細(xì)胞形成,而對(duì)成年 Lepr+ BMSCs無(wú)明顯促成骨作用(圖5)”的結(jié)論。
圖5中:
(A)展示了AcancreER ;R26tdTomato; Col1a1-GFP 小鼠實(shí)驗(yàn)時(shí)間表。
(B-D) 將幼齡小鼠分為兩組強(qiáng)迫跑步組(C)和不跑步組(B),用流式細(xì)胞術(shù)分析每個(gè)組的AcancreER; R26tdTomato; Col1a1-GFP小鼠股骨的Col1a1 GFP+成骨細(xì)胞(Tomato+成骨細(xì)胞)的百分比。總共做5次獨(dú)立實(shí)驗(yàn),每種條件有5只小鼠。實(shí)驗(yàn)數(shù)據(jù)取每次實(shí)驗(yàn)的平均值± SD。然后使用雙邊T檢驗(yàn)評(píng)估兩組差異,最后得到的P值< 0.01,證明兩組小鼠跑步和不跑步的情況下成骨細(xì)胞有顯著差異。
(H-J) 用流式細(xì)胞術(shù)分析 成年小鼠跑步組(I)的Lepr-creER; R26tdTomato; Col1a1-GFP和不跑步組(H)股骨的Col1a1 GFP+成骨細(xì)胞(Tomato+成骨細(xì)胞)的百分比。同樣地,做5 次獨(dú)立實(shí)驗(yàn),每種條件下有 5 只小鼠實(shí)驗(yàn)數(shù)據(jù)取每次實(shí)驗(yàn)的平均值 ± SD。然后使用雙邊T檢驗(yàn)評(píng)估兩組差異,結(jié)果顯示兩者無(wú)顯著差異(J)。
文章中的其他實(shí)驗(yàn)還發(fā)現(xiàn)了,青春期以前的成骨細(xì)胞主要來(lái)源于Acan+軟骨細(xì)胞,而青春期以后的成骨細(xì)胞主要來(lái)源于Lepr+基質(zhì)細(xì)胞。他們分別參與維持了骨骼的增長(zhǎng)和增厚。加上上述的實(shí)驗(yàn)結(jié)果可以得出跑步對(duì)青春期的骨發(fā)育起到了明顯的促進(jìn)作用,但是對(duì)成年鼠沒有顯著幫助。
圖 5流式細(xì)胞分析結(jié)果
小結(jié):
T檢驗(yàn)是常用的統(tǒng)計(jì)學(xué)工具之一,有三種分類:?jiǎn)螛颖揪禉z驗(yàn),兩獨(dú)立樣本均值檢驗(yàn)和配對(duì)樣本均值檢驗(yàn)。在生物醫(yī)學(xué)領(lǐng)域最常用的是配對(duì)樣本均值檢驗(yàn)和兩獨(dú)立樣本均值檢驗(yàn)。每種分類的計(jì)算公式有區(qū)別,計(jì)算出t值,然后查詢T檢驗(yàn)臨界值表,若t值小于t臨界值則兩者的差異不顯著。反之兩者有顯著差異。
參考資料:
T Test (Students T Test) - Understanding the math and how it works - Machine Learning Plus
t-table.xls (sjsu.edu)
Student’s t-test | Definition, Formula, & Example | Britannica
Tracing the skeletal progenitor transition during postnatal bone formation: Cell Stem Cell
T檢驗(yàn) - MBA智庫(kù)百科 (mbalib.com)
一文詳解t檢驗(yàn) - 知乎 (zhihu.com)
流行病學(xué)與醫(yī)學(xué)統(tǒng)計(jì)學(xué)
骨生物學(xué)進(jìn)展:追蹤出生后骨形成過程中的骨骼祖細(xì)胞的轉(zhuǎn)變