司徒頓t檢定

司徒頓t 檢定（英語：Student's t-test）是指虛無假說成立時的任一檢定統計有司徒頓t分布的統計假說檢定，屬於母數統計。學生t檢驗常作為檢驗一群來自常態分配母體的獨立樣本之期望值是否為某一實數，或是二（兩）群來自常態分配母體的獨立樣本之期望值的差是否為某一實數。舉個簡單的例子，在某個學校中我們可以從某個年級中隨機抽樣一群男生，以檢驗該年級男生與全校男生之身高差異程度是否如我們所假設的某個值。

由來

司徒頓t檢定是威廉·戈塞為了觀測釀酒品質於1908年所提出的，「司徒頓 (student)」則是他的筆名。^[1]^[2]^[3]^[4] 基於克勞德·健力士（Claude Guinness）聘用從牛津大學和劍橋大學出來的最好的畢業生，^[2]以將生物化學及統計學應用到健力士工業流程的創新政策，戈塞受僱於都柏林的健力士釀酒廠擔任統計學家。戈塞提出了t檢驗以降低啤酒重量監控的成本。戈塞於1908年在《Biometrika（英語：Biometrika）》期刊上公布t檢驗，但因其老闆認為其為商業機密而被迫使用筆名，統計學論文內容也跟釀酒無關。實際上，其他統計學家是知道戈塞真實身份的。

應用

常見的應用有：

單樣本檢驗：檢驗一個正態分布的總體的均值是否在滿足零假設的值之內，例如檢驗一群軍校男生的身高的平均是否符合全國標準的170公分界線。
獨立樣本t檢定（雙樣本）：其零假設為兩個正態分布的總體的均值之差為某實數，例如檢定二群人之平均身高是否相等。若兩母體的變異數是相等的情況下（同質變異數），自由度為兩樣本數相加再減二；若為異質變異數（母體變異數不相等），自由度則為Welch自由度，此情況下有時被稱為Welch檢驗。
配對樣本t檢定（成對樣本t檢定）：檢定自同一母體抽出的成對樣本間差異是否為零。例如，檢測一位病人接受治療前和治療後的腫瘤尺寸大小。若治療是有效的，我們可以推定多數病人接受治療後，腫瘤尺寸將縮小。
檢驗一迴歸模型的偏迴歸係數是否顯著不為零，即檢定解釋變數X是否存在對被解釋變數Y的解釋能力，其檢定統計量稱之為t-比例（t-ratio）。

前提假設

大多數的t檢定之統計量具有t = Z/s的形式，其中Z與s是已知資料的函數。Z通常被設計成對於對立假說有關的形式，而s是一個比例母數使t服從於t分佈。以單樣本t檢驗為例， $Z={\bar {X}}/(\sigma /{\sqrt {n}})$ ，其中 ${\bar {X}}$ 為樣本平均數， $n$ 為樣本數， $\sigma$ 為總體標準差。至於s在單樣本t檢驗中為 ${\hat {\sigma }}/\sigma$ ，其中 ${\hat {\sigma }}$ 為樣本的標準差。在符合零假說的條件下，t檢定有以下前提：

Z 服從標準常態分佈
(n - 1)s² 服從自由度(n - 1)的卡方分佈
Z與s互相獨立

計算

單樣本t檢驗

檢驗虛無假說為一群來自常態分配獨立樣本x_i之母體期望值μ為μ₀可利用以下統計量

t={\frac {{\overline {x}}-\mu _{0}}{s/{\sqrt {n}}}}

其中 $i=1\ldots n$ ， ${\overline {x}}={\frac {\sum _{i=1}^{n}x_{i}}{n}}$ 為樣本平均數， $s={\sqrt {\frac {\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{2}}{n-1}}}$ 為樣本標準差，n為樣本數。該統計量t在虛無假說：μ = μ₀為真的條件下服從自由度為n − 1的t分佈。

配對樣本t檢驗

配對樣本t檢驗可視為單樣本t檢驗的擴展，不過檢驗的對象由一群來自常態分配獨立樣本更改為兩配對樣本之觀測值之差。

若兩配對樣本x_1i與x_2i之差為d_i = x_1i − x_2i獨立且來自常態分配，則d_i之母體期望值μ是否為μ₀可利用以下統計量

t={\frac {{\overline {d}}-\mu _{0}}{s_{d}/{\sqrt {n}}}}

其中 $i=1\ldots n$ ， ${\overline {d}}={\frac {\sum _{i=1}^{n}d_{i}}{n}}$ 為配對樣本差值之平均數， $s_{d}={\sqrt {\frac {\sum _{i=1}^{n}(d_{i}-{\overline {d}})^{2}}{n-1}}}$ 為配對樣本差值之標準差，n為配對樣本數。該統計量t在虛無假說：μ = μ₀為真的條件下服從自由度為n − 1的t分布。

獨立雙樣本t檢驗

同質變異數假設 (Homoscedasticity)、樣本數相等

若兩獨立樣本x_1i與x_2i具有相同之樣本數n，且來自兩個母體變異數相同（同質變異數假設）的常態分配，則兩母體之期望值差μ₁ - μ₂是否為μ₀可利用以下統計量

t={\frac {{\overline {x}}_{1}-{\overline {x}}_{2}-\mu _{0}}{\sqrt {2s_{p}^{2}/n}}}

其中 $i=1\ldots n$ ， ${\overline {x}}_{1}=(\sum _{i=1}^{n}x_{1i})/n$ 及 ${\overline {x}}_{2}=(\sum _{i=1}^{n}x_{2i})/n$ 為兩樣本各自的平均數， $s_{p}^{2}=(\sum _{i=1}^{n}(x_{1i}-{\overline {x}}_{1})^{2}+\sum _{i=1}^{n}(x_{2i}-{\overline {x}}_{2})^{2})/(2n-2)$ 為樣本之共同方差。該統計量t在虛無假說：μ₁ - μ₂ = μ₀為真的條件下服從自由度為2n − 2的t分佈。

同質變異數假設 (Homoscedasticity)、樣本數不相等

若兩獨立樣本x_1i與x_2j具有不相同之樣本數n₁與n₂，且來自兩個母體變異數相同（同質變異數假設）的常態分配，則兩母體之期望值之差μ₁ - μ₂是否為μ₀可利用以下統計量

t={\frac {{\overline {x}}_{1}-{\overline {x}}_{2}-\mu _{0}}{\sqrt {s_{p}^{2}/n_{1}+s_{p}^{2}/n_{2}}}}

其中 $i=1\ldots n_{1}$ ，其中 $j=1\ldots n_{2}$ ， ${\overline {x}}_{1}=(\sum _{i=1}^{n}x_{1i})/n$ 及 ${\overline {x}}_{2}=(\sum _{i=1}^{n}x_{2i})/n$ 為兩樣本各自的平均數， $s_{p}^{2}=(\sum _{i=1}^{n}(x_{1i}-{\overline {x}}_{1})^{2}+\sum _{j=1}^{n}(x_{2j}-{\overline {x}}_{2})^{2})/(n_{1}+n_{2}-2)$ 為兩樣本共同之方差。該統計量t在虛無假說：μ₁ - μ₂ = μ₀為真的條件下服從自由度為n₁ + n₂ − 2的t分佈。

異質變異數假設 (Heteroscedasticity)

若兩獨立樣本x_1i與x_2j具有相同或不相同之樣本數n₁與n₂，且兩者母體變異數不相等（異質變異數假設）的常態分配，則兩母體之期望值之差μ₁ - μ₂是否為μ₀可利用以下統計量

t={\frac {{\overline {x}}_{1}-{\overline {x}}_{2}-\mu _{0}}{\sqrt {s_{1}^{2}/n_{1}+s_{2}^{2}/n_{2}}}}

其中 $i=1\ldots n_{1}$ ，其中 $j=1\ldots n_{2}$ ， ${\overline {x}}_{1}=(\sum _{i=1}^{n_{1}}x_{1i})/n_{1}$ 及 ${\overline {x}}_{2}=(\sum _{j=1}^{n_{2}}x_{2j})/n$ 為兩樣本各自的平均數， $s_{1}^{2}=(\sum _{i=1}^{n}(x_{1i}-{\overline {x}}_{1})^{2})/(n_{1}-1)$ 及 $s_{2}^{2}=(\sum _{j=1}^{n}(x_{2j}-{\overline {x}}_{2})^{2})/(n_{2}-1)$ 分別為兩樣本之方差。該統計量t在虛無假說：μ₁ - μ₂ = μ₀為真的條件下服從自由度為

df={\frac {(s_{1}^{2}/n_{1}+s_{2}^{2}/n_{2})^{2}}{(s_{1}^{2}/n_{1})^{2}/(n_{1}-1)+(s_{2}^{2}/n_{2})^{2}/(n_{2}-1)}}

之t分布。這種方法又常稱為Welch檢驗。

其它相關檢驗

偏迴歸係數是否為零之檢定

以簡單線性迴歸為例

模型假設：

y_{i}=\alpha +\beta x_{i}+\varepsilon _{i},

其中x_i，i = 1, ..., n為已知，α與β為未知係數，ε_i為殘差獨立且服從期望值0且方差σ²未知的常態分佈，y_i，i = 1, ..., n為觀測值。我們可以檢驗迴歸係數β是否相等於特定的β₀，通常使β₀ = 0以檢定x_i對y_i是否存在解釋能力，在此例（簡單線性迴歸模型）即為檢定迴歸式之斜率是否為零。

令 ${\widehat {\alpha }}$ 與 ${\widehat {\beta }}$ 為最小平方法之估計值， $SE_{\widehat {\alpha }}$ 與 $SE_{\widehat {\beta }}$ 為最小平方法估計值之標準誤差，則

t={\frac {{\widehat {\beta }}-\beta _{0}}{SE_{\widehat {\beta }}}}\sim {\mathcal {T}}_{n-2}

在虛無假說為β = β₀的情況下服從自由度為n − 2之t分布，此檢定統計量被稱作「t比率 (t-ratio)」，其中

SE_{\widehat {\beta }}={\frac {\sqrt {{\frac {1}{n-2}}\sum _{i=1}^{n}(y_{i}-{\widehat {y}}_{i})^{2}}}{\sqrt {\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{2}}}}

由於 ${\widehat {\varepsilon }}_{i}=y_{i}-{\widehat {y}}_{i}=y_{i}-({\widehat {\alpha }}+{\widehat {\beta }}x_{i})$ 為殘差（即估計誤差），而 ${\text{SSR}}=\sum _{i=1}^{n}{\widehat {\varepsilon }}_{i}^{\;2}$ 為殘差之離均平方和，我們可改寫t為

t={\frac {({\widehat {\beta }}-\beta _{0}){\sqrt {n-2}}}{\sqrt {{\text{SSR}}/\sum _{i=1}^{n}\left(x_{i}-{\overline {x}}\right)^{2}}}}

另請參閱：F檢驗

電腦軟體

大多數的試算表軟體及統計軟體，諸如QtiPlot、OpenOffice.org Calc、LibreOffice Calc、Microsoft Excel、SAS、SPSS、Stata、DAP、gretl、R、Python ([1]（頁面存檔備份，存於網際網路檔案館）)、PSPP、Minitab等，都可以進行t檢驗運算。

編程語言/軟件程序	函數	注釋
Microsoft Excel 2010 之前的版本	`TTEST(array1, array2, tails, type)`	參見 [2]
Microsoft Excel 2010 及更高版本	`T.TEST(array1, array2, tails, type)`	參見 [3]（頁面存檔備份，存於網際網路檔案館）
LibreOffice	`TTEST(Data1; Data2; Mode; Type)`	參見 [4]（頁面存檔備份，存於網際網路檔案館）
Google Sheets	`TTEST(range1, range2, tails, type)`	參見 [5]（頁面存檔備份，存於網際網路檔案館）
Python	`scipy.stats.ttest_ind(a, b, axis=0, equal_var=True)`	參見 [6]（頁面存檔備份，存於網際網路檔案館）
Matlab	`ttest(data1, data2)`	參見 [7]（頁面存檔備份，存於網際網路檔案館）
Mathematica	`TTest[{data1,data2}]`	參見 [8]（頁面存檔備份，存於網際網路檔案館）
R	`t.test(data1, data2)`
SAS	`PROC TTEST`	參見 [9]
Java	`tTest(sample1, sample2)`	參見 [10]（頁面存檔備份，存於網際網路檔案館）
Julia	`EqualVarianceTTest(sample1, sample2)`	參見 [11]
Stata	`ttest data1 == data2`	See [12]（頁面存檔備份，存於網際網路檔案館）

參見

參考文獻

^ Richard Mankiewicz, The Story of Mathematics (Princeton University Press), p.158.
^ ^2.0 ^2.1 約翰·J·奧康納; 埃德蒙·F·羅伯遜, Gosset, MacTutor數學史檔案（英語）
^ Fisher Box, Joan. Guinness, Gosset, Fisher, and Small Samples. Statistical Science. 1987, 2 (1): 45–52. JSTOR 2245613. doi:10.1214/ss/1177013437.
^ 存档副本 (PDF). [2013-08-10]. （原始內容 (PDF)存檔於2017-05-16）.

[1] Richard Mankiewicz, The Story of Mathematics (Princeton University Press), p.158.

[Gossett-2] 2.0 ^2.1 約翰·J·奧康納; 埃德蒙·F·羅伯遜, Gosset, MacTutor數學史檔案（英語）

[3] Fisher Box, Joan. Guinness, Gosset, Fisher, and Small Samples. Statistical Science. 1987, 2 (1): 45–52. JSTOR 2245613. doi:10.1214/ss/1177013437.

[4] 存档副本 (PDF). [2013-08-10]. （原始內容 (PDF)存檔於2017-05-16）.

[1]

[2]

[3]

[4]