TEL:04-22078539 本中心網址:http://www2.cmu.edu.tw/~biostat/

 

過去演講回顧
演講預告
生物統計中心96學年度第 1學期第 5 次行政(校務)工作報告
 
生統小教學
 第十一章   兩組平均數的比較
 第十二章  單因子變異數分析(One-Way ANOVA)
 第十三章  無母數檢定(Nonparametric Methods)

 

過去演講回顧
2007/11/07
陳章榮博士 (美國食品藥物管理局國家毒理研究中心)
Ensemble Classifiers and Their Applications

      

2007/11/22

生物統計日-Biostatistics in Clinical and Genetic Studies

王淑貞 博士 美國食品藥物管理局藥物評估研究中心

A Two-Stage Adaptive Design in Randomized Controlled Trials Addressing Individualization of Medical Treatments


 
        
 

熊昭 博士 國家衛生研究院生物統計與生物資訊研究組

Tools for Microarray Analyses on Array CGH and Gene Expression Time Course Data


 
        
 

吳芳鴦 博士 中國醫藥大學公衛系/環醫所

Associations among Genetic Susceptibility, DNA Damage, and Pregnancy Outcomes of Expectant Mothers Exposed to Environmental Tobacco Smoke


 
        
 

宋賢穎 博士 中國醫藥大學癌症生物學研究所

Analysis of Reciprocal Interaction between Prostate Cancer and Bone Microenvironment: Translation into the Clinic


 
        
 

戴政 博士 台灣大學公共衛生學院

Development of Statistical Methods for Genetic Linkage Analysis from the Aspect of Information Mining


 
        
 

TOP


演講預告

2007/12/12
曾雲輝 博士(中央研究院 基因體研究中心)
Introduction to Statistical Methods in Molecular Evolutionary Distance

2007/12/19
林文元 醫師 (中國醫藥大學附設醫院 家庭醫學科)
Metabolic Syndrome in Taichung Health Community Study

TOP


生物統計中心96學年度第 1學期第 5 次行政(校務)工作報告

『詳細工作報告,請見生統中心網頁

一、生統中心及成員簡介:

生物統計中心(簡稱生統中心)於958月成立,中心主要任務為

(一)負責本校所有統計相關課程之規劃及教學。

(二)接受校內相關系所之教師及研究人員有關統計分析方法在理論及應用方面的諮詢及協助和其他服務與推廣。

(三)提升生物統計相關之學術研究發展。

 

中心成員目前有

(一)全職老師7名(和公衛系、環醫所或中醫所合聘。教授3名、副教授2名和助理教授2名)。

(二)合聘教師1名(美國食品藥物管理局國家毒理研究中心研究人員)。

(三)兼任老師1名(中興大學副教授)。

(四)約聘人員1名、專案助理1名、國科會博士後研究員1名及國科會助理3名。

生統中心老師的專長,包括生物統計、流行病學、傳染病建模分析、實驗設計等。

 

二、服務及推廣:

(一)諮詢服務:

生統中心目前服務對象主要為:校內老師及附設醫院醫師及研究人員、回答學生所提出的統計問題和軟體操作所遇到的困難。

1、諮詢老師排班狀況:除了星期三下午時段外(學術講演時間),生統中心每天上午和下午時段都有安排固定1~2位老師值班,接受學校或醫院方面統計的諮詢。

2、成果:諮詢的個案,可分為兩種「統計諮詢」和「校內單位學術交流互訪」。

「統計諮詢」除了包括詢問統計相關問題,也包含協助分析資料和討論其結果。「校內單位學術交流互訪」為與生統中心長期合作之校內單位,目前合作的單位為附設醫院外傷中心、中醫部、腎臟科、癌症中心等。

959月至9610月而言總諮詢人次為821人次,其中「諮詢」的為490人次,「互訪」為331人次。諮詢人員來源,有251人次來自於學校系所,564人次來自於附設醫院。校外亦有,但沒有統計。

(二)推廣教育—種子教師訓練課程:

本中心配合教學卓越計畫於959月開始第一次生物統計種子教師的課程,目前已進行24次。課程著重在統計於醫學上的應用,利用來本中心諮詢的案例經諮詢者同意後作為上課的主題。

96學年度的種子訓練課程中,我們配合基礎生物統計配合SAS統計軟體推出生物統計諮詢師及種子教師訓練,並配合統計軟體實務應用上推出SPSS軟體操作教材。

(三)推廣教育—生統e報:生統中心每月份都有發行一份固定的電子報,至9611月為止,本中心已經發行15期電子報。

(四)推廣教育—R-Project軟體教學(計劃中):我們預計於972月舉辦一系列訓練課程,讓更多有興趣的校內外人士有機會學習使用這套軟體。

(五)推廣教育—SAS合作案(計劃中):中心已於969月和台灣SAS公司討論合作的可能性,合作的內容可能包括共同開出系列的SAS教學課程和SAS軟體使用的認證等。

(六)學術講演或研討會:

1、中心老師對外講演或研討會:9596年,本中心教師曾前往美國、加拿大、葡萄牙、韓國、新加坡等國家,以及國內大專院校,參與學術演講活動,其概況簡述如下:國內外研討會海報共15篇,口頭報告共24場;校外學術演講共28場,校內學術演講共6場。

2、外來講者:95/8~96/11期間,總計舉辦25場演講、2次生物統計日研討會及4次國外學者來訪。

(七)學術服務:學術服務在此分為包含專書著作(book chapter)、期刊審編(reviewers, associate editors)以及學會擔任職務三大部分。

1、本中心老師近兩年共有3篇專書著作(book chapter);

2、本中心老師近兩年擔任期刊編輯委員共3本期刊(SCI期刊1),擔任副編輯共3本期刊(SCI期刊2),擔任審查委員共27本期刊(SCI期刊23)

 

三、研究:

中心的主要研究方向有三個方向,「生物統計(biostatistics)」、「生物資訊(bioinformatics)」及「生物數學(biomathematics)」。

(一)中心老師現有計畫案狀況:

本中心老師近兩年所執行之研究計畫共有24(主持人15件、共同主持人9),包括國科會15(主持人9件、共同主持人6)、衛生署2(主持人、共同主持人各1)、校內與附設醫院7件,其研究經費共23,095,275

(二)推動整合型計畫:

中心與校內或附設醫院推動整合型計畫,目前的計畫案主要有下列:

1、腎臟中心:每2週與附設醫院腎臟中心成員討論研究成果和進度,現行方向為分析腎臟醫學全台灣腎臟病患資料,比較腹膜透析和血液透析對病人存活率的影響。

2、外傷中心:利用國家衛生研究院民國93年「全民健康保險研究資料庫」之重大傷病證明明細檔、外傷門診處方及治療明細檔與住院醫療費用清單明細檔為資料來源。旨在探討目前因事故傷害就醫的病患其人口學特徵、受傷型態、嚴重度、受傷機轉、住院日、住院花費與預後結果間之關聯性,並分析此研究族群中重大傷病個案之人口學特徵、受傷型態、嚴重度、受傷機轉與預後結果間之相關性,以及重大傷病個案之存活分析等。

3、癌症臨床資訊(clinical infometrics)測量計畫:目的在整合現代心理測量及先進的資訊技術,建立國內首創網路化資訊系統平台及臨床決策系統,測量病人自己報告的結果( patient - reported outcomes)並給予即時性的臨床決策,以強化醫療結果研究的價值並提升癌症病人照護的品質。

4、統計及數學建模探索傳染病流行整合型計畫:主要目標為使用生物統計和數學模型建立流行性感冒傳染模式,找出可能導致死亡個案發生的原因。目前此整合型計畫已準備就緒要向國科會申請三年研究補助。

(三)學術成果:

近兩年來(95-96),本中心教師所著述或合著之期刊論文合計80篇,包含SCI論文63(其中34篇研究單位中國醫藥大學)SSCI論文3(其中1篇研究單位中國醫藥大學)、其他論文共14篇。近年來本中心老師曾以第一作者或通訊作者身份,發表原始著述論文於American Journal of Human Genetics (IF=12.63), American Journal of Respiratory and Critical Care Medicine (IF=9.09), Emerging Infectious Diseases (IF=5.09), Bioinformatics (IF=4.89)等國際知名期刊(IFJCR 2006版本計算)

 

四、教學

(一)課程整合

生物統計目前已成為醫學、護理、公衛及其他健康相關科系所之學生必備的基礎能力,本校各系所均有此需求。為了提高整體的教學品質,提高學生學習興趣與競爭力,統籌規劃全校生物統計學課程,已成為迫切且可預見成效的方案。目前規劃設計一系列標準的課程,打破系所選課界線,推動統一會考,以提升生物統計的教學與本校學生在生統方面的素養。

(二)創意教材

生物統計學一直都是令同學感到恐懼的科目,本教材創作的目標是希望能發展一份讓同學想讀不覺得有距離的教材。因此,在本中心發展課程的目標及教學卓越計畫下,預計在本學年能在各位老師的合作下完成一份生動創意的統計入門教材。

 

五、未來計畫

(一)推動整合型計畫:例如國科會有關傳染病流行之整合型重點計劃。

(二)推動國內外學術合作關係:例如和SAS合作、推動R軟體、和國外學者研究合作、統計諮詢工作延伸到校外等。

(三)發展Bioinformatics領域。

TOP


生統小教學(download)

統計分析師 葉懿諄

第十一章   兩組平均數的比較

在前一個的單元中,我們利用假說檢定來比較單一樣本的平均數是否等於某一個已知的定值μ0。然而,在實際的應用上,比較兩個不同母群體平均數是否相同是較常見的,通常這兩個組別接受不同的治療或暴露。

如同前一個單元,首先,我們需要建立假說。然後,我們可以計算在虛無假設為真的情況下,會獲得一對樣本平均數如觀察平均數(observation mean)一樣差異或更極端差異的機率。如果所得的這個機率值很小,我們可以拒絕虛無假說並下結論說兩個母群體的平均數有顯著的差異。如同前一章,我們必須先設定顯著水準α值,並決定是單尾或雙尾的檢定。分析方法的形式決定於兩組觀察資料性質,因此分析之前我們需先確認觀察資料是配對樣本或是獨立樣本。

 

11.1 配對樣本

配對樣本的重要特性為第一個樣本中的觀察值在第二個樣本中有相對應的數值。自我配對(self-paring)的設計是同一個受測者在不同時間點的測量值。自我配對常見的例子為實驗「前與後」的設計,針對每一個受測者在治療前測量一次,並在治療後再測量一次。另一種配對的類型為研究者針對重要的特質如年齡或性別,在第一個族群中某一個體配對選出第二個族群中的個體,這些配對的特質通常是年齡或性別。

配對通常被用來控制外來的變異,以避免影響比較的結果。假如測量值來自同一個受測者而非兩個不同的受測者就可以排除掉某些生物的變異。因此,配對的用意是作更精確的比較。

研究問題

研究者欲瞭解在1980年及1986年這兩年度美國各州及首府,每千人社區醫院的病床數是否相同。因為都是同一個州在不同年度中的資料,所以我們利用配對樣本t檢定。此分析不把兩組的觀察值當作個別的樣本,而著重在每一對觀測值在測量上的差異量(d),將每對觀察值的差距當作新的變數資料,所以資料分析的方式又轉變為單一樣本的問題(與前一章介紹的單一樣本t檢定相同)。

在配對樣本t檢定中,我們著重在了解兩個年度每千人病床數相減的差異量(d),並針對差異量是否為零進行檢定。假設δ為兩個母群體平均數真正的差異,我們想要瞭解這兩個母群體平均數是否相等,所建立的虛無與對立假說如下:

設定檢定的顯著水準為0.05(α=0.05)及進行雙尾檢定。

SAS範例分析結果之報表

上表為配對樣本t檢定的結果,此檢定的p值為0.0001,小於原設定的顯著水準0.05,所以此檢定顯示此差異量達到統計上顯著的意義,亦即推翻這兩年度每千人病床數相同的虛無假說,此方法係以假說檢定(hypothesis testing)的方式進行推論。此外,結果中可以看出差異量的平均數為0.451床,此差異值95%信賴區間為0.2888 - 0.6132,此區間不包括0,所以從此區間亦可以推論拒絕虛無假說,此方法係以區間估計(interval estimation)來進行推論。由以上配對樣本t檢定的結果中顯示1980年較1986年的每千人病床數平均多0.451床,且有統計上顯著的差異。

 

11.2 獨立樣本

假設兩個母群體獨立,且服從常態分布,則我們可以利用獨立樣本t檢定評估兩組的平均數是否相同。

研究問題

我們想要評估男性與女性低出生體重新生兒的收縮壓是否相同。若兩個母群體為獨立且服從常態分布。假設男性之收縮壓為μ1,而女性之收縮壓μ2,針對我們感興趣的研究問題建立假設:

 or

 or

 

設定顯著水準為0.05並進行雙尾檢定。

 

從平均數為μ1,標準差為σ1的常態分布中抽出樣本數為n1的樣本。這個樣本的平均數以表示,其標準差以s1表示。同樣地,我們從平均數為μ2,標準差為σ2的常態分布隨機抽樣,抽出樣本數為n2的樣本。

 

 

Group 1

Group 2

Population

Mean

μ1

μ2

 

Standard Deviation

σ1

σ2

Sample

Mean

 

Standard Deviation

s1

s2

 

Sample size

n1

n2

 

進行獨立樣本t檢定之前,我們需要先檢定兩組的變異數是否相同,以決定應該採用哪一種方法進行分析。接下來,我們針對變異數相同與變異數不相同的t檢定分別進行介紹:

 

(1)    變異數相同

當我們處理來自兩個獨立母群體的樣本,根據中央極限定理的延展告訴我們樣本平均數的差異量會趨近於平均數為並且標準差為。由於我們假設母群體的變異數是相同的,因此我們利用來代替,且因為未知,故我們利用以下的統計量:

為共同變異數的估計值。在虛無假設下,母群體的平均數是相同的,亦即等於0,並且t統計量將會服從自由度為(n1-1)+ (n2-1)= n1+ n2-2t分布。

共同的變異數(pooled estimate of common variance, ),可以利用兩種方式來計算。假如我們有所有樣本的觀察值,可以利用以下的公式:

假如我們只有標準差,則必須使用以下公式:

從利用標準差來計算的公式中,可以發現其實就是變異數的加權平均,這裡的加權是根據每一個變異數所相對應的自由度。假如n1n2相同,就只是簡單的算數平均,不然,將是較大樣本的變異數得到較多的加權。

 

(2)    變異數不相同

當兩個族群的變異數不相同時,我們就分別以替代,以替代t檢定使用的統計量公式為

當變異數不相同時,不像變異數相同時的t分布會服從一個明確的自由度。因此,必須使用一個近似的值。可以利用以下的公式來計算:

針對所得的數值取一個最接近的整數。在虛無假設下,我們可以假設t分布會服從於一個自由度為vt分布。利用此自由度就可以求得t分布的臨界值,並與此組樣本的t統計量做比較,以決定我們是否拒絕虛無假設。

接下來我們以先前所介紹的例子,男性與女性低出生體重新生兒的收縮壓是否相同為例,進行獨立樣本t檢定。

SAS範例分析結果之報表

以上為利用SAS進行獨立樣本t檢定的輸出結果。在作t檢定前應先瞭解兩組變異數是否相同。在上面輸出結果中Equality of Variance變異數是否相同的檢定的部分,p值為0.68,大於0.05無法拒絕虛無假設(兩個變異數相同),故我們應採用變異數相同的t檢定結果,其結果顯示新生兒中男性及女性的舒張壓並沒有統計上顯著的不同(p=0.54)

 

根據變異數檢定的結果,我們利用變異數相同的t檢定公式,其計算如下:

(1)    變異數相同:

,

自由度為98t分布,當()1.984時兩邊的尾端機率為0.05(=0.025*2),而在本檢定的統計量-0.61(<1.984),無法推翻虛無假設(從SAS輸出的p值為0.545,與我們利用查表所得的結果相同)。


TOP

 

第十二章  單因子變異數分析(One-Way ANOVA)

在前一章中,我們探討兩個獨立母群體的平均數是否相同所使用的方法。然而,當我們想要比較超過2組以上的平均數是否相同時,這就不恰當了。應該利用變異數分析,一種獨立樣本t檢定的延展,來比較三組或三組以上平均數。

 

研究問題

在一個多中心的研究(John Hopkins醫學大學、Rancho Los Amigos醫學中心及St. Louis醫學大學)中,研究者欲調查患有冠狀動脈疾病的人暴露於一氧化碳對肺功能的影響。在將所有資料合併一起分析之前,研究者必須先確定在不同中心間所測得肺功能中的 FEV1 (Forced Expiratory Volume in 1 second)指標是否相同。假設這3所醫學中心的FEV1指標平均分別為μ1μ2μ3,據此建立虛無假說如下:

對立假說為任一組的平均數不相同。

一般而言,我們感興趣的為k組母群體的平均數。假設k個母群體是獨立且服從常態分布。從平均數為μ1標準差為σ1的常態分布中抽出樣本數為n1的樣本。這個樣本的平均數以表示,其標準差為s1。同樣地,我們可以從平均數為μ2標準差為σ2的常態分布中抽出樣本數為n2的樣本。這個樣本的平均數以表示,其標準差為s2其他依此類推。每一組的樣本觀察值的個數可不相同。

 

12.1  三個醫學中心之冠狀動脈疾病患者的FEV1指標

John Hopkins

Rancho Los Amigos

St. Louis

n1 =21

n2 =16

n3 =23

=2.63

=3.03

=2.88

s1 =0.496

s2 =0.523

s3 =0.498

 

當面對這種資料時,可能會想要以獨立樣本t檢定兩兩成對來比較這3個母群體的平均數是否相同。在此例中我們要比較3組的平均數,所以我們可以將其分為,第一組與第二組,第一組與第三組,第二組與第三組。我們假設這三組的變異數是相同()。變異數的共同估計值,,結合這3組樣本的訊息,公式如下:

,這個公式是的延展。

利用以上的方法首先會面臨的問題,是這樣的過程會導致錯誤的結論。我們假設這些檢定是獨立的且顯著水準為0.05。因此,根據乘法法則,P(3個檢定皆失敗拒絕) = (1-0.05)3 = 0.953 = 0.857,而在這3個檢定中正確作結論的機率為0.857。當虛無假設為真,拒絕虛無假設的機率為0.143。這個數值也是所有檢定會犯型I誤差的機會。由此可見,整體檢定犯型I誤差的機會大於0.05。假如我們想要使整體檢定的型I誤差等於之前設定的α值,可以利用單因子變異數分析(One-Way Analysis of Variance, ANOVA)

 

變異的來源

變異數分析程序的過程依賴於變異程度或分散程度的估計值。單因子所指的為單一因子或特徵用以區分不同的族群,在本例中不同的醫學中心為區分的因子,區分這3個醫學中心之間所測得的FEV1是否相同。當我們處理幾個有相同變異數的母群體時,可以計算兩個變異的測量值:一為個別觀察值與母群體平均數的變異量,另一個為個別母群體平均數與總平均數的變異量。假如k個不同母群體內的變異量相對小於不同母群體平均數間的變異量,表示不同母群體平均數是有差異的。

檢定的虛無假說:

我們首先需要計算個別觀察值與其母群體平均數間的變異量。假設樣本數為,則共同變異數的估計值為

,這個值為這k個樣本變異數的加權平均數。下標的W表示組間(Within-Group)變異。

接下來這個估計值是用以表示族群平均數與總平均數間的變異程度。在虛無假設為真且平均數都相同的情形下,預期變異量應該會等同個別母群體的變異量,因此這個值也可以用來估計共同變異數,其估計式為:

表示樣本平均數與總平均數(Grand Mean)差距的平方。總平均數被定義為來自k個不同樣本中所有觀察值n的總平均數,其估計式為:

,下標B表示組間(Between-Groups)變異。

    當我們有這兩個不同變異數的估計值時,可能會想要回答以下的問題:樣本平均數與總平均數間的變異()是否較觀察值與個別平均數間的變異()大?假如>,表示相對應的母群體平均數實際上是不相等的。為了檢定母群體平均數相同的虛無假設,我們可以使用以下的統計量:

在虛無假設為真的情形下,都是共同變異數的估計值,並且F統計量將會趨近1。假如組間變異大於組內變異且F統計量大於1,表示不同母群體之間有差異。在虛無假設為真的情形下,F統計量將會服從自由度為k-1n-kF分布,分別為分子及分母自由度。我們利用符號,或來表示此分布。假如我們只有兩個獨立的樣本,F檢定可簡化為獨立樣本t檢定。

接下來我們以先前介紹,比較三個中心所測量的FEV1值為例,以SAS統計軟體進行單因子變異數分析。

SAS範例分析結果之報表

以上為利用SAS進行ANOVA檢定的輸出結果,檢定結果無法拒絕虛無假設,亦即不同3個中心之間所測得肺功能中的FEV1指標是相同的。以上的結果可以利用以下公式計算得到。

此統計量服從分子自由度為2,分母自由度為57F分布。

 

事後多重比較

假如利用單因子變異數分析的結果顯著,拒絕k組母群體平均數相同的虛無假設。這時我們可以推論這k組母群體平均數不都相同,但是到底哪幾組之間有差異?是全部母群體平均數都有差異,還是只有少數幾組有差異。因此,一旦我們拒絕虛無假設,我們常常需要另外做檢定,以找出差異在哪裡。

有許多不同的方法可以做事後多重比較,在事後檢定中常是分別針對每個配對作比較。就如之前我們所提的獨立樣本t檢定,可以分成組來做檢定。然而,就如我們之前所提過的,利用這種方法會造成檢定的型I誤差增加。藉由降低個別檢定時的顯著水準(α)使得個別檢定較保守,以避免這個問題,這確保整體檢定的顯著性為我們先前所設定的。舉例來說,假如我們設定整體的顯著水準為0.05,在每個個別的檢定中我們應利用,做為個別比較的顯著水準,這種修正又稱作Bonferroni校正。在虛無假設下,每個tij檢定將會服從自由度為n-kt分布。

SAS範例分析結果之報表

 

基本上,當單因子變異數分析沒有達到統計上顯著意義時,並不需要做事後多重比較。從以上Bonferroni校正所得兩兩檢定的結果,與ANOVA的結果相同,這3個醫學中心所測得的FEV1都沒有統計上顯著意義。

TOP

 

第十三章  無母數檢定(Nonparametric Methods)

在前幾個章節中介紹的統計方法都假設樣本來自某些特定分布的母群體,例如:常態分布,並且估計方法及假說檢定都以這些假設為基礎。此過程稱為有母數統計方法(Parametric method),因為分布的母數(Parameter)都假設已知。假如資料分布不符合上述假設,這種情形下可以使用無母數統計分析法(Nonparametric method),此方法對於分布的假設限制較少。

 

13.1 符號檢定(Sign Test)

符號檢定是用來比較兩組樣本觀察值,這些樣本來自彼此不是獨立的母群體,符號檢定與配對t檢定是相似的,並不是檢定兩個獨立母群體,而是將重點放在每一對樣本的差異量,且不要求差異量的母群體分布必須為常態分布。符號檢定是用來評估兩組非獨立母群體差異量的中位數是否為0

 

研究問題

欲瞭解患有纖維囊腫的人休息能量消耗量,利用年齡,性別,身高及體重配對找出的健康對照組,比較兩組人在休息能量消耗量是否相同。然而,我們無法假設此兩組人的休息能量消耗量服從常態分布。所以我們利用符號檢定來評估。一個雙尾檢定,其虛無假設為兩組差異量的中位數為0,而對立假設為兩組差異量的中位數不為0

符號檢定中,首先計算兩組配對樣本的差異量。假如差異量大於0,則給號;差異量小於0,則給號;假如差異量為0,則不給予任何符號(因為沒有提供任何訊息,所以排除在此檢定外,亦即需要將這些樣本個數從樣本中扣除)。

13.1 纖維囊腫及配對健康對照之休息能量消耗量

pair

CF

Healthy

Difference

Sign

1

1153

996

157

2

1132

1080

52

3

1165

1182

-17

4

1460

1452

8

5

1634

1162

472

6

1493

1619

-126

7

1358

1140

218

8

1453

1123

330

9

1185

1113

72

10

1824

1463

361

11

1793

1632

161

12

1930

1614

316

13

2075

1836

239

在虛無假設為真的情形下,配對樣本差異量的中位數應為0,故預期正及負號的個數應當相同。也就是正號的機率應為1/2,且負號的機率也應為1/2。假如我們將正號視為成功事件,而n個正號及負號可以當作一個成功機率為0.5的白努力隨機變數的結果。正號的總個數(D來表示)是母數為np的二項式隨機變數。因此,當樣本數為n時,正號的平均數為,標準差為

 

    利用以下的統計量來評估虛無假設,

假如虛無假設為真且樣本數很大,則會趨近於平均數為0、標準差為1的常態分布。此種檢定方法就稱為符號檢定,因此檢定決定於計算差異量的正負號個數,而非實際的量。

 

13.2 Wilcoxon符號等級檢定(Wilcoxon Signed-Rank Test)

雖然符號檢定不需要假設差異量的分布,檢定只利用正負號的個數,忽略了原始資料中所提供的資訊,因此在實際的應用上符號檢定不常被使用;反而是Wilcoxon符號等級檢定較常應用於比較兩組不是獨立母群體的樣本。此檢定不需要假設母群體為常態分布,但它卻考慮了差異量的大小與符號。Wilcoxon符號等級檢定常用來檢定配對母群體差異量的中位數是否為0

研究問題

研究問題同上,欲比較有纖維囊腫的人與健康對照組在休息能量消耗量是否相同。

為了進行Wilcoxon符號等級檢定,必須進行以下的步驟:

1)      首先,我們需要隨機篩選出配對的樣本,如表13.1

2)      接下來,計算這些配對觀察值的差異量。先忽略其差異量的正負號,取絕對值從最小到最大排名給予等級。假如差異量為0,則不進行排名,並將此樣本從分析中刪除,所以也必須在樣本數中減去刪除的樣本數。假如差異量相同時,則取排序順位的平均數。

3)      將原差異量的符號(正、負號)加到排名等級中。例如:第3個差異量的等級為2,而原差異值的符號為負,故此觀察值的符號等級為-2


 

13.2 纖維囊腫及配對健康對照之休息能量消耗量(2)

pair

CF

Healthy

Difference

Sign

Rank

Signed-Rank

4

1460

1452

8

1

1

 

3

1165

1182

-17

2

 

-2

2

1132

1080

52

3

3

 

9

1185

1113

72

4

4

 

6

1493

1619

-126

5

 

-5

1

1153

996

157

6

6

 

11

1793

1632

161

7

7

 

7

1358

1140

218

8

8

 

13

2075

1836

239

9

9

 

12

1930

1614

316

10

10

 

8

1453

1123

330

11

11

 

10

1824

1463

361

12

12

 

5

1634

1162

472

13

13

     

 

 

 

 

 

 

84

-7

接著下一個階段,我們要計算檢定的統計量:

4)      要計算正號排名的加總(84)及負號排名的加總(-7)。忽略符號,選擇較小的總和為T

5)      在虛無假設為真的情形下,母群體差異量的中位數為0,故我們預期正號及負號的樣本個數應當相同,並且正號等級總和應當相同於負號等級總和,接下來,利用以下的統計量進行檢定:

這裡的

為等級總和的平均數並且

為標準差。假如虛無假設為真並且樣本數夠大,會趨近於平均值為0及標準差為1的標準常態分布。

 

以下為以SAS分析纖維囊腫的人與健康對照組,在休息能量消耗量是否相同的無母數檢定結果。

SAS範例分析結果之報表

  1. 符號檢定(Sign Test)

以下我們利用2種方式來計算p值。

1) 方法一:

假如樣本數夠大,我們可以假設會趨近於標準常態分布,就可以利用以下的公式來計算p值。

當樣本數夠大時,會趨近於標準常態分布,在標準常態分布曲線下的右邊以及為左邊的機率為0.012=(0.006*2)。由於p小於α=0.05,所以拒絕虛無假設,我們可以說差異量中位數不為0,表示有纖維囊腫的人相較於健康對照組有較高的休息能量消耗量。

 

2) 方法二:

假如樣本數小於20,也可以利用二項式分布的公式來計算p值,也可以獲得相同的結果。

此結果與SAS輸出符號檢定(Sign Test)p值相同。

 

2. Wilcoxon符號等級檢定(Wilcoxon Singed-Rank Test)

T為正、負號中等級總和較小的數值,在本分析中的T7

當樣本數夠大時,會趨近於標準常態分布,在標準常態分布曲線下的左邊以及為右邊的機率為0.008=(0.004*2)。由於p小於α=0.05,拒絕虛無假設並且我們可以說差異量中位數不為0,表示有纖維囊腫的人相較於健康對照組有較高的休息能量消耗量。

 

13.3  Wilcoxon等級總和檢定(Wilcoxon Rank-Sum Test)

Wilcoxon等級總和檢定可用以比較來自兩個獨立母群體的樣本。因此,其為相對應於獨立樣本t檢定的無母數檢定。然而,Wilcoxon等級總和檢定不像t檢定需要假設母群體服從常態分布或變異數相同的假設,但必須假設兩個分布有相同的形狀。Wilcoxon等級總和檢定的虛無假設為兩個母群體的中位數是相同的。

 

研究問題

苯酮尿症患者無法代謝苯胺以致苯酮在體內堆積,造成智商的損害。欲評估患有苯酮尿症的小孩子在高(大於10mg/dL)、低濃度(小於10mg/dL)的苯酮暴露下對於其標準智商年齡分數的影響。然而,我們不假設標準智商年齡分數在這些患有此疾病的孩子中為常態分布。

下列為進行Wilcoxon等級總和檢定的步驟,

1)      我們必須從感興趣的母群體中隨機抽樣。

2)      將這兩組樣本結合在一起,把觀察值從最小排到最大並分別給予等級(Rank)。假如有數值是相同的,就給予相同觀測值一個平均的等級。在此樣本中有3位小朋友的標準智商年齡分數為51個月,由於這幾個觀察值在39個觀察值中的等級為第222324,故分配一個平均的等級(22+23+24)/3=23給這三個觀察值。

3)      將排名後的等級依其原本組別(高暴露組及低暴露組)分別加總起來,取兩個組別中等級總和較小的為W

 

13.3 苯酮尿症中高濃度及低濃度之標準智商年齡分數

Low Exposure
(<10 mg/dl)

High Exposure
(>=10 mg/dl)

nMA(mos)

Rank

nMA(mos)

Rank

34.50

2

28.00

1

37.50

6

35.00

3

39.50

7

37.00

4.5

40.00

8

37.00

4.5

45.50

11.5

43.50

9

47.00

14.5

44.00

10

47.00

14.5

45.50

11.5

47.50

16

46.00

13

48.70

19.5

48.00

17

49.00

21

48.30

18

51.00

23

48.70

19.5

51.00

23

51.00

23

52.00

25.5

52.00

25.5

53.00

28

53.00

28

54.00

31.5

53.00

28

54.00

31.5

54.00

31.5

55.00

34.5

54.00

31.5

56.50

36

55.00

34.5

57.00

37

 

313

58.50

38.5

 

 

58.50

 38.5

 

 

 

467

 

 

4)      在虛無假設為真的情形下,兩個母群體的中位數應相同,預期兩組等級的分布應當是隨機的。因此,每一個樣本的平均等級應是相同的。利用以下的統計量來進行檢定,

這裡的

W的平均等級總和並且

為標準差。這些公式中的代表等級總和較小的觀察值個數,代表等級總和較大的觀察值個數。假如夠大,在虛無假設為真下,會趨近於平均數為0,標準差為1的標準常態分布。

SAS範例分析結果之報表

 

W為兩組中等級總和較小的,本分析中的W313

當虛無假設為真時,預期其平均數為

而標準差為

會趨近於平均數為0、標準差為1的標準常態分布。

 

14.4 無母數統計方法的優缺點

優點:

1. 無母數統計方法不需要受到有母數檢定假設的限制,例如:無母數統計方法不需要假設母群體為常態分布。

2. 無母數統計檢定是處理等級而非真實數值,所以在樣本數很小的情形下很容易計算。

3. 無母數統計檢定是處理等級,比有母數檢定對於測量誤差(Measurement Error)較不敏感的。

缺點:

1. 假如有母數檢定的假設成立,無母數統計方法的檢力(Power)較有母數統計方法低。這表示如果當虛無假說是錯誤的,無母數統計方法需要較多樣本才能提供足夠的證據以拒絕虛無假設。

2. 無母數統計方法的計算主要是依據等級而非真實的觀察值,損失真實觀察值所提供的訊息。

3. 假如資料中大部分的觀察值是相等的,那麼分別會高估TW的標準差,為了解決這個問題需要在公式中加入修正項。

 

    主要參考書目:

1. Marcello Pagano, Kimberlee Gauvreau, ”Principles of Biostatistics, Second Edition”, Duxbury, a division of Thomson Learning, Inc, 2000

2. 譯者:林為森, 陳怡君, 陳清浩, 陳俞成, 謝秀幸, 魏美珠, ”生物統計原理第二版”, 新加坡商亞洲湯母生國際出版有限公司, 2002

 

TOP

本刊由中國醫藥大學 生物統計中心發行  網頁維護:林立偉