瀏覽我們市場研究專家所推薦的十大閱讀清單,助您成為市場研究專家
什麽是變異數分析?
變異數分析(又称方差分析, ANOVA),是由羅納德.費雪( Ronald Fisher)在1918年開發的統計測試,並一直沿用至今。簡單地說,ANOVA是用於比較三個或更多不同組的均值之間是否存在差異。
單因子變異數分析是最基本的形式。在不同的情況下,還有其他的變體可以使用,包括:
- 雙因子變異數分析(Two-way ANOVA)
- 多因子變異數分析(Factorial ANOVA)
- Welch的F檢定變異數分析(Welch’s F-test ANOVA)
- 排名變異數分析(Ranked ANOVA)
- Games-Howell檢定(Games-Howell pairwise test)
如何做變異數分析?
如同t檢定一樣,變異數分析可以幫助您找出數據組之間的差異是否具有統計學意義。它的原理是透過從各組中抽取的樣本,來分析各組內的差異水平。
如果數據組內存在大量的變異數(偏離平均值的數據分布),那麽從數據中選取的樣本的平均值會因為偶然性而造成差異的可能性就越大。
除了關注數據組內的變異數之外,變異數分析也考慮樣本的大小(樣本越大,隨機挑選出的樣本離群值的機會就越小),以及樣本平均值之間的差異(如果樣本的平均值相差甚遠,那麽整個組的平均值也更有可能如此)。
所有這些元素都被組合成一個F值,然後透過分析給出一個概率(p-vaue),說明每個組間差異是否具有統計學意義。
單因子變異數分析是比較自變量(影響其他事物的因素)對多個因變量的影響;雙因子變異數分析做的是相同的事,但其有一個以上的自變量;而多因子變異數分析則是將自變量的數量進一步擴大。
變異數分析會有什麽幫助?
單因子變異數分析可以幫助您了解自變量的平均值之間是否存在顯著差異。
那麼,為什麽這項分析很有用呢?
這是因為當您了解了每個自變量的均值與其他自變量有什麽不同時,您就可以開始研究並知道其中哪個自變量與您的因變量(如登陸頁面的點擊量)有關係,並且了解是什麽因素在驅動這個行為。
同時,您也可以將其顛倒過來使用,來看自變量(如溫度)是否會影響多個因變量(如防曬霜的購買率、戶外活動場所的出席率、舉行野餐的可能性等),如果是的話,那麽又是哪些。
什麼時候可以使用變異數分析?
作為一個營銷人員,當您想要測試一個特定的假設時,您可以使用變異數分析(ANOVA)來進行。使用變異數分析可以幫助您了解不同組的反應,並使用零假設來測試,這表示不同組是平等的。如果在統計上有顯著的結果,則意味著兩個總體不相等(或不同)。
使用變異數分析的例子
變異數分析能夠幫助您回答以下的問題類型:
年齡、性別或收入對一個顧客每月在您的商店消費金額有影響嗎?
為了得到這個問題的解答,可以使用多因子變異數分析,因為在這個問題中,您有三個自變量和一個因變量。您會需要收集不同年齡組(如0-20歲,21-40歲,41-70歲,71歲以上)、不同收入層級,以及所有相關性別的數據。然後,使用雙向變異數分析可以同時評估這些變量對您的因變量(消費金額)的影響,並確定它們是否產生差異。
婚姻狀況(單身、已婚、離異、喪偶)是否影響情緒?
關於這個問題,您可以使用單因子變異數分析,因為您有一個單一的自變量(婚姻狀況)。接著您會有4組數據,每組的婚姻狀況都有一個回答。而針對每組的數據,您將需要確認心情分數,並看平均數之間是否有差異。
當您了解自變量中的各組有什麽不同時(如喪偶或單身,未結婚或離婚),您就可以開始確認其中哪一組與您的因變量(情緒)有關係。
然而,這裡您應該注意的是,變異數分析只會告訴您所有組別的平均情緒分數是否一樣。它並不會告訴您哪個人的平均情緒分數明顯更高或更低。
了解變異數分析的假設
和其他類型的統計測試一樣,變異數分析比較了不同組的平均值,並告訴您平均值之間是否存在統計上的差異。變異數分析被歸類為綜合測試統計量,這表示它無法確切得知哪些特定組別在統計上有明顯的差異,只能告訴您至少有兩個組別有差異。
重要的是,要記住,主要的變異數分析研究問題是樣本均值是否來自不同的人群。因此,變異數分析所依賴的假設有兩個:
- 無論採用何種數據收集技術,每個抽樣人群中的觀測值都是屬於常態分布。
- 被抽樣人群有一個共同的變異數s2。
變異數分析的類型
從基本的單因子變異數分析到特殊情況下的變化,例如非分類變量的排名變異數分析,有許多種方法可以使用變異數分析來進行數據分析。
單因子和雙因子變異數分析之間的有什麼不同?
這兩者之間的區別是由變異數分析測試中,包括了多少個獨立變量來定義的。單因子表示變異數分析只有一個自變量,而雙因子則代表測試中有兩個自變量。舉例來說,比如可能自變量是飲料的品牌(單因子),或獨立變量是飲料的品牌,以及它有多少卡路里,或它是否為原味飲料還是減肥飲料。
多因子變異數分析(Factorial ANOVA)
多因子變異數分析是一個總括性術語,其為包括了有兩個或更多的獨立分類變量的變異數分析測試。(雙因子變異數分析實際上也是一種多因子變異數分析)。分類的意思是,變量是以非層次性的類別來表達的(如Mountain Dew與Dr Pepper),而不是使用同一個等級的範圍或數值。
Welch的F檢定變異數分析(Welch’s F-test ANOVA)
如果關於數據的幾個假設成立,Stats iQ會建議採用Welch的F檢定變異數分析:
- 樣本量大於計算中組數的10倍(只有一個值的組被排除),因此中心極限定理會滿足正態分布數據的要求。
- 連續/離散數據中很少,或沒有異常值。
與常見的等變異數的F檢定不同,Welch的F檢定變異數分析並不假設被比較組的變異數是相等的。如果假設了變異數相等會導致在變異數實際上不相等的情況下,出現更不準確的結果,而在變異數實際上相等的情況下,其結果會是非常相似的。
排名變異數分析(Ranked ANOVA)
當假設被違反時,無等級的變異數分析可能就不再有效了。在這種情況下,Stats iQ會推薦使用排名變異數分析(也稱 等級變異數分析);Stats iQ對數據進行等級轉換(用它們的等級排序替換數值),然後在轉換後的數據上運行相同的變異數分析。
排名變異數分析對異常值和非正態分布的數據都是穩健的。而等級轉換是一種公認防止違反假設的方法(一種「非參數」方法),在Pearson和Spearman相關性之間的差異中最常見;此外,級別轉換後的Welch的F檢定變異數分析在效果上與Kruskal-Wallis檢定相似。
這裡您需要注意的是,Stats iQ的等級和非等級變異數分析效果大小(Cohen’s f)是用等變異數的F檢定的F值計算的。
Games-Howell檢定(Games-Howell pairwise test)
Stats iQ運行的Games-Howell檢定,而不考慮變異數分析測試的結果(根據Zimmerman, 2010),顯示了無等級或有等級的Games-Howell配對檢定的標準,與用於有等級與無等級變異數分析的標準相同,所以如果您在高級輸出中看到了「有等級的變異數分析」,則配對測試也將是有等級的。
Games-Howell檢定本質上是一種不等變異數的t檢定,它解釋了在運行許多成對檢定時,可以偶然發現統計顯著結果的可能性增加。與稍微常見的Tukey’s b檢定不同,Games-Howell檢定並不假定被比較組的變異數是相等的。舉例來說,假設變異數相等會導致在變異數事實上不相等的情況下出現更不準確的結果,而在變異數實際相等的情況下,其結果也非常相似(根據Howell,2012)。
請注意,雖然無等級的配對檢定中,測試了兩組的平均值是否相等,但有等級的配對檢定並沒有明確測試各組的平均值,或中位數之間的差異。相反,它測試的是一個組的數值比另一個組大的一般趨勢。
此外,雖然Stats iQ不顯示任何少於四個值的組的配對測試結果,但這些組在計算其他配對測試的自由度時,被包括在內。
相關閱讀:用我們的電子書最高效地高效地提高您的研究投資回報率
如何進行變異數分析測試
與許多較早出現的統計測試一樣,可以使用基於公式的手工計算,來進行變異數分析。您也可以使用任何數量的流行統計軟體和系統,來運行變異數分析,例如R、SPSS或Minitab。最近較新的方式是使用自動化工具,如Qualtrics的Stats iQ,它使統計分析更加容易和直接。
Stats iQ和變異數分析
Qualtrics的Stats iQ可以幫助您進行變異數分析測試。當您選擇有三個或更多組別的分類變量,和一個連續或離散變量時,Stats iQ會運行一個單因子變異數分析(Welch的F檢定變異數分析),和一系列成對的「事後」檢定(Games-Howell檢定)。
單因子變異數分析用於測試兩個變量之間的總體關係,而成對測試則會測試每一對可能的組別,已看出一個組別是否傾向於比另一個組別有更高的值。
如何透過Stats iQ運行變異數分析測試
Stats iQ中的平均數總體統計測試就如同變異數分析一樣,通過測試兩個或多個平均值之間的差異,並測試分類變量和數字變量之間的關係。透過這個測試來產生一個P值,用以確定關係是否顯著。
要在Stats iQ中運行變異數分析,須採取以下步驟:
- 選擇一個有3個以上組的變量和一個有數字的變量
- 選擇「相關」
- 然後您會得到一個變異數分析,一個相關的「效應大小」,以及一個簡單易懂的總結
Qualtrics交叉分析和變異數分析
您也可以透過Qualtrics Crosstabs功能來進行一個變異數分析測試。以下是操作方法:
- 確保您的「列」變量有3個以上的組,以及您的「行」變量有數字(例如年齡),或是數字(例如,7代表非常滿意)
- 選擇「平均數的總體統計測試」
- 接著,您就會看到一個基本的變異數分析P值
變異數分析的有哪些侷限性?
雖然變異數分析可以幫助您分析兩個獨立變量之間的平均值差異,但它無法告訴您哪些統計組之間存在著差異。所以,如果您的測試得到的是一個顯著的F統計量(也就是當您運行變異數分析測試時得到的數值),那麼接著您可能會需要運行一個特別的測試(如最小顯著性差異測試)來告訴您到底哪些組的平均值有差異。
用我們的電子書中的秘笈,有效改善您的市場研究:《 研究平台的3個好處》
變異數分析的其他注意事項
- 在樣本量較小的情況下,可以透過目測來確定數據是否真的呈正態分布;如果是的話,即使是小樣本,無等級的t檢定結果依然有效。在實際的運作中,這種評估可能很難進行,因此Stats iQ建議對小樣本默認採用等級的t檢定。
- 隨著樣本量的增加,異常值不太可能對結果產生負面影響。Stats iQ使用Tukey的「外部圍欄 」來定義離群值,即高於75分位數或低於25分位數的三倍以上的點。
- 像「完成的最高教育水平」或「馬拉松比賽中的完賽順序」這樣的數據是有順序性的。盡管李克特量表(如1到7的量表,其中1代表非常不滿意,7代表非常滿意)在技術上是順序性的,但社會科學中常見的做法是把它們當作連續的(即無等級的t檢定)。
閱讀更多關於其他統計分析類型的資訊:
電子書《敏捷研究指南》