주요 콘텐츠로 건너뛰기
Qualtrics Home page

Qualtrics 시장 조사 전문가 읽기 목록 (Market Research Expert Reading List)과 함께 시장 조사 전문가가 되어보세요

ANOVA란?

ANOVA는 분산 분석을 의미합니다. 이 분석은 1918년 로널드 피셔(Ronald Fisher)에 의해 개발된 통계학적 테스트이며, 현재까지도 널리 쓰이고 있습니다. 간단히 말하자면 ANOVA는 세 개 이상의 독립 그룹의 평균 사이에 어떤 통계학적 차이가 있는지 알려줍니다.

일원 분산 분석이 가장 기본적인 형식이지만, 다음과 같은 기타 변형 분석들 또한 존재합니다.

분산 분석은 어떤 방식으로 이루어지나요?

t-검정과 마찬가지로 ANOVA는 데이터 그룹 간의 차이가 통계학적으로 유의한지 알아낼 수 있도록 도와줍니다. 이는 ANOVA는 그룹에서 뽑은 표본을 통해 그룹 내의 분산 수준을 분석하는 방식으로 이루어집니다.

만약 데이터 그룹 내의 분산이 크다면(데이터가 평균과 멀리 떨어져 있음), 데이터에서 선택된 표본의 평균이 확률상 다를 가능성이 더욱 커집니다.

ANOVA는 데이터 그룹 내의 분산을 확인할 뿐만 아니라 표본 크기(표본이 클수록 우연히 표본의 이상치를 고를 확률은 적어집니다)와 표본 평균 사이의 차이(만약 표본의 평균이 멀리 떨어져 있다면, 전체 그룹의 평균 또한 그러할 가능성이 높습니다)를 고려합니다.

이러한 모든 요소는 F 값과 결합되며, 이후 그룹 사이의 차이가 통계학적으로 유의할 확률(P 값)을 얻기 위해 분석될 수 있습니다.

일원 분산 분석은 여러 개의 종속 변수에서 하나의 독립 변수(다른 것들에 영향을 미치는 요인)의 효과를 비교합니다. 이원 분산 분석도 같은 원리이지만, 두 개 이상의 독립 변수로 분석합니다. 요인 분산 분석은 독립 변수의 수가 더욱 더 늘어난 방식입니다.

무료 eBook |Success Toolkit : 당신의 시장 조사를 다시 생각해보고, 재창조하세요(EN)

분산 분석은 무엇을 도와줄 수 있나요?

일원 분산 분석은 종속 변수의 평균 사이에 유의한 차이가 있는지 알아볼 수 있도록 합니다.

그렇다면 왜 이 분석이 유용할까요?

각 독립 변수의 평균이 다른 변수와 어떤 차이가 있는지 이해하면, 어떤 요인이 종속 변수 (예: 랜딩 페이지 클릭 수)와 연관되어 있는지 이해할 수 있고, 그 행동의 동기에 대해 알아볼 수 있기 때문입니다.

또한 이를 뒤집어 단일 독립 변수(예: 온도)가 여러 종속 변수(예: 선크림 구매율, 야외 행사장 참석률, 요리 파티를 개최할 가능성)에 영향을 미치는지, 영향을 미친다면 어떤 변수가 영향을 미치는지 알아볼 수 있습니다.

분산 분석은 언제 사용할 수 있나요?

마케터는 특정 가설을 검증하고자 할 때 분산 분석(ANOVA)을 사용할 수 있습니다. 분산 분석을 사용하면 여러 그룹의 평균이 동일하다는 검증을 위한 귀무 가설과 함께 서로 다른 그룹이 어떻게 반응하는지 이해하는 데에 도움을 받을 수 있습니다. 만약 통계학적으로 유의한 결과가 나온다면, 두 모집단은 동일하지 않다(또는 다르다)라는 의미입니다.

무료 보고서 | 시장 조사 글로벌 트렌드 보고서와 함께 최신 소식을 접하세요 (EN)

분산 분석의 활용 예시

다음과 같은 질문에 대한 답을 얻기 위해 분산 분석을 사용할 수 있습니다.

연령, 성별 또는 소득이 당신의 매장에서 한 달 동안 지출하는 금액에 영향을 미칠까요?

이 질문에는 3가지 독립 변수와 1가지 종속 변수가 존재하기 때문에 이 질문에 답하려면 요인 분산 분석이 사용될 수 있습니다. 당신은 서로 다른 연령 그룹(예: 0-20, 21-40, 41-70, 71 이상), 소득 계층 및 모든 성별 관련 데이터를 수집해야 합니다. 그 다음 이원 분산 분석으로 종속 변수(지출액)에 이러한 변수들의 영향을 동시에 평가하고, 차이가 있는지 검증합니다.

혼인 상태(싱글, 결혼, 이혼, 사별)가 기분에 영향을 미칠까요?

이 질문에는 한가지 독립 변수(혼인 상태)만 존재하기 때문에, 일원 분산 분석을 사용할 수 있습니다. 각 혼인 상태 범주별로 하나씩 4개의 데이터 그룹이 존재하게 되며, 각 그룹에 대한 기분 점수를 확인한 후 평균간 차이가 있는지 확인하면 됩니다.

독립 변수 내의 그룹이 어떻게 차이가 있는지 알아내게 된다면(사별 또는 미혼, 미혼 또는 이혼) 어떤 그룹이 종속 변수(기분)과 연관되어 있는지 이해하기 시작할 수 있습니다.

그러나 분산 분석은 오로지 모든 그룹에 대한 평균 기분 점수가 동일한지 혹은 그렇지 않은지에 대해서만 알려줍니다. 분산 분석은 어떤 그룹이 유의하게 평균보다 높거나 낮은 기분 점수를 보이는지 알려주지는 않습니다.

분산 분석의 가설 이해하기

통계 검정의 다른 유형과 마찬가지로 분산 분석은 서로 다른 그룹의 평균을 비교하고, 평균 사이에 통계학적 차이가 있는지 보여줍니다. ANOVA는 옴니버스 통계 검정으로 분류됩니다. 즉, 어떤 특정 그룹이 서로 통계적으로 유의하게 다른지 알려줄 수 없고, 그룹 중 적어도 두 개가 다르다는 것만 알 수 있습니다.

여기서 중요하게 기억해야 할 사항은 기본 분산 분석 조사 질문은 표본 평균이 다른 모집단으로부터 나왔는지에 대한 여부라는 것입니다. 여기에는 분산 분석이 기반으로 하는 두 가지 가설이 존재합니다.

  1. 데이터 수집 기술에 관계 없이, 각 표본 모집단 내의 관측치는 정규 분포를 따른다.
  2. 표본 모집단은 s2 공통 분산을 가진다.

분산 분석의 유형

데이터 분석을 위해 분산 분석을 사용하는 방식은 기본 일원 분산 분석부터 비범주형 변수에 대한 순위 분산 분석과 같이 특별 케이스를 위한 변수까지 아주 다양하게 존재합니다. 다음에서는 몇 가지 가장 일반적인 분산 분석에 대해 소개해 드리겠습니다.

일원 및 이원 분산 분석 검정 사이의 차이점은 무엇인가요?

이러한 차이점은 분산 분석 테스트에 몇 개의 독립 변수들이 포함되어 있는지에 따라 정의됩니다. 일원 분산 분석에는 하나의 독립 변수가 있다는 것을 의미합니다. 반면, 이원 분산 분석에는 두 가지의 독립 변수가 검정된다는 것을 의미합니다. 독립 변수의 예로는 음료 브랜드(일원)가 있을 수 있고, 여러 개의 독립 변수로는 음료 브랜드와 함량 칼로리 또는 오리지널인지 다이어트인지 여부가 될 수 있습니다.

요인 분산 분석(Factorial ANOVA)

요인 분산 분석은 두 개 또는 그 이상의 범주형 독립 변수가 포함된 분산 분석 검정을 포괄하는 용어입니다 (이원 분산 분석이 사실상 요인 분산 분석의 한 종류입니다). 범주형이란 변수들이 순위 척도나 숫자 값을 사용하지 않고 비계층적 범주(예: 마운틴듀 vs. 닥터페퍼)로 표현되는 변수를 의미합니다.

웰치 F 검정 분산 분석(Welch’s F Test ANOVA)

Stats iQ는 보유한 데이터에 대한 몇 가지 가정이 성립될 경우 순위가 매겨지지 않은 웰치 F 검정을 권장합니다. 가정은 아래와 같습니다.

  • 표본 크기가 계산할 그룹 수의 10배 이상 (한 개의 값만 가진 그룹은 제외)이고, 이에 중심 한계 정리가 정규 분포 데이터에 대한 요구사항을 충족시킨다.
  • 연속/이산 데이터에 이상치가 많지 않거나 혹은 없다.

등분산에서 조금 더 일반적인 F 검정과는 다르게 웰치 F 검정은 비교되는 그룹의 분산이 같다고 가정하지 않습니다. 분산이 실제로 같지 않은 경우에 같은 분산을 가정하는 것은 덜 정확한 결과를 초래할 수 있으며, 그 결과는 분산이 실제로 같을 때와 매우 유사합니다.

순위 분산 분석(Ranked ANOVA)

가정이 위반되었을 시, 비순위 분산 분석은 더 이상 유효하지 않을 수 있습니다. 그럴 경우 Stats iQ는 순위 분산 분석 (“ANOVA on ranks”라고도 불림)을 권고합니다. Stats iQ는 데이터를 순위 매겨 변환(값을 순위순으로 대체)한 후 변환된 데이터로 동일한 분산 분석을 실행합니다.

순위 분산 분석은 이상치와 비정규 분포 데이터에서 견고합니다. 순위 변환은 가정 위반 (“비모수” 방식)으로부터 보호하기 위해 확립된 방법이며, 가장 일반적으로 피어슨 및 스피어맨 상관관계 사이의 차이에서 찾아볼 수 있습니다. 웰치 F 검정으로 이어진 순위 변환은 크루스칼 왈리스 (Kruskal-Wallis) 검정과 유사한 효과를 갖고 있습니다.

Stats iQ의 순위 및 비순위 분산 분석의 효과 크기(Cohen’s f)는 등분산에 대한 F 검정의 F 값을 사용하여 계산됩니다.

게임즈 호웰 페어와이즈 검정(Games-Howell Pairwise Test)

Stats iQ는 ANOVA 검정의 결과와 상관없이 게임즈 호웰 검정을 실행합니다(Zimmerman, 2010). Stats iQ는 순위 vs 비순위 ANOVA에 사용된 동일한 기준에 따라 순위가 매겨지거나 순위가 매겨지지 않은 게임즈 호웰 페어와이즈 검정을 표시하므로, 고급 출력에서 “순위(ranked) 분산 분석”이 표시되는 경우 페어와이즈 검정 또한 순위가 매겨지게 됩니다.

기본적으로 게임즈 호웰은 여러 페어와이즈 검정을 실행할 때 우연히 통계적으로 유의한 결과를 찾아낼 가능성이 증가하는 것을 설명하는 이분산에 대한 t-검정입니다. 조금 더 일반적인 투키(Tukey)의 b-검정과는 달리, 게임즈 호웰 검정은 비교되는 그룹의 분산이 동일하다고 가정하지 않습니다. 등분산을 가정할 경우 분산이 실제로 동일하지 않을 때 정확도가 떨어지고, 분산이 실제로 동일할 때 매우 유사한 결과를 보여줍니다 (Howell, 2012).

비순위 페어와이즈 검정은 두 그룹의 평균이 동일한지 여부를 테스트하지만, 순위 페어와이즈 검정은 그룹의 평균 또는 중간값 사이의 차이를 명백하게 테스트하지 않습니다. 대신, 한 그룹이 다른 그룹보다 더 큰 값을 갖는 일반적인 경향을 검정합니다.

아울러, Stats iQ는 4개 미만의 값을 가진 그룹에 대한 페어와이즈 검정 결과를 표시하지 않지만, 이러한 그룹은 다른 페어와이즈 검정의 자유도를 계산하는 데에 포함됩니다.

무료 eBook|리서치 ROI를 극대화하는 방법 (EN)

분산 분석 검정을 수행하기 위한 방법

이전의 여러 통계 검정과 마찬가지로 공식을 기반으로 직접 계산하여 분산 분석을 진행할 수 있습니다. 또한 R, SPSS 또는 Minitab과 같이 널리 사용되는 통계 소프트웨어 패키지 및 시스템을 사용하여 분산 분석을 실행할 수도 있습니다. 하지만 가장 편리하고 최신식 방법은 Qualtrics의 Stats iQ와 같이 자동화된 도구를 사용하여, 그 어느 때보다 통계 분석을 쉽고 직관적으로 이용하는 것입니다.

Stats iQ 및 분산 분석

Qualtrics의 Stats iQ는 분산 분석 검정을 실행할 수 있도록 도와줍니다. 3개 이상의 그룹과 1가지 연속변수 또는 이산변수가 있는 하나의 범주화된 변수를 선택할 때, Stats iQ는 일원 분산 분석(웰치 F 검정)과 일련의 페어와이즈 “사후 검정”(게임즈 호웰 검정)을 실행합니다.

일원 분산 분석은 두 가지 변수 사이의 전체적인 관계를 검정하며, 페어와이즈 검정은 하나의 그룹이 다른 그룹보다 더 높은 값을 가지는 경향이 있는지 확인하기 위해 가능한 각 그룹 쌍을 검정합니다.

Stats iQ를 통해 분산 분석 검정을 실행하는 방법

Stats iQ에서의 평균의 전체 통계 검정(Overall Stat Test of Averages)은 두 개 이상의 평균의 차이를 테스트하면서 범주형 및 숫자 변수 사이의 관계를 검정하는 분산 분석과 같은 역할을 수행합니다. 이 검정은 p-값을 생성하여 해당 관계가 유의한지 여부를 확인합니다.

Stats iQ에서 분산 분석을 실행하기위해 아래의 단계를 따르세요.

  • 3개 이상의 그룹과 숫자와 하나의 그룹이 포함되어 있는 변수를 선택합니다.
  • “Relate”를 선택합니다.
  • 이를 통해 분산 분석과 관련된 효과 크기 및 간단 요약본을 얻을 수 있습니다.

Qualtrics 크로스탭 및 분산 분석

Qualtrics 크로스탭 기능을 통해서도 분산 분석 검정을 실행할 수 있습니다. 방법은 다음과 같습니다.

  • “배너”(열) 변수가 3개 이상의 그룹을 가지고 있으며, “스텁”(행) 변수가 숫자 (예: 연령) 또는 숫자 코드(예: “매우 만족함” = 7)를 가지고 있는지 확인합니다.
  • “평균의 전체 통계 검증”을 선택합니다.
  • 이를 통해 기본 ANOVA p-값을 확인할 수 있습니다.

분산 분석의 한계는 무엇인가요?

분산 분석은 두 가지 독립 변수 사이의 평균에 대한 차이를 분석하는 데 도움이 되지만, 어떤 통계 그룹이 서로 다른지는 알려주지 않습니다. 검정 후 유의한 F-통계량 (분산 분석을 실행할 때 얻는 값)이 반환되는 경우, 어떤 그룹의 평균에 차이가 있는지 정확하게 알려주는 사후검정 (예: 최소유의차검정)을 실행해야 할 수 있습니다.

무료 eBook| 조사 플랫폼의 세 가지 이점(EN)

분산 분석에 대한 추가 고려 사항

  • 표본 크기가 작을수록 데이터가 실제로 정규 분포 형태인지 시각적으로 확인할 수 있습니다. 만약 그러하다면, 비순위 t-검정 결과는 표본이 작더라도 유효합니다. 하지만 실제로 이 평가를 내리기는 어려울 수 있으므로 Stats iQ는 작은 표본에서는 기본값으로 순위 t-검정을 권장합니다.
  • 표본 크기가 커지면 이상치가 결과에 부정적으로 영향을 미칠 확률은 줄어듭니다. Stats iQ는 투키의 “바깥 울타리”를 사용하여 75번째 백분위수 값보다 위 또는 25번째 백분위수 값보다 3배 이상 높은 사분위수 범위의 값으로 이상치를 정의합니다.
  • “최고 수준의 학력” 또는 “마라톤 완주 순서”와 같은 데이터는 분명 서열화되어 있습니다. 리커트 척도 (예: 1은 매우 불만족, 7은 매우 만족)는 기술적으로는 서열화되어 있지만, 사회과학 분야에서는 이를 연속 데이터로 취급하는 것이 일반적입니다 (즉, 순위가 매겨지지 않은 t-검정).

추가 통계 분석 유형에 대해 더 자세히 알아보세요.

무료 eBook| 최신 애자일 조사에 대한 가이드