설문조사를 보내는 목적은 사람들의 의견, 행동, 피드백 등을 더 잘 이해하기 위해서입니다. 하지만 응답자들의 답변이 이해하고자 하는 전체 모집단을 얼마나 잘 대표하는지는 어떻게 알 수 있을까요? 설문조사 표본 크기를 파악하면 도움이 됩니다.
표본 크기는 설문조사에서 받은 완료된 응답 수를 의미합니다. 이상적인 표본 크기는 목표 시장이나 인구 통계의 총 사람 수에 따라 달라집니다.
하지만 설문조사 표본 크기는 설문조사 결과가 의미가 있는지 아니면 통계적으로 유의성이 있는지를 결정하는 데 도움이 되는 요소 중 한 가지일 뿐입니다.
설문조사 표본 크기를 결정하는 방법을 알아보기 전에 다음과 같은 몇 가지 핵심 용어를 이해하는 것이 중요합니다.
예를 들어, 설문조사를 표본 크기 1,000명에게 발송했다고 가정할 때 400명이 설문을 열어봤다면, 응답률은 40%입니다. 대부분의 경우 설문조사를 여는 사람들 모두가 설문조사를 완성하는 것은 아닙니다. 400명이 설문을 열었지만, 그중 200명이 응답을 제출했다면 완성률은 50%입니다.
응답률과 완성률은 초기에는 표본 크기에 직접적인 영향을 주지는 않지만, 표본 크기를 선택할 때 이러한 변수를 고려하는 것은 중요합니다.
이는 타겟팅 모집단을 대표할 표본을 선택할 때, 설문조사를 받은 모든 사람이 설문을 완료하지는 않을 것이며, 이로 인해 통계적 유의성에 영향을 줄 수 있다는 사실을 고려해야 하기 때문입니다.
새로운 제품 아이디어를 테스트하고 싶다고 가정해 보죠. 우리 일반 고객들이 특정 연령대와 소득 범위에 있다는 것을 알고 있습니다. 또한 이 고객들은 도시 지역 및 그 주변에 사는 경향이 있습니다. 이 그룹이 바로 모집단으로 이해하고자 하는 타겟팅 대상입니다.
이제 연구하고 있거나 이해하고자 하는 사람들의 총 수인 모집단을 파악했습니다. 이 예시에서는 모집단에 10,000,000명이 있다고 가정해 봅시다.
다음으로 오차 한계를 선택해야 합니다. 오차 한계는 설문조사 응답이 모집단의 의견을 얼마나 잘 대표하는지에 대한 확신의 정도입니다.
사람들은 설문조사 연구에서 일반적으로 5%의 오차 한계를 선택합니다. 이는 잠재적 오류를 고려하기 위해 데이터의 양쪽에 5%를 더하고 뺀다는 뜻입니다.
예를 들어, 설문조사를 완료한 사람 중 60%가 신제품을 구매하겠다고 말했다고 가정해 보죠. 오차 한계가 5%이므로, 실제로는 55~65%가 신제품을 구매할 것으로 결론 내릴 수 있습니다.
마지막으로는 신뢰 수준을 선택해야 합니다. 신뢰 수준은 타겟팅 모집단 내의 또 다른 표본에 설문을 보냈을 때 같은 결과를 얻을 확률입니다.
이 예시에서 1,000명에게 설문조사를 보낸다고 가정하면, 오차 한계로 55~65%가 신제품을 구매할 것으로 결론을 내릴 수 있습니다. 이 결과에 얼마나 확신할 수 있을까요?
업계 표준인 95%의 신뢰 수준을 선택하고 이 신뢰 수준으로 동일한 설문조사를 다른 표본의 1,000명에게 보낸다면, 95%의 확률로 같은 결과를 받게 됩니다.
이제 모집단, 오차 한계, 원하는 신뢰 수준이 정해졌으니, 설문조사의 표본 크기를 계산할 차례입니다. 표본 크기란 얼마나 많은 사람이 설문조사에 응답했는지를 나타내는 것임을 유념하세요. SurveyMonkey의 표본 크기 계산기를 사용하거나 다음의 설문조사 표본 크기 공식을 사용하여 알아볼 수 있습니다.
*95% 신뢰 수준은 1.96 z-점수
이 공식을 사용할 경우, 모집단이 10,000,000명이고, 오차 한계가 5%(0.05), 신뢰 수준이 95%(z-점수 1.96)라면, 표본 크기는 385명입니다. 하지만 표본 크기는 단순한 숫자 그 이상입니다.
타겟팅 표본 크기를 정한 후에는, 참여자를 무작위로 선정할 수 있는 신뢰할 수 있는 방법이 필요합니다. Excel을 사용해 무작위 표본을 만드는 방법을 배우면, 무작위성 원칙을 지키면서도 효율적으로 설문조사 대상자를 선정할 수 있습니다.
일반적으로, 표본 크기가 클수록 결과가 통계적으로 유의미할 가능성이 높아집니다. 그러나 표본 크기 중요도는 다음과 같은 변수에 따라 달라질 수 있습니다.
몇 명이 설문조사에 응답해야 하는지 빠르게 예상해 보고 싶은가요? 이러한 계산에 도움이 되는 아래의 표를 참조해 보세요. 필요한 것은 타겟팅 모집단의 총 인원 수와 원하는 오차 한계(3~10%)입니다.
Population | ±3% | ±5% | ±10% |
500 | 345 | 220 | 80 |
1,000 | 525 | 285 | 90 |
3,000 | 810 | 350 | 100 |
5,000 | 910 | 370 | 100 |
10,000 | 1,000 | 385 | 100 |
100,000 | 1,100 | 400 | 100 |
1,000,000 | 1,100 | 400 | 100 |
10,000,000 | 1,100 | 400 | 100 |
* 백분율은 각각 3%, 5%, 10%의 오차 한계를 의미합니다.
예를 들어, 의료 연구를 수행하는 경우에는 오차 한계를 3%와 같이 낮게 설정할 수 있습니다. 반면, 고객 만족도 설문조사의 표본 크기를 선택한다면, 10%와 같은 더 높은 오차 한계를 더 신뢰할 수도 있습니다.
표본을 신중하게 설계하면, 표본추출 편향, 즉 표본이 타겟팅 모집단을 정확히 반영하지 못하는 문제를 줄일 수 있습니다. 다음은 설문조사에서 고려해야 하는 표본추출 방식에 대한 간단한 개요입니다.
확률적 표본추출은 타겟팅 모집단 내의 모든 사람이 설문에 선정될 동등한 확률을 갖는 방식입니다.
확률적 표본추출에는 네 가지 기본 유형이 있습니다.
비확률적 표본추출은 타겟팅 모집단 내 모든 사람이 같은 확률로 선택되지 않는 방식입니다.
간단하고 저비용이라는 장점이 있지만, 표본 편향이 발생하기 쉬워 설문조사 결과의 신뢰도에 영향을 줄 수 있습니다.
비확률적 표본추출에는 다음의 다섯 가지 기본 유형이 있습니다.
전문적인 표본추출 설계에서 타겟팅 시장 설문조사까지, SurveyMonkey Audience는 신뢰할 수 있는 시장 인사이트를 신속하게 제공합니다.