비확률적 표본추출

일상적 설문조사 결과 확보를 위한 가장 간단한 방법

대규모의 설문조사를 진행하는 것은 그다지 쉬운 작업이 아닙니다. 결과가 전체 인구집단을 대표해야 하는 필요성 뿐만이 아니라 원하는 모든 대상을 상대로 설문조사를 진행할 수 있는 기회를 제공하는 것도 어렵습니다.

이에 대해 실사회적인 한 가지 솔루션은 비확률적 표본추출로 SurveyMonkey는 이 분야에 대해 전문적인 지식을 갖추고 있습니다. 언제라도 설문조사에 응답할 준비를 갖춘 5백만 이상의 SurveyMonkey Audience 패널은 미국 내 최대의 비확률적 표본입니다.

비확률적 표본추출은 설문조사 모집단 일부는 설문조사를 진행할 기회가 아예 없다는 것을 전제로 하여 더 큰 규모의 인구집단으로부터 응답자 집단을 선택합니다. 이러한 표본추출은 설문조사 모집단 내에 있는 모든 사람들이 설문조사에 선택되는 확률이 0이 아닌 기회를 가지는 확률적 표본추출과는 반대입니다.

모든 사람들이 선택되는 것은 아닙니다.

SurveyMonkey Audience 패널을 사용하든지 또는 다른 유형의 비확률적 표본추출 디자인 패널을 사용하든지, 응답자를 선택하는 방법으로 인해 모집단 중 일부는 항상 선택되지 않게 됩니다.

때로는, 응답자들이 응답을 하기로 수락하거나 거절하는 때와 같이 이러한 배제 상황이 분명합니다. 예를 들어, 고객 피드백 설문조사에 참가할 수 있도록 고객에게 이메일 주소를 제공해 달라고 요청할 수 있습니다. 일부 고객은 이에 대해 거절할 것이며, 이러한 고객들은 설문조사 표본으로부터 선택되지 않게 됩니다.

어떤 경우엔, 이러한 배제 상황은 애매모호할 때도 있습니다. 하루 중, 매장을 방문하는 첫 100명을 상대로 설문조사를 진행하고자 한다고 가정하죠. 이 상황은 무작위 확률적 표본추출로 보일 수도 있지만 다음 사항을 고려해 보세요: 아침에 매장을 방문하는 고객들과 하루 중 더 나중의 시간대에 매장을 방문하는 고객들 간에는 차이가 있을 확률이 있습니다.

오전 9시에 매장을 연다면, 매장을 방문하는 첫 고객은 밤 7시나 8시에 매장을 방문하는 고객들에 비해 고용되어 있을 확률이 더 낮습니다. 고객들 중 일부는 이 첫 100명에 포함될 기회가 없으므로 설문조사 결과에는 편향이 있을 수 있으며, 이는 비확률적 표본추출을 사용하고 있는 경우입니다.

일반적인 비확률적 표본추출 전략

다음은 모든 설문조사에 반드시 적절하지는 않지만 일반적으로 사용되는 비확률적 표본추출 디자인입니다.

  • 할당 표본추출. 설문조사를 진행하고자 하는 사람들의 정확한 수를 설정(예: 남성 50명, 여성 50명)한 후, 일단 그 수에 도달하면 설문조사를 중단합니다. 할당 표본추출은 설문조사 관심 대상인 모든 하위 집단으로부터, 이 하위집단이 진정한 확률적 표본이 아니더라도, 최소한 일부 응답자들을 확보할 수 있도록 해줍니다.
  • 편의 표본추출. 알고 있는 사람들 또는 설문조사를 완수할 수 있는 사람들을 상대로만 설문조사를 진행합니다. 이런 방법은 재미로 설문조사를 진행(예: 대도시 길거리에서 100명의 사람들에게 대통령 후보로 유명인사가 출마하는 것에 대해 어떻게 생각하느냐고 묻는 것)할 때 사용할 수 있지만, 좀 더 광범위하게 적용될 수 있는 결과를 확보하고자 하는 경우에는 좀 더 과학적인 방법을 사용해야 합니다.
  • 눈덩이 표본추출. 설문조사에 이미 참가하고 있는 사람들에게 그들이 알고 있는 사람들로부터 다른 설문조사 참가자들을 모집해 달라고 요청하는 것입니다. 눈덩이 표본추출은 불법 이민자 또는 희귀 질병을 앓고 있는 사람들과 같이 찾기가 힘들거나 설문조사 참가에 대한 요청을 하기가 쉽지 않은 특정 집단을 상대로 하는 설문조사에 적합합니다. 이러한 경우, 관심 모집단은 상대적으로 일률적일 것이라고 가정할 수 있으며 대표적인 표본을 갖추는 것에 대해 그다지 우려하지 않아도 됩니다.

비확률적 표본추출의 장단점

확률적 표본추출은 통계학자들이 애용하는 방법이지만 실사회에서 설문조사를 진행하는 일반적인 사람들에게는 비확률적 표본추출이 더 실질적인 방법입니다. 비확률적 표본추출을 적절하게 사용한 경우, 진정한 확률적 표본으로부터 기대되는 것에 비해 동일하거나 더 나은 질의 데이터를 확보할 수 있습니다.

대부분의 설문조사는 매우 특정적인 인구집단을 대상으로 하며 확률적 표본추출이 제공하는 동일한 다양성과 대표성을 보장하지 않아도 됩니다. 어린 자녀를 둔 어머니들을 대상으로 시장 조사를 할 때는 남성, 자녀를 가지지 않은 사람들 또는 성인 자녀를 둔 사람들에 포함하는 확률적 표본이 필요 없습니다.

비확률적 표본이 관심대상인 인구집단과 완벽하게 일치하지 않는다고 하더라도 이 표본추출을 사용하는 데 따르는 여러 가지 장점이 있습니다.

비확률적 표본추출을 통해 응답을 받는 것은 확률적 표본추출에 비해 통상적으로 더 빠르고 더 저렴합니다. 이는 표본 집단이 무작위로 요청을 받은 사람들에 비해 응답을 줄 의향이 더 많기 때문입니다. 예를 들어 우편 리스트로부터 선택된 사람들은 그 리스트 밖에서 선택된 사람들에 비해 설문조사를 진행하는 회사에 더 충성도를 가지고 있습니다.

비확률적 표본추출의 가장 어려운 점은 확률적 표본추출이 제공하는 비편향적인 결과를 확보하는 것입니다.

응답자를 모집하는 방법이 데이터를 왜곡하지 않도록 항상 유념해야 합니다. 일부 온라인 패널은 응답자들에게 대가를 지불하기 때문에 단순히 지불을 받기 위해 응답을 하고 정확한 정보를 제공하지 않는 ‘직업적’ 설문조사 응답자들로부터 편향을 초래할 수 있습니다.

비확률적 표본추출을 시행할 때에는, 잠재적인 편향의 근원을 철저하게 파악해 두어야 합니다. 어떤 요소가 결과에 편향을 줄지 예상하는 것은 항상 쉽지는 않지만, 관심 분야의 모집단과 특성이 일치하는 다양한 응답자 그룹과 시작하는 것은 중요합니다. 이렇게 함으로써 확률적 표본추출만큼 정확한 데이터를 확보할 수 있을뿐만 아니라 비용 및 시간을 절약할 수도 있습니다.

SurveyMonkey가 호기심을 어떻게 충족시켜 드릴 수 있는지 알아보세요.