Skip to content

06. '종속 변수 : 트랙 사용 수' 회귀 분석

HoeJeongJang edited this page Nov 28, 2022 · 3 revisions

분석 목적

  • 유저가 선호하는 트랙을 출시하기 위해서는 어떤 특성을 고려해야할까요?

  • 트랙 사용 수에 영향을 미치는 변수들을 알아보기 위해 트랙 사용 수를 종속변수로 두고 회귀분석을 진행했습니다.

    Untitled

분석 방법

  • 유의수준 0.05하에서 OLS 다중 회귀 분석 진행
  • 종속변수와 상관관계가 높은 변수들을 위주로 먼저 회귀모형 적합 후, 변수를 추가하며 모형을 확인함
  • 다중공선성 고려함, vif(분산팽창계수)방식을 사용하여 팽창계수가 10보다 큰 것은 제외.
  • 각 지표마다 왜도를 확인하여 -2 미만 혹은 2 이상인 지표는 log를 취해 데이터간 편차를 줄이고 정규성을 높임 (※평균 주행시간은 왜도가 -2 미만 혹은 2 이상이어서 log를 취해줬습니다.)

결과

  • 총 3개의 변수를 포함하는 30.9% 설명력의 회귀식을 발견하였습니다. 설문조사를 통해 알게 된 유저들의 관심 지표보다, 트랙 사용 수는 평균 주행시간이 짧은 (빠르게 끝낼 수 있는) 트랙이나 자연 테마, 난이도가 유의하다는 결과를 얻었습니다. image
  • 특히 그 중에서 'log 평균 주행 시간'은 단일 회귀만으로 21%의 설명력을 보이며 트랙 사용수에 큰 영향을 주는 요소였습니다. 사용이 많이 되는 트랙을 만들려면, 평균 주행시간을 낮춰야하는 것을 알 수 있는 결과입니다. image