Skip to content

08. '종속 변수 : 난이도' 회귀 분석

HoeJeongJang edited this page Nov 29, 2022 · 3 revisions

분석 목적

  • 유저는 트랙을 선택할 때 평균주행시간을 중요하게 생각하니 평균 주행시간 극도로 낮춰서 트랙을 디자인 하면 될까요? 이렇게 만든 트랙을 유저들은 좋아할까요?

    Untitled

  • 아닙니다. 카트라이더에는 정말 다양한 레벨의 유저가있습니다. 1레벨 부터 108레벨까지의 다양한 유저들을 위해 레벨에 맞게, 트랙의 난이도 또한 고려하며 새로운 트랙을 출시하는 것이 중요합니다. 트랙 난이도에 영향을 미치는 변수들을 알아보기 위해 난이도를 종속변수로 두고 회귀 분석을 진행했습니다.

    Untitled 1

분석 방법

  • OLS 다중 회귀 분석 진행, 후진 선택 방식으로 모든 지표를 넣은 뒤, P-value가 0.05보다 작은 변수를 제외하며 진행.
  • 다중공선성 고려함, vif(분산팽창계수)방식을 사용하여 팽창계수가 10보다 큰 것은 제외.
  • 각 지표마다 왜도를 확인하여 -2 미만 혹은 2 이상인 지표는 log를 취해 데이터간 편차를 줄이고 정규성을 높임 (※최종 회귀식에는 로그변환이 필요한 변수가 없었음)

결과

  • 총 9개의 변수를 포함하는 78.3% 설명력의 회귀식을 발견하였습니다. 이 회귀식을 이용하면 9개 지표의 값을 통해 해당 트랙의 난이도를 78.%의 확률로 예측할 수 있음을 의미합니다.

    image

    Untitled 2