데이터 분석/프로젝트

비디오 게임 데이터를 이용하여 출시할 게임 설계하기

Aytekin 2022. 1. 1. 22:09
728x90

코드스테이츠 AI 부트캠프 3기 section1 프로젝트 내용을 정리한 것입니다.


1. 프로젝트 개요

1980년도부터 2020년까지 출시된 게임의 지역별, 연도별 판매량 데이터를 통해 게임시장의 트랜드변화와 앞으로 게임시장은 어떻게 될 것인지, 최종적으로 새롭게 출시할 게임을 설계하고 추천하는 프로젝트 입니다.

 

2. 프로젝트의 목표

새롭게 출시할 게임 설계하기.

  • 게임장르
  • 플랫폼
  • 지역
  • 게임회사
  • 출시시기

 

3. 데이터 EDA 및 전처리

16000개 정도의 데이터와 9개의 피쳐(feature)를 가지고있는 게임데이터입니다.

 

게임이름(Name), 사용된 플렛폼(Platform), 출시년도(Year), 장르(Genre)와 회사정보(Publisher)가 있으며 각각 북미,유럽,일본,그외 지역의 판매량(Sales)데이터가 있습니다.

<데이터 전처리>

object로 되어있는 판매량 데이터를 숫자형으로 변환시키고 K,M으로 표현된 숫자단위를 없애주어 단위를 통일시키는 전처리 작업을 하였습니다.

추가로 결측값을 처리와 연도데이터를 조정해주는 전처리를 하였습니다.

아래 코드는 숫자단위를 통일시켜주는 코드입니다.

판매량 데이터 숫자단위 통일 및 타입 변환

 

중요 데이터의 분포를 보기위해서 히스토그램을 그려보았습니다.

연도를 보면 2010년대까지는 게임시장이 계속해서 성장하다가 2010년 이후로 급격하게 꺽이는 모습을 볼 수 있습니다.

장르는 대체로 액션(Action), 스포츠(Sports), 슈팅(Shooting)게임의 인기가 있었던 것을 확인할 수 있습니다.

 

4. 특성공학(Feature engineering)

이후 분석에서 사용하기 위해서 전체 판매량(Global_Sales) 피쳐와 연도(Year) 피쳐를 만들었습니다.

 

5. 분석 및 결과

앞으로 출시할 게임을 설계하기 위해서 몇가지 질문을 해보고 이에 대해서 시각적인 자료와 통계적 분석으로 대답을 하면서 분석을 이어가보겠습니다.

 

  1. 지역별로 선호하는 게임장르가 있을까?
  2. 게임시장의 연도별 트랜드(장르, 플랫폼)는 어떠한가?
  3. 인기있는 게임은 어떤 특징들이 있는가?
  4. 닌텐도에서 새롭게 게임 출시를 한다면 어떨까?

이렇게 네가지의 질문에 대답하면서 최종적으로 결론을 도출해 보겠습니다.

 

5.1 - 지역별로 선호하는 게임장르가 있을까?

지역별 선호하는 게임장르를 알아보기 위해서 장르와 지역을 기준으로 판매량 그래프를 그려보았습니다.

대부분의 지역에서 액션과 스포츠, 슈팅게임 정도가 인기있는 것으로 보입니다.

특별히 주목할만한 부분은 일본지역(JP)에서 Role-playing장르가 인기있는 것을 시각적으로 확인할 수 있습니다.

일본지역에서 roleplaying 장르가 특별히 매출량이 많다

이것을 통계적으로도 의미있는 차이인지 검증해보고자 한다.

=> "일본(JP)에서 Role-playing 장르가 특별히 더 인기있는 장르인가?"
=> "일본의 출고량 분포는 다른지역의 출고량 분포와 다른가?"

위 그래프는 일본의 판매량분포(JP_Sales)전체 판매량분포(Global_Sales)를 그려보았습니다.

확실히 롤플레잉(Role-Playing) 장르만 튀어나와있습니다.

 

이제는 통계적으로 의미있는 차이인지 검증하기 위해서 카이제곱분포를 활용하여 적합도 검정(Goodness of fit test)을 해보았습니다.

적합도 검정이란 어떤 표본의 분포가 전체 모집단의 분포와 비슷한지 확인하는 검정방법입니다.

여기에서는 일본의 판매량분포(JP_Sales) 전체 판매량분포(Global_Sales)같은 분포인지 확인해보겠습니다.

귀무가설(H0) : 전체출고량(Global_Sales)의 분포와 일본지역(JP_Sales) 출고량의 분포의 차이가 없다.
대립가설(H1) : 전체출고량(Global_Sales)의 분포와 일본지역(JP_Sales) 출고량의 분포의 차이가 있다.

이런 가설을 설정해두고 카이제곱 적합도 검정을 해보았을때

statistic : 0.43548492275496625
p-value : 0.9999993398652639

p-value가 0.9999999로 낮은 유의수준에서도 귀무가설을 기각하지 못한다.

전체 판매량분포(Global_Sales)일본의 판매량분포(JP_Sales)에 차이가 없다는 귀무가설을 기각할 수 없고 

다시말해서 그림상으로는 일본지역의 Role-Playing인기가 특별히 좋은것처럼 보이나 통계적으로 의미있는 수준은 아니라는 결론이다.

 

이외에도 북미(NA_Sales), 유럽(EU_Sales), 기타(Other_Sales)지역의 분포와 비교를 해 보았을때도 비슷한 p-value를 보인다.

일본에 특정 장르에 대한 선호도는 통계적으로 없다!

 

5.2 - 게임시장의 트랜드(장르, 플렛폼)은 어떠한가?

 

우선 게임시장의 전체적인 흐름을 살펴보기 위해서 총 판매량의 추이를 그려보았다.

연도별 판매량을 보았을 때, 대략 10년주기로 특징(시작, 성장, 절정, 감소)이 나타나는것을 확인할 수 있었습니다.

 

그래서 10년단위로 장르별 판매량 비율을 살펴보았습니다.

1980년-1990년: (시작) platform 장르가 강세를 보이고 있다.  
1990년-2000년: (성장) Platform 장르의 비율이 낮아졌지만 다양한 장르에서 골고루 소비되기 시작한다.  
2000년-2010년: (절정) Action, sports 장르가 인기를 얻기 시작한다.  
2010년-2020년: (감소) 가장 인기있는 3가지 장르는 순서대로 1.Action 2.Shooter 3.Sport이다.  
(연대별 1위는 파란색으로 나타난다)

 

이번엔 각 장르별로 트랜드를 살펴보았습니다.

2000년대 이후로 Shooting, Sports, Action장르에서 급격한 성장이 이루어지고 최근에는 모두 감소하는 경향이 있는것을 확인할 수 있습니다.

 

반면, 1980~2000년대까지 게임시장을 이끌었던 Platfom, Role-Playing장르는 초반에는 곧잘 팔았으나 이후에 크게 성장하는 모습은 보이지 않았습니다.

 

위 그래프를 통해서 얻을 수 있는 인사이트는 시대별로 인기장르가 변한다는 것입니다.

이제는 이 가설을 통계적으로 유의한지 검증해보도록 하겠습니다.

 

이번에는 2 sample 카이제곱 검정을 사용해보겠습니다.

2 sample 카이제곱검정은 두 표본집단의 분포가 동일한 지에 대한 가설검정을 할때 사용합니다.

귀무가설 (H0): 두 표본집단은 연관이 없다. => 연대와 장르사이에 관련이 없다.(비디오 게임 장르의 트랜드는 변하지 않는다.)

대립가설 (H1): 두 표본집단은 연관이 있다. =>연대와 장르사이에 관련이 있다.(비디오 게임 장르의 트랜드는 변한다.)

이런 가설을 세워두고 검정을 해보았을때 

chi_square statistics : 120799884004.3224
p-value : 0

p-value가 0이므로 귀무가설을 기각할 수 있습니다.

두 표본집단은 연관이 없다. 즉, 비디오게임 시장에서 장르의 트랜드는 계속해서 변화한다고 볼 수 있습니다.

 

5.3 - 판매량이 많은 게임들은 어떤 특징들이 있는가?

판매량이 높은 순서대로 탑 100개의 출판회사, 장르, 플렛폼, 출시년도를 살펴보았습니다.

각각 top3를 살펴보면
출판회사 : Nintendo, Activision, Sony Computer Entertainment
장르 : Shooting, Platform, Role-Playing
플렛폼 : X360, Wii, DS
연대 : 2005-2010, 2010-2015, 2000-2005
이렇게 높은 출고량을 보여주고 있습니다.

 

5.4 - 닌텐도에서 새롭게 게임을 출시한다면 어떤 게임을 출시하는것이 좋을까?

위에서 살펴본 그래프 중에서 특히나 닌텐도(nintendo)의 판매량이 가장 앞도적으로 많은 것을 볼 수 있었습니다.

즉, 사람들은 이미 닌텐도 제품을 많이 사용해봤고 그래서 익숙하다고 생각을 할 수 있습니다.

따라서 닌텐도에서 새로운 게임을 출판하는 것이 성공가능성이 더 높다고 생각해보았습니다.

 

그렇다면 닌텐도(nintendo)에서 어떤 플랫폼과 지역, 장르의 비디오 게임을 만드는 것이 성공할 수 있을지 생각해보겠습니다.

또한 최근 닌텐도 게임회사의 최근 게임 출판 현황과 매출성적을 보고 출판시기를 생각해 볼 수도 있을 것 같습니다.

 

질문들을 정리해보겠습니다.

  1. 닌텐도가 주로 사용하는 플렛폼은?
  2. 닌텐도의 주력 장르는?
  3. 닌텐도가 가장 잘 팔리는 지역은?
  4. 닌텐도의 최근 게임 출판 현황은?
  5. 닌텐도의 최근 매출성적은?

 

이번에도 그래프를 그려보았습니다.

 

이제 그래프를 보고 위의 질문들에 대답해 보겠습니다.

  1. 닌텐도가 주로 사용하는 플렛폼은? => DS
  2. 닌텐도의 주력 장르는? => Platform, Role-Playing
  3. 닌텐도가 가장 잘 팔리는 지역은? => 북미(NA)
  4. 닌텐도의 최근 게임 출판 현황은? => 계속해서 줄어들고 있다
  5. 닌텐도의 최근 매출성적은? => 계속해서 줄어들고 있다.

6. 결론

  • 게임회사(Publisher) : nintendo
  • 플렛폼(Platform): DS
  • 출시지역: 북미(NA)지역
  • 출시시기: 최대한 빨리
  • 장르(Genre): Platform 혹은 Role-Playing
게임을 출시한다면 닌텐도(nintendo)회사를 통하여 DS플렛폼을 이용하여 Platform 혹은 Role-Playing 장르의 게임을 북미(NA)지역에 출시하는 것이 좋아보인다.
단, 최근 비디오게임 시장의 수요가 급격하게 감소하는 추세이므로 최대한 빨리 출시하는 것이 좋습니다.

 


 

읽어주셔서 감사합니다.

 

전체 코드 코렙링크

(https://github.com/aytekin827/AIB_sec1_project/blob/main/AI_03_%EC%A0%95%EB%AF%BC%EC%9E%AC_section1.ipynb)

728x90