본문 바로가기
Data·AI/R 데이터분석

007.한국인의 삶을 파악하라! (나이-월급, 연령대-월급, 연령대 및 성별 월급 차이)

by hyun-am 2019. 5. 25.

1. 나이 - 월급 (몇 살 때 월급을 가장 많이 받을까?)

 

먼저 나이라는 파생변수를 새로 만들겠습니다. 

 

summary( )qplot( )를 이용하여 age의 값을 분석하겠습니다.

 

 

 

그 후 나이와 월급의 관계를 분석하기 위해 나이에 따른 월급 평균표를 만들겠습니다.

 

실행 시키면 아래와 같은 값이 나옵니다.

 

 

이렇게 만든 평균표를 이제 그래프로 만들겠습니다.

 

그래프를 보면 20대 초반에는 100만원 초반대 월급을 받고 40~50대 무렵 300만원대 월급을 받고 60대 이후에는 20대보다 월급을 적게 받는 다는 것을 알 수 있습니다.

 

2. 연령대 - 월급 (어떤 연령대의 월급이 가장 많을까?)

 

먼저 연령대를 만들기위해 초년(30세 미만), 중년(30~59세), 노년(60세 이상)을 만들겠습니다.

 

그 후 연령대별 월급 평균표를 만들겠습니다.

 

아래와 같이 중년(281만원), 노년(125만원), 초년(164만원)이라는 값이 나왔습니다.

 

그 후 그래프를 통해 표현하였습니다.

 

※ 여기서 막대들의 변수들은 알파벳 순으로 정렬 되어 있으므로 scale_x_discrete(limits = c( ))에서 범주를 지정하였습니다.

 

 

3. 연령대 및 성별 월급 차이

 

먼저 연령대 및 성별 월급 평균표를 만들겠습니다. 

 

그다음 시각화를 위해 그래프를 만들겠습니다. 

 

※ 여기서 position "dodge"를 이용하면 막대를 분리시켜 볼때 더욱 좋습니다.

이것을 보면 모든 성별에서 남자가 월급을 더 많이 받고 특히 중년층에서 큰 차이를 보인다는 점을 알 수 있습니다.

 

다음은 연령대로 구분하지 않고 나이대로 구분하여 시각화를 하겠습니다.

 

먼저 성별 연령별 월급 평균표를 만들겠습니다. 

 

head(sex_age)

그래프로 만들면 아래와 같습니다.

 

 

위의 내용은 다음 책의 내용을 참고하여 작성하였습니다.

https://book.naver.com/bookdb/book_detail.nhn?bid=12256508

 

 

Do it! 쉽게 배우는 R 데이터 분석

통계, 프로그래밍을 1도 몰라도 데이터를 혼자서 다룰 수 있다! 데이터 분석 프로젝트 전 과정 수록!통계, 프로그래밍을 1도 몰라도 데이터를 혼자서 다룰 수 있다! 데이터 분석 프로젝트 전 과정 수록!데이터 분석을 처음 시작한 초보자도 어깨춤을 추며 데이터를 혼자 다룰 수 있게 한다는 강의가 책으로 출간되었다. 통계, 프로그래밍, 데이터 분석을 전혀 몰라도 「Do it! 쉽게 배우는 R 데이터 분석」을 통해 R로 최근 주목받고 있는 데이터 분석 기법들을

book.naver.com

 

댓글