본문 바로가기
Data·AI/R 데이터분석

008.한국인의 삶을 파악하라! (직업별 월급차이, 성별 직업 빈도)

by hyun-am 2019. 5. 25.

1. 직업별 월급차이(어떤 직업이 월급을 가장 많이 받을까?)

 

먼저 깃허브(bit.ly/doit_rc)에서 Koweps_Codebook.xlsx를 다운로드해 readxl( )로 불러오겠습니다.

 

그 후 left_join을 이용해 job 변수를 welfare에 결합합니다. 

 

code_job을 기준으로 join했습니다. 아래와 같은 명령어를 실행해 잘 결합됐는지 확인하겠습니다.

 

이제 직업별 월급 차이를 분석하겠습니다.

먼저 직업별 월급 평균표를 만들겠습니다.

직업이 없거나 월급이 없으면 조사 대상이 아니므로 is.na( )를 통해 제외시키겠습니다.

 

어떤 직업이 월급을 많이 받는지 알아보기 위해 월급을 내림차순으로 정렬하고 상위 10개를 출력합니다.

 

 

그 후 그래프를 만드는데 coord_flip( )를 이용해 x축을 알아보기 쉬운 형태로 시각화 하겠습니다.

 

다음은 한번 하위 10위 까지 추출하는 bottom10과 그래프를 만들겠습니다.

 

 

 

 

2. 성별 직업 빈도(성별로 어떤 직업이 가장 많을까?)

 

먼저 성별 직업 빈도표를 만들겠습니다. 

 

남성 직업 빈도 상위 10개 추출 빈도표 입니다.

여성 직업 빈도 상위 10개 추출 빈도표 입니다. 

남성 직업 빈도표 

여성 직업 빈도표

 

위의 내용은 다음 책의 내용을 참고하여 작성하였습니다.
https://book.naver.com/bookdb/book_detail.nhn?bid=12256508
 

Do it! 쉽게 배우는 R 데이터 분석

통계, 프로그래밍을 1도 몰라도 데이터를 혼자서 다룰 수 있다! 데이터 분석 프로젝트 전 과정 수록!통계, 프로그래밍을 1도 몰라도 데이터를 혼자서 다룰 수 있다! 데이터 분석 프로젝트 전 과정 수록!데이터 분석을 처음 시작한 초보자도 어깨춤을 추며 데이터를 혼자 다룰 수 있게 한다는 강의가 책으로 출간되었다. 통계, 프로그래밍, 데이터 분석을 전혀 몰라도 「Do it! 쉽게 배우는 R 데이터 분석」을 통해 R로 최근 주목받고 있는 데이터 분석 기법들을

book.naver.com

 

댓글