1. 직업별 월급차이(어떤 직업이 월급을 가장 많이 받을까?)
먼저 깃허브(bit.ly/doit_rc)에서 Koweps_Codebook.xlsx를 다운로드해 readxl( )로 불러오겠습니다.
그 후 left_join을 이용해 job 변수를 welfare에 결합합니다.
code_job을 기준으로 join했습니다. 아래와 같은 명령어를 실행해 잘 결합됐는지 확인하겠습니다.
이제 직업별 월급 차이를 분석하겠습니다.
먼저 직업별 월급 평균표를 만들겠습니다.
직업이 없거나 월급이 없으면 조사 대상이 아니므로 is.na( )를 통해 제외시키겠습니다.
어떤 직업이 월급을 많이 받는지 알아보기 위해 월급을 내림차순으로 정렬하고 상위 10개를 출력합니다.
그 후 그래프를 만드는데 coord_flip( )를 이용해 x축을 알아보기 쉬운 형태로 시각화 하겠습니다.
다음은 한번 하위 10위 까지 추출하는 bottom10과 그래프를 만들겠습니다.
2. 성별 직업 빈도(성별로 어떤 직업이 가장 많을까?)
먼저 성별 직업 빈도표를 만들겠습니다.
남성 직업 빈도 상위 10개 추출 빈도표 입니다.
여성 직업 빈도 상위 10개 추출 빈도표 입니다.
남성 직업 빈도표
여성 직업 빈도표
위의 내용은 다음 책의 내용을 참고하여 작성하였습니다.
https://book.naver.com/bookdb/book_detail.nhn?bid=12256508
'Data·AI > R 데이터분석' 카테고리의 다른 글
R. 변수와 데이터객체(구조) 유형 - 기본 데이터 구조 (0) | 2020.08.20 |
---|---|
009.한국인의 삶을 파악하라! (종교 유무에 따른 이혼율, 지역별 연령대 비율) (0) | 2019.05.25 |
007.한국인의 삶을 파악하라! (나이-월급, 연령대-월급, 연령대 및 성별 월급 차이) (0) | 2019.05.25 |
006.한국인의 삶을 파악하라! (분석 준비하기, 성별에 따른 월급 차이) (0) | 2019.05.25 |
005. 데이터 그래프 만들기 (0) | 2019.04.16 |
댓글