1. 종교 유무에 따른 이혼율
종교 변수 검토 및 전처리하기
먼저 종교 변수를 전처리 하면 (종교를 가졌다면 1, 없으면 2, 무응답 9)
다음과 같은 값을 얻습니다.
결혼여부 변수 검토 및 전처리하기
먼저 marriage 변수에서 파생 변수를 만들겠습니다.
(0 : 비해당, 1: 유배우, 2: 사별, 3: 이혼, 4: 별거, 5: 미혼, 6: 기타)
다음은 종교 유무에 따른 이혼율을 분석하기
먼저 종교 유무에 따른 이혼율 표를 만들겠습니다.
다음은 연령대 및 종교 유무에 따른 이혼율을 분석하겠습니다.
먼저 연령대별 이혼율 표를 만들겠습니다.
이것을 그래프로 만들면 아래와 같습니다. 앞에서 만든 표에서 초년생들은 이혼과 결혼은 매우 적어서 제외 시켰습니다.
다음은 연령대 및 종교 유무에 따른 이혼율 표를 만들겠습니다.
마지막으로 연령대 및 종교 유무에 따른 이혼율 그래프를 만들겠습니다.
이것을 통해 종교가 없는 중년이 종교가 있는 중년보다 이혼률이 2.5%정도 높다는 것을 알 수 있습니다.
2. 지역별 연령대 비율(노년층이 많은 지역은 어디일까?)
먼저 code_region을 토대로 데이터 전처리를 합니다.
(1 : 서울, 2 : 인천/경기, 3 : 부산/경남/울산, 4 : 대구/경북, 5 : 대전/충남, 6 : 강원/충북, 7 : 광주/전남/전북/제주도)
그다음 code_region에 맞게 left_join( )을 해줍니다.
지역별 연령대 비율을 조사하기 위해 지역별 연령대별 비율표를 만들겠습니다.
이것을 한번 시각화 하겠습니다.
노년층 비율 높은 순으로 막대를 정렬하겠습니다.
이런식으로 새로 정렬된 값을 확인 할 수 있습니다.
이제 이것을 이용하여 그래프를 만들어 보겠습니다.
노년층 비율이 높은 순으로 정렬된 것을 확인 할 수 있습니다.
마지막으로 연령대 순으로 막대 색깔 나열하기를 하겠습니다.
이런식으로 연령대에 factor( )타입으로 변형시키고 level을 줍니다.
그래프로 표현하면 아래와 같이 바뀐 모습을 확인 할 수 있습니다.
위의 내용은 다음 책의 내용을 참고하여 작성하였습니다.
https://book.naver.com/bookdb/book_detail.nhn?bid=12256508
'Data·AI > R 데이터분석' 카테고리의 다른 글
R. 변수와 데이터객체(구조) 유형 - 복합 데이터 구조 (0) | 2020.08.20 |
---|---|
R. 변수와 데이터객체(구조) 유형 - 기본 데이터 구조 (0) | 2020.08.20 |
008.한국인의 삶을 파악하라! (직업별 월급차이, 성별 직업 빈도) (0) | 2019.05.25 |
007.한국인의 삶을 파악하라! (나이-월급, 연령대-월급, 연령대 및 성별 월급 차이) (0) | 2019.05.25 |
006.한국인의 삶을 파악하라! (분석 준비하기, 성별에 따른 월급 차이) (0) | 2019.05.25 |
댓글