본문 바로가기
Data·AI/R 데이터분석

009.한국인의 삶을 파악하라! (종교 유무에 따른 이혼율, 지역별 연령대 비율)

by hyun-am 2019. 5. 25.

1. 종교 유무에 따른 이혼율

 

종교 변수 검토 및 전처리하기

 

먼저 종교 변수를 전처리 하면 (종교를 가졌다면 1, 없으면 2, 무응답 9)

 

다음과 같은 값을 얻습니다.

 

 

결혼여부 변수 검토 및 전처리하기

먼저 marriage 변수에서 파생 변수를 만들겠습니다. 

(0 : 비해당, 1: 유배우, 2: 사별, 3: 이혼, 4: 별거, 5: 미혼, 6: 기타)

 

다음은 종교 유무에 따른 이혼율을 분석하기

 

먼저 종교 유무에 따른 이혼율 표를 만들겠습니다. 

 

다음은 연령대 및 종교 유무에 따른 이혼율을 분석하겠습니다.

 

먼저 연령대별 이혼율 표를 만들겠습니다. 

 

이것을 그래프로 만들면 아래와 같습니다. 앞에서 만든 표에서 초년생들은 이혼과 결혼은 매우 적어서 제외 시켰습니다.

 

 

 

다음은 연령대 및 종교 유무에 따른 이혼율 표를 만들겠습니다.

 

마지막으로 연령대 및 종교 유무에 따른 이혼율 그래프를 만들겠습니다.

이것을 통해 종교가 없는 중년이 종교가 있는 중년보다 이혼률이 2.5%정도 높다는 것을 알 수 있습니다. 

 

2. 지역별 연령대 비율(노년층이 많은 지역은 어디일까?)

 

먼저 code_region을 토대로 데이터 전처리를 합니다.

(1 : 서울, 2 : 인천/경기, 3 : 부산/경남/울산, 4 : 대구/경북, 5 : 대전/충남, 6 : 강원/충북, 7 : 광주/전남/전북/제주도)

 

그다음 code_region에 맞게 left_join( )을 해줍니다.

 

 

지역별 연령대 비율을 조사하기 위해 지역별 연령대별 비율표를 만들겠습니다.

이것을 한번 시각화 하겠습니다.

노년층 비율 높은 순으로 막대를 정렬하겠습니다.

 

이런식으로 새로 정렬된 값을 확인 할 수 있습니다.

 

이제 이것을 이용하여 그래프를 만들어 보겠습니다.

노년층 비율이 높은 순으로 정렬된 것을 확인 할 수 있습니다. 

 

마지막으로 연령대 순으로 막대 색깔 나열하기를 하겠습니다.

 

이런식으로 연령대에 factor( )타입으로 변형시키고 level을 줍니다.

 

그래프로 표현하면 아래와 같이 바뀐 모습을 확인 할 수 있습니다. 

 

 


 

위의 내용은 다음 책의 내용을 참고하여 작성하였습니다.
https://book.naver.com/bookdb/book_detail.nhn?bid=12256508

 

Do it! 쉽게 배우는 R 데이터 분석

통계, 프로그래밍을 1도 몰라도 데이터를 혼자서 다룰 수 있다! 데이터 분석 프로젝트 전 과정 수록!통계, 프로그래밍을 1도 몰라도 데이터를 혼자서 다룰 수 있다! 데이터 분석 프로젝트 전 과정 수록!데이터 분석을 처음 시작한 초보자도 어깨춤을 추며 데이터를 혼자 다룰 수 있게 한다는 강의가 책으로 출간되었다. 통계, 프로그래밍, 데이터 분석을 전혀 몰라도 「Do it! 쉽게 배우는 R 데이터 분석」을 통해 R로 최근 주목받고 있는 데이터 분석 기법들을

book.naver.com

 

댓글