006.한국인의 삶을 파악하라! (분석 준비하기, 성별에 따른 월급 차이)
1. 데이터 분석 준비하기 먼저 데이터는 깃허브(bit.ly/doit_rb)에서 Koweps_hpc10_2015_beta1.sav 파일로 존재하고 있습니다. 여기서 foreign 패키지는 SPSS, SAS, STATA 등 다양한 통계분석 소프트웨어의 파일을 불러올 수 있습니다. 그 후 read.spss( )를 이용해 복지패널데이터를 불러옵니다. 다음으로 데이터를 불러왔으니 데이터의 구조를 파악하는 head( ), tail( ), View( ), dim( ), str( ), summary( ), descr( )를 활용하겠습니다. 여기서 저는 summary( )와 descr( )을 사용했습니다. 이런식으로 최솟값, 최댓값, 1분위값, 중간값, 3분위값 등이 출력되는 것을 볼 수 있습니다. 그 후 간단한 사용..
2019. 5. 25.
004. psych패키지, descr패키지 사용하기
앞에 나왔던 summary( ) 함수로는 최솟값, 1사분위수, 중앙값, 평균, 3사분위수, 최댓값까지 확인할 수 있지만 "psych" 패키지를 설치하고 로드한 후 describe( )함수를 이용하면 summary( )함수에서 이용한 것과 변수 개수, 관측치 수, 표준편차, 범위, 첨도, 왜도 까지 알 수 있습니다. 예를들면 summary 한 값은 아래 그림과 같습니다. 다음은 describe한 값입니다. 이것을 통해 summary로만 부족한 내용을 describe를 통해 보충해서 확인 할 수 있습니다. 다음은 "descr"패키지를 이용해 freq( ) 함수를 사용해서 빈도수를 확인시켜주는 함수를 만들겠습니다. 먼저 mpg데이터에 있는 자동차 브랜드의 빈도수를 파악하기 위해 다음과 같은 명령어를 사용했습니..
2019. 4. 16.