앞에 나왔던 summary( ) 함수로는 최솟값, 1사분위수, 중앙값, 평균, 3사분위수, 최댓값까지 확인할 수 있지만
"psych" 패키지를 설치하고 로드한 후 describe( )함수를 이용하면 summary( )함수에서 이용한 것과 변수 개수, 관측치 수, 표준편차, 범위, 첨도, 왜도 까지 알 수 있습니다.
예를들면 summary 한 값은 아래 그림과 같습니다.
다음은 describe한 값입니다.
이것을 통해 summary로만 부족한 내용을 describe를 통해 보충해서 확인 할 수 있습니다.
다음은 "descr"패키지를 이용해 freq( ) 함수를 사용해서 빈도수를 확인시켜주는 함수를 만들겠습니다.
먼저 mpg데이터에 있는 자동차 브랜드의 빈도수를 파악하기 위해 다음과 같은 명령어를 사용했습니다.
결과값은 다음과 같습니다.
이것처럼 브랜드 이름과 빈도수 그리고 빈도수에 대한 퍼센트가 자세히 출력되는 것을 볼 수 있습니다. 이것을 통해
freq( ) 함수를 이용하면 다른 데이터의 범주형 데이터들도 빈도 비율을 구할 수 있다고 생각을 했습니다.
'Data·AI > R 데이터분석' 카테고리의 다른 글
006.한국인의 삶을 파악하라! (분석 준비하기, 성별에 따른 월급 차이) (0) | 2019.05.25 |
---|---|
005. 데이터 그래프 만들기 (0) | 2019.04.16 |
003. 데이터 파악하기 (0) | 2019.04.15 |
002. R의 '변수', '함수', '패키지' 이해하기 (0) | 2019.03.19 |
참고. R스튜디오 실행 오류 해결하기 (1) | 2019.03.15 |
댓글