본문 바로가기
Data·AI/R 데이터분석

002. R의 '변수', '함수', '패키지' 이해하기

by hyun-am 2019. 3. 19.

002. R의 '변수', '함수', '패키지' 이해하기


Index

  • '변수' 이해하기
  • '함수' 이해하기
  • '패키지' 이해하기


1. '변수' 이해하기



1.1 변수 개념


변수는 '변하는 수'입니다. 그리고 다양한 값을 지니고 있다는 특징이 있습니다. 


변수는 데이터 분석의 대상입니다. 왜냐하면 다양한 데이터들을 이용해서 변수 간에 어떤 관계가 있는지 파악할 수 있습니다.


하지만 변수와 다르게 상수는 분석할 게 없습니다. 왜냐하면 다른 속성들과는 달리 고정된 값을 가지고 있기 때문입니다.



1.2 변수 생성하기





※ 실행할 때 단축키는 ctrl + enter 입니다. 



1.3 여러 값으로 구성된 변수 만들기


변수에는 여러개의 값을 넣을 수도 있습니다. c( ) 함수는 변수에 여러 개의 값을 넣는 기능입니다. 


※ 참고로 c( ) 함수는 합치다라는 뜻의 'Combine'의 머리글자입니다.




1. c( )함수를 이용해 다섯개 숫자 만들기



2. 콜론( : )을 이용해 시작과 마지막을 입력해 1씩 증가하는 변수 생성



3. seq( )함수로도 연속된 값을 만들 수 있습니다.



4. by 파라미터를 이용하면 일정한 간격을 줄 수 있습니다.




1.4 문자로 된 변수 만들기



1. str1에 소문자 a를 넣어 변수를 만들어 보겠습니다.



2. 문자 변수는 여러개의 문자로 구성된 단어, 여러개의 단어로 구성된 문장을 넣을 수 있고, 띄어쓰기나 특수문자를 넣을 수도 있습니다.




3. 변수를 여러 개의 숫자로 만들었던 것처럼 c( ) 함수를 이용하면 여러 개의 문자로 구성된 변수를 만들 수 있습니다.




2. '함수' 이해하기


2.1 데이터 분석은 함수로 시작해 함수로 끝난다.


데이터 분석은 함수를 이용해서 변수를 조작하는 일이라고 설명할 수 있다. 따라서 데이터 분석을 잘하기 위해서 함수들의 기능과 조작 방법을 익히고, 능숙하게 다뤄야합니다. 그래야 의도한 대로 데이터를 분석할 수 있게 됩니다.


2.2 숫자를 다루는 함수 이용하기


1. 평균을 구하는 함수인 mean( )을 알아보겠습니다.




2. 위와 같은 방식으로 max( )를 이용해 최댓값을 구하고, min( )을 이용해 최솟값을 구할 수 있습니다. 



2.3 문자를 다루는 함수 이용하기


1. 위에 나와있는 str5를 활용하여 paste( )에 넣어 하나로 합칩니다. 이때 collapse = " , "을 입력해 단어들을 쉼표로 구별하게 만듭니다.





2. 함수의 옵션 설정하기 - 파라미터

 





앞에서 paste( )를 이용할 때 collapse = " , "를 사용해 했지만 빈칸으로도 할 수 잇습니다. 


collapse처럼 함수의 옵션을 설정하는 명령어를 '파라미터(parameter)' 또는 '매개변수'라고 합니다. 함수들은 저마다 다른 기능을 하는 파라미터를 가지고 있습니다.  



3. 함수의 결과물로 새 변수 만들기


함수의 결과물을 바로 출력할 수 있지만, 새 변수에 집어 넣을 수도 있습니다. 





3. '패키지' 이해하기


3.1 패키지란? 

 

여러개의 함수를 가진 꾸러미라고 표현할 수 있으며, 하나의 패키지 안에는 다양한 함수들이 들어 있습니다.


먼저 다양한 함수들을 사용하려면 그것에 맞는 패키지를 설치해야합니다.


예를 들면 ggplot2라는 패키지를 설치하면 ggplot( ), qplot( ), geom_histogram( ) 등 수십 가지 그래프 관련 함수를 사용할 수 있습니다.


3.2 패키지 설치하기. 


먼저 패키지를 설치 후 사용 순서는


※ 패키지 설치하기 → 패키지 로드하기 → 함수 사용하기이 순서대로 진행합니다.


패키지는 한 번만 설치하면 되지만 패키지를 로드하는 작업은 R 스튜디오를 새로 시작할 때마다 반복해야 합니다.


만약 로드하지 않은채로 실행하면 함수를 사용할 수 없습니다.


3.2.1 ggplot2 패키지설치하기


패키지를 설치할때는 install.packages( )를 이용합니다. 괄호 안에 설치할 패키지의 이름에는 반드시 따옴표를 넣어야 합니다.




3.2.2 library( )로 패키지 로드하기



3.2.3 함수 사용하기 패키지를 로드하고 그곳에 있는 함수인 qplot( )함수를 이용해서 간단한 빈도 막대그래프를 만들어 보겠습니다. 




실행하면 다음과 같은 막대 그래프가 출력됩니다. 








댓글