본문 바로가기

Data·AI/R 데이터분석22

R. 데이터셋 로딩하기 - Excel, JSON, 외부링크 데이터 데이터셋 로딩하기 Excel데이터 로드하기 먼저 Excel 데이터를 로드하기 위해 다음과 같은 패키지를 설치하고 메모리에 로드하겠습니다. install.packages('readxl') library(readxl) 엑셀을 보면 하나의 시트가 이루어 진것이 아니라 다양한 시트들로 구성되어 있습니다. 여기 library에서 excel_sheets('파일이름')을 이용하면 엑셀 내부에 어떤 시트가 있는지 확인할 수 있습니다. 다음과 같은 파일의 시트 목록을 조회하겠습니다. excel_sheets('customer.xlsx') 그러면 다음과 같은 이름을 가진 두개의 시트가 있다는 것을 확인할 수 있습니다. 먼저 mycustomer시트의 데이터를 로딩하겠습니다. 1. mycustomer 시트 로드하기 cs_xl 2020. 8. 21.
R. 데이터셋 로딩하기 - 플레인 텍스트 파일 데이터셋 로딩하기 먼저 아래와 같은 명령어를 통해 현재 작업 경로를 확인하고 변경하겠습니다. getwd() setwd('현재 작업하고 있는 경로') 저는 setwd에 제가 작업하는 주소가 /Users/hyeon-am/Desktop/DataAnalysis/R/R_Test여서 이 주소를 넣었습니다. 그 후 로딩대상 플레인 텍스트 셋의 파일 인코딩 형식을 파악하기위해 다음과 같은 패키지를 설치한 후 메모리에 로드했습니다. install.packages('readr') library(readr) 그러면 guess_encoding('파일명') 이라는 명령어를 통해 해당 파일의 정보를 확인할 수 있습니다. 먼저 customer.csv라는 파일을 기본 로딩하겠습니다. cs 2020. 8. 21.
R. 데이터셋 로딩하기 - 샘플데이터셋 데이터셋 로딩하기 R 기본(base) 패키지 샘플데이터셋 로딩하기 먼저 현재 메모리에 로딩된 패키지 목록을 확인하겠습니다. search() 그러면 다음과 같은 패키지들이 설치 되어 있음을 확인할 수 있습니다. 만약 데이터셋 패키지에 대한 도움말을 조회하고 싶으면 다음과 같은 명령어를 쓰면 됩니다. help(package = 패키지명) library(help = 패키지명) datasets에 있는 샘플데이터 종류 - iris : 불꽃 품종 특성 데이터 입니다. - airquality : 뉴욕시 대기질 측정 데이터 입니다. - mtcars : 자동차 연비평가 데이터 입니다. 데이터에 대한 자세한 정보를 알고싶으면 data(데이터명)을 이용하거나 help(데이터명)을 사용하면 됩니다. ggplot2에 있는 샘플.. 2020. 8. 21.
R. 변수와 데이터객체(구조) 유형 - 복합 데이터 구조 변수와 데이터객체(구조) 유형 복합 데이터 구조 객체유형 요소(원소) 차원 데이터 종류(동질성/이질성) 관련코드(함수) 팩터(factor) 단수/복수 1차원 숫자/문자/논리 유형 중 단일 유형으로만 구성 x 단, 변수(열,컬럼,필드)별로 단일 유형으로만 구성 x 단, 요소별로 단일한 데이터 유형으로만 구성 x 2020. 8. 20.
R. 변수와 데이터객체(구조) 유형 - 기본 데이터 구조 변수와 데이터객체(구조) 유형 기본 데이터 구조 객체 유형 요소 차원 데이터 종류(동질성/이질성) 관련 코드(함수) 스칼라(scalar) 단수 1차원 숫자/문자/논리 유형 중의 한 가지 단수 데이터 x ←3 벡터(vector) 단수/복수 1차원 숫자/문자/논리 유형 중의 단일 유형으로만 구성 x ←c( ) 행렬(matrix) 단수/복수 2차원 숫자/문자/논리 유형 중의 단일 유형으로만 구성 x←matrix() 배열(array) 단수/복수 3차원 숫자/문자/논리 유형 중의 단일 유형으로만 구성 x←array() 스칼라 데이터 생성 a 2020. 8. 20.
009.한국인의 삶을 파악하라! (종교 유무에 따른 이혼율, 지역별 연령대 비율) 1. 종교 유무에 따른 이혼율 종교 변수 검토 및 전처리하기 먼저 종교 변수를 전처리 하면 (종교를 가졌다면 1, 없으면 2, 무응답 9) 다음과 같은 값을 얻습니다. 결혼여부 변수 검토 및 전처리하기 먼저 marriage 변수에서 파생 변수를 만들겠습니다. (0 : 비해당, 1: 유배우, 2: 사별, 3: 이혼, 4: 별거, 5: 미혼, 6: 기타) 다음은 종교 유무에 따른 이혼율을 분석하기 먼저 종교 유무에 따른 이혼율 표를 만들겠습니다. 다음은 연령대 및 종교 유무에 따른 이혼율을 분석하겠습니다. 먼저 연령대별 이혼율 표를 만들겠습니다. 이것을 그래프로 만들면 아래와 같습니다. 앞에서 만든 표에서 초년생들은 이혼과 결혼은 매우 적어서 제외 시켰습니다. 다음은 연령대 및 종교 유무에 따른 이혼율 표를.. 2019. 5. 25.