본문 바로가기

Data·AI62

R. 데이터셋 로딩하기 - 샘플데이터셋 데이터셋 로딩하기 R 기본(base) 패키지 샘플데이터셋 로딩하기 먼저 현재 메모리에 로딩된 패키지 목록을 확인하겠습니다. search() 그러면 다음과 같은 패키지들이 설치 되어 있음을 확인할 수 있습니다. 만약 데이터셋 패키지에 대한 도움말을 조회하고 싶으면 다음과 같은 명령어를 쓰면 됩니다. help(package = 패키지명) library(help = 패키지명) datasets에 있는 샘플데이터 종류 - iris : 불꽃 품종 특성 데이터 입니다. - airquality : 뉴욕시 대기질 측정 데이터 입니다. - mtcars : 자동차 연비평가 데이터 입니다. 데이터에 대한 자세한 정보를 알고싶으면 data(데이터명)을 이용하거나 help(데이터명)을 사용하면 됩니다. ggplot2에 있는 샘플.. 2020. 8. 21.
R. 변수와 데이터객체(구조) 유형 - 복합 데이터 구조 변수와 데이터객체(구조) 유형 복합 데이터 구조 객체유형 요소(원소) 차원 데이터 종류(동질성/이질성) 관련코드(함수) 팩터(factor) 단수/복수 1차원 숫자/문자/논리 유형 중 단일 유형으로만 구성 x 단, 변수(열,컬럼,필드)별로 단일 유형으로만 구성 x 단, 요소별로 단일한 데이터 유형으로만 구성 x 2020. 8. 20.
R. 변수와 데이터객체(구조) 유형 - 기본 데이터 구조 변수와 데이터객체(구조) 유형 기본 데이터 구조 객체 유형 요소 차원 데이터 종류(동질성/이질성) 관련 코드(함수) 스칼라(scalar) 단수 1차원 숫자/문자/논리 유형 중의 한 가지 단수 데이터 x ←3 벡터(vector) 단수/복수 1차원 숫자/문자/논리 유형 중의 단일 유형으로만 구성 x ←c( ) 행렬(matrix) 단수/복수 2차원 숫자/문자/논리 유형 중의 단일 유형으로만 구성 x←matrix() 배열(array) 단수/복수 3차원 숫자/문자/논리 유형 중의 단일 유형으로만 구성 x←array() 스칼라 데이터 생성 a 2020. 8. 20.
데이터 모델링 및 데이터 탐색 모델링이란 문제해결에 관련된 변수를 선별하여 변수간 관계를 구조화된 그림(모형•모델)으로 형상화(모델링, 모형화)하는 작업이며, 문제 해결 과정및 목표, 자료 수집 가공및 처리를 위한 변수들로 구성됩니다. 데이터 분석 모델링(모형화) 문제 해결 과정 및 목표 변수 성과, 반응, 결과, 종속 변수 : 분석을 하는 궁극적인 이유와 목표에 해당하는 변수로서 적정 기준보다 높거나 낮아서 문제가 발생 영향, 투입, 예측, 설명, 독립 변수 : 종속변수의 상태를 적정 기준보다 높거나 낮게 만들어 문제상황을 발생시키는 원인이 되는 변수 조절, 상황, 교란, 혼동 변수 : 독립변수와 종속변수 간의 관계를 특정한 조건일 때 관계의 강도나 방향을 변화시키는 변수 매개 변수 : 독립변수와 종속변수 간에 직접적인 관계 사이에.. 2020. 8. 17.
다양한 공공데이터 포털 국내 공공데이터 포털 정부부처 및 각급기관에서 발생하는 다양한 공공데이터를 통합해서 제공하는 공공부분 데이터포탈에서 주제별 및 형식 별 필요 데이터를 무료로 다운받을 수 있습니다. 공공데이터포털(www.data.go.kr) 공공기관이 생성 또는 취득하여 관리하고 있는 공공데이터를 한 곳에서 검색 및 다운로드 받는 통합 창구 사이트 입니다. 공공데이터 포털 국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(Datase www.data.go.kr 서울 열린데이터 광장(data.seoul.go.kr) 서울시민의 생활과 밀접한 교통, 문화, 공간 등 사회∙경제적 사용가치가 높은 서.. 2020. 8. 12.
다양한 데이터셋 파일유형 데이터셋 이란 데이터셋은 행과 열이라는 구조를 가지고 있는지, 사람과 분석도구가 처리하기 용이한지에 따라 정형, 반정형, 비정형 데이터셋으로 구별할 수 있으며, (R과 파이썬 등 다양한 분석도구)는 다양한 유형의 데이터셋 파일 포맷을 다룰 수 있습니다. 정형 데이터 셋(사람들이 이해하기 좋은 형태) 플레인 텍스트 파일 : 간단한 메모장 파일 형식으로 특별한 전용 프로그램 없이 쉽게 오픈 할 수 있습니다. 엑셀 파일 : 엑셀의 시트 단위로 다양한 주제의 개별 데이터셋을 저장해 놓고, 필요한 시트를 로딩해서 사용 상용 분석 SW파일 : SPSS, SPSS, State등 상용 분석 SW에서 다루는 전용 데이터셋 파일 DB 파일 : 오라클, MySQL 등 데이터베이스 관리 SW에서 사용하는 파일 포맷 반정형 데.. 2020. 8. 12.