본문 바로가기
Data·AI/R 데이터분석

001. R의 개념(R시작하기)

by hyun-am 2019. 3. 12.

 

1. R이 뭔가요 ? 




INDEX

  • R이란?
  • EDA란?
  • R을 어디에 쓰나요?
  • R을 활용한 사례들


R이란 ?

  • R이란 데이터를 분석하는 데 사용되는 소프트웨어입니다.
  • 수많은 데이터 분석 도구들 사이에서 큰 인기를 끌고 있으며 점유율도 높아지고 있습니다.

EDA란 ?
  • Exploratory data analysis의 줄임말로 데이터 입문시 많이 사용됩니다.
  • EDA 의사결정 단계
  1. 데이터 가지고 오기
  2. 데이터 모양 확인하기
  3. 데이터 타입 확인하기
  4. 데이터 기초 분석
  5. 데이터 크린징
  6. 데이터 시각화

※ 이것을 통합으로 의사 결정을 할 수 있습니다.


R을 어디에 쓰나요?
  • 많은 사람이 R을 사용하는 가장 큰 이유는 다양성 입니다.
  • 잘 다루면 어떤 형태의 데이터든 자유롭게 분석할 수 있습니다.
  • 여러가지 데이터 분석 사례들을 통해 R의 무궁무진한 가능성을 살필 수 있습니다.

R을 사용한 사례들 
  • 통계 분석 : 데이터의 특성을 살펴보는 기초 통계 분석부터 가설검정에 사용되는 고급 통계 분석 기법에 이르기까지 다양한 통계분석 가능
  • 머신러닝 모델링 : R로 랜덤 포레스트, SVM, 딥러닝 등 최신 머신러닝 알고리즘을 쉽게 활용 가능
  • 텍스트 마이닝 : TF를 추출하여 어느 단어가 자주 사용되는지 확인         ※ TF는 키워드 출현 빈도입니다.
  • 소셜 네트워크 분석 : 소셜 네트워크 서비스에서 어떤 사람들이 어떤 관계를 형성하는지, 퍼져나가는지 분석 할 수 있게 도와줍니다.
  • 지도 시각화 : 지도를 활용하여 각 시군구 별 범죄율등 쉽게 파악할 수 있습니다.
  • 주식 분석 : 온라인에서 주식 관련 데이터를 수집해 분석 할 수 있습니다. 실제 투자에 사용되는 투자 시스템 구축 가능 합니다.
  • 이미지 분석 : 사진, 그림 등의 이미지에서 속성을 추출해 데이터로 변환할 수 있습니다. 이것을 통해 이미지 식별같은 알고리즘을 개발하는데 사용할 수 있습니다.
  • 사운드 분석 : 이미지 분석과 마찬가지로 사운드를 데이터로 변환시켜 사운드 처리등 알고리즘을 개발할 수 있습니다.
  • 웹 애플리케이션 개발 : 데이터를 활용한 웹 애플리케이션을 쉽게 개발할 수 있습니다. 


※ 또한 전세계 데이터 분석가들이 많이 사용합니다. 왜냐하면 R은 사용자들끼리 활발하게 커뮤니티 활동을 할 수 있고, R을 사용하다 막히는 부분이 있을 때 온라인 커뮤니티에 질문을 올리면 비슷한 문제를 해결한 경험이 있는 사람들로부터 친절한 답변을 받을 수 있습니다.



댓글