본문 바로가기

데이터분석34

데이터 분석가가 되기위한 역량, 기술 데이터 분석가에게 필요한 기술 1. EDA 먼저 기본적으로 데이터 분석가에게 필요한 기술은 EDA를 알아야합니다. EDA란 탐색적 자료분석이라는 뜻으로 (Exploratory Data Analysis)의 줄임말 입니다. EDA는 6가지의 의사 결정 단계가 있는데 데이터 가지고오기 데이터 모양 확인하기 데이터 타입 확인하기 데이터 기초 분석 데이터 클린징 데이터 시각화 로 되어 있으며 이것을 통합해서 의사 결정을 할 수 있습니다. 2. 데이터에 대한 이해 먼저 데이터에 대한 이해가 필요하므로 RDBMS에서 사용하는 SQL에 대한 이해가 필요하고 Mongo DB와 같은 No SQL을 사용하는 데이터베이스를 위한 JSON에 대한 지식도 필요합니다. 이것은 EDA에서 2번(데이터 모양 확인하기)와 3번(데이터 .. 2020. 2. 6.
004. AWS의 서비스들 AWS의 서비스들 아마존 웹서비스의 서비스들은 다양한데 이 중에서 대표적인 컴퓨팅, 스토리지 데이터베이서, 네트워크 그리고 최근 각광받는 빅데이터 분석, 인공지능 서비스 중심으로 살펴보겠습니다. 더 많은 AWS서비스와 타회사의 클라우드 서비스를 보려면 아래 링크로 가시길 바랍니다. https://hyun-am-coding.tistory.com/entry/4%EB%8C%80%ED%81%B4%EB%9D%BC%EC%9A%B0%EB%93%9CAWS-Amazon-Bluemix-IBM-Azure-MS-Google-Cloud-Platform-Google 4대클라우드(AWS-Amazon, IBM Cloud-IBM, Azure-MS, Google Cloud Platform-Google) 4대클라우드(AWS-Amazon,.. 2019. 10. 13.
통계 분석 기법을 이용하기 위한 가설 검정 먼저 통계적 가설 검정을 하기전에 통계 분석 절차를 설명하겠습니다. 통계 분석 절차 1. 분석 방법 선정 2. 분석하고자 하는 목적에 따른 귀무가설(영가설)과 대립가설 설정 3. 분석도구(SPSS,R등) 검정 통계량 실행 및 확인 4. 유의수준(a) 결정 : 0.1, 0.05, 0.01 5. 유의확률(P) 확인 6. 유의확률과 유의수준 비교 ( 2019. 5. 28.
009.한국인의 삶을 파악하라! (종교 유무에 따른 이혼율, 지역별 연령대 비율) 1. 종교 유무에 따른 이혼율 종교 변수 검토 및 전처리하기 먼저 종교 변수를 전처리 하면 (종교를 가졌다면 1, 없으면 2, 무응답 9) 다음과 같은 값을 얻습니다. 결혼여부 변수 검토 및 전처리하기 먼저 marriage 변수에서 파생 변수를 만들겠습니다. (0 : 비해당, 1: 유배우, 2: 사별, 3: 이혼, 4: 별거, 5: 미혼, 6: 기타) 다음은 종교 유무에 따른 이혼율을 분석하기 먼저 종교 유무에 따른 이혼율 표를 만들겠습니다. 다음은 연령대 및 종교 유무에 따른 이혼율을 분석하겠습니다. 먼저 연령대별 이혼율 표를 만들겠습니다. 이것을 그래프로 만들면 아래와 같습니다. 앞에서 만든 표에서 초년생들은 이혼과 결혼은 매우 적어서 제외 시켰습니다. 다음은 연령대 및 종교 유무에 따른 이혼율 표를.. 2019. 5. 25.
008.한국인의 삶을 파악하라! (직업별 월급차이, 성별 직업 빈도) 1. 직업별 월급차이(어떤 직업이 월급을 가장 많이 받을까?) 먼저 깃허브(bit.ly/doit_rc)에서 Koweps_Codebook.xlsx를 다운로드해 readxl( )로 불러오겠습니다. 그 후 left_join을 이용해 job 변수를 welfare에 결합합니다. code_job을 기준으로 join했습니다. 아래와 같은 명령어를 실행해 잘 결합됐는지 확인하겠습니다. 이제 직업별 월급 차이를 분석하겠습니다. 먼저 직업별 월급 평균표를 만들겠습니다. 직업이 없거나 월급이 없으면 조사 대상이 아니므로 is.na( )를 통해 제외시키겠습니다. 어떤 직업이 월급을 많이 받는지 알아보기 위해 월급을 내림차순으로 정렬하고 상위 10개를 출력합니다. 그 후 그래프를 만드는데 coord_flip( )를 이용해 x축.. 2019. 5. 25.
SKT·대구시·대구경찰, 유동인구 빅데이터 활용 안전사회 조성한다 먼저 데이터 분석을 활용하면 어떤 일에서 잘 활용할 수 있을까 생각했는데 대구경찰이 유동인구 빅데이터를 활용하여 범죄가 발생하면 빠른 대처를 할 수 있게 도움을 줄 수 있구나 라고 생각했습니다. 순찰 노선 개선 통해 출동시간 단축 ∙∙∙ 범죄현장 골든타임 확보 및 선제 대응 기대와 인력∙장비 효율적 배치로 순찰 비용 절감하고 국민의 체감 안전도 향상에 기여 특히, 백왕흠 대구시 스마트시티과장은 “이번 협업을 계기로 빅데이터 분석을 통해 대구광역시의 안전 사각지대를 줄이기 위해 지속적인 노력을 기울일 예정”이라고 밝혔혔으며, 유오재 대구지방경찰청 생활안전과장은 “빅데이터 분석을 적용해 인력과 장비를 보다 효율적으로 활용하고, 신고출동시간을 단축해 국민이 느끼는 체감 안전도를 높일 수 있을 것으로 기대한다”.. 2019. 5. 25.