본문 바로가기

Data·AI61

SKT·대구시·대구경찰, 유동인구 빅데이터 활용 안전사회 조성한다 먼저 데이터 분석을 활용하면 어떤 일에서 잘 활용할 수 있을까 생각했는데 대구경찰이 유동인구 빅데이터를 활용하여 범죄가 발생하면 빠른 대처를 할 수 있게 도움을 줄 수 있구나 라고 생각했습니다. 순찰 노선 개선 통해 출동시간 단축 ∙∙∙ 범죄현장 골든타임 확보 및 선제 대응 기대와 인력∙장비 효율적 배치로 순찰 비용 절감하고 국민의 체감 안전도 향상에 기여 특히, 백왕흠 대구시 스마트시티과장은 “이번 협업을 계기로 빅데이터 분석을 통해 대구광역시의 안전 사각지대를 줄이기 위해 지속적인 노력을 기울일 예정”이라고 밝혔혔으며, 유오재 대구지방경찰청 생활안전과장은 “빅데이터 분석을 적용해 인력과 장비를 보다 효율적으로 활용하고, 신고출동시간을 단축해 국민이 느끼는 체감 안전도를 높일 수 있을 것으로 기대한다”.. 2019. 5. 25.
007.한국인의 삶을 파악하라! (나이-월급, 연령대-월급, 연령대 및 성별 월급 차이) 1. 나이 - 월급 (몇 살 때 월급을 가장 많이 받을까?) 먼저 나이라는 파생변수를 새로 만들겠습니다. summary( )와 qplot( )를 이용하여 age의 값을 분석하겠습니다. 그 후 나이와 월급의 관계를 분석하기 위해 나이에 따른 월급 평균표를 만들겠습니다. 실행 시키면 아래와 같은 값이 나옵니다. 이렇게 만든 평균표를 이제 그래프로 만들겠습니다. 그래프를 보면 20대 초반에는 100만원 초반대 월급을 받고 40~50대 무렵 300만원대 월급을 받고 60대 이후에는 20대보다 월급을 적게 받는 다는 것을 알 수 있습니다. 2. 연령대 - 월급 (어떤 연령대의 월급이 가장 많을까?) 먼저 연령대를 만들기위해 초년(30세 미만), 중년(30~59세), 노년(60세 이상)을 만들겠습니다. 그 후 연령.. 2019. 5. 25.
006.한국인의 삶을 파악하라! (분석 준비하기, 성별에 따른 월급 차이) 1. 데이터 분석 준비하기 먼저 데이터는 깃허브(bit.ly/doit_rb)에서 Koweps_hpc10_2015_beta1.sav 파일로 존재하고 있습니다. 여기서 foreign 패키지는 SPSS, SAS, STATA 등 다양한 통계분석 소프트웨어의 파일을 불러올 수 있습니다. 그 후 read.spss( )를 이용해 복지패널데이터를 불러옵니다. 다음으로 데이터를 불러왔으니 데이터의 구조를 파악하는 head( ), tail( ), View( ), dim( ), str( ), summary( ), descr( )를 활용하겠습니다. 여기서 저는 summary( )와 descr( )을 사용했습니다. 이런식으로 최솟값, 최댓값, 1분위값, 중간값, 3분위값 등이 출력되는 것을 볼 수 있습니다. 그 후 간단한 사용.. 2019. 5. 25.
KT넥스알, 차세대 클라우드 빅데이터 플랫폼 출시한다 확률과 통계 수업을 들으면서 빅데이터와 클라우드에 대한 이야기가 자주 나오는데 마침 이런 기사가 있어서 한번 읽어 보게 되었습니다. ‘지능형 데이터’ 폭증하는 5G 시대 다양한 영역의 기관·기업 의사결정 지원...AI 모델 구축 환경, 에지 컴퓨팅 등 3가지 주요 기능을 ‘콘스탄틴’에 도입 먼저 기사 초반에 빅데이터에 대한 설명을 소개하는 이야기가 나왔습니다. 오늘날 빅데이터 플랫폼은 제조 공장, 신용카드, 포털 사이트, SNS 등 다양한 데이터 소스에서 발생된 정보를 수집·저장하기 위해 필요한 IT 환경이다. 현재 많은 기업들이 빅데이터 플랫폼을 이용해 경영에 필요한 인사이트(Insight)를 도출하고 데이터에 기반한 비즈니스 혁신을 추구하고 있으나, 기존에 운영됐던 시스템(레거시 시스템)과 분리된 별.. 2019. 5. 21.
머니브레인, 고품질 딥러닝 음성합성(TTS) 기술 공개 사람의 목소리를 학습하여 실시간 음성합성이 가능하다. 따라서 실시간 커뮤니케이션 기술이 필요한 대화형 인공지능 서비스에 즉시 탑재하여 서비스 제공이 가능합니다. 저는 여기서 고품질 딥러닝 음성합성(TTS) 기술이 궁금해서 TTS가 무엇인지 조사해 보았습니다. TTS란 (Text To Speech)로 문자를 음성으로 합성하는 기술을 가집니다. 사람의 목소리를 학습하여 문맥에 따라 높낮이, 강세, 발음하는 방법을 습득하는 현존하는 가장 뛰어난 음성합성 기술이며, 우리가 흔히 듣는 기계음 방식의 음성합성 기술에 비해 자연스럽고 뛰어난 음성품질을 특징으로 합니다. 머니브레인의 장점은 일반적으로 딥러닝 음성합성을 위해서는 수초의 시간이 소요되는 반면 머니브레인은 실시간 음성합성이 가능하다. 따라서 실시간 커뮤니케.. 2019. 5. 9.
007. sum( ), prod( ), mean( ) 파악하기 먼저 메서드를 실행시키기 위해 데이터를 두개 작성한 후 combine_first를 이용하여 데이터 프레임을 합치겠습니다. test_01 = [[2.3, np.nan], [4.0, 1.5], [np.nan, 11.2], [-0.5, -3.0], [.3, 14]] df_test_01 = pd.DataFrame(test_01, columns = ["data1","data2"], index = ["a","b","c","d","e"]) test_02 = [[1.2, np.nan], [3.4, 6.6], [np.nan, -3.2], [1.2, 3.0], [1.3, -3.4]] df_test_02 = pd.DataFrame(test_02, columns = ["data3","data4"], index = ["a",".. 2019. 5. 2.