본문 바로가기

분류 전체보기232

KT넥스알, 차세대 클라우드 빅데이터 플랫폼 출시한다 확률과 통계 수업을 들으면서 빅데이터와 클라우드에 대한 이야기가 자주 나오는데 마침 이런 기사가 있어서 한번 읽어 보게 되었습니다. ‘지능형 데이터’ 폭증하는 5G 시대 다양한 영역의 기관·기업 의사결정 지원...AI 모델 구축 환경, 에지 컴퓨팅 등 3가지 주요 기능을 ‘콘스탄틴’에 도입 먼저 기사 초반에 빅데이터에 대한 설명을 소개하는 이야기가 나왔습니다. 오늘날 빅데이터 플랫폼은 제조 공장, 신용카드, 포털 사이트, SNS 등 다양한 데이터 소스에서 발생된 정보를 수집·저장하기 위해 필요한 IT 환경이다. 현재 많은 기업들이 빅데이터 플랫폼을 이용해 경영에 필요한 인사이트(Insight)를 도출하고 데이터에 기반한 비즈니스 혁신을 추구하고 있으나, 기존에 운영됐던 시스템(레거시 시스템)과 분리된 별.. 2019. 5. 21.
머니브레인, 고품질 딥러닝 음성합성(TTS) 기술 공개 사람의 목소리를 학습하여 실시간 음성합성이 가능하다. 따라서 실시간 커뮤니케이션 기술이 필요한 대화형 인공지능 서비스에 즉시 탑재하여 서비스 제공이 가능합니다. 저는 여기서 고품질 딥러닝 음성합성(TTS) 기술이 궁금해서 TTS가 무엇인지 조사해 보았습니다. TTS란 (Text To Speech)로 문자를 음성으로 합성하는 기술을 가집니다. 사람의 목소리를 학습하여 문맥에 따라 높낮이, 강세, 발음하는 방법을 습득하는 현존하는 가장 뛰어난 음성합성 기술이며, 우리가 흔히 듣는 기계음 방식의 음성합성 기술에 비해 자연스럽고 뛰어난 음성품질을 특징으로 합니다. 머니브레인의 장점은 일반적으로 딥러닝 음성합성을 위해서는 수초의 시간이 소요되는 반면 머니브레인은 실시간 음성합성이 가능하다. 따라서 실시간 커뮤니케.. 2019. 5. 9.
007. sum( ), prod( ), mean( ) 파악하기 먼저 메서드를 실행시키기 위해 데이터를 두개 작성한 후 combine_first를 이용하여 데이터 프레임을 합치겠습니다. test_01 = [[2.3, np.nan], [4.0, 1.5], [np.nan, 11.2], [-0.5, -3.0], [.3, 14]] df_test_01 = pd.DataFrame(test_01, columns = ["data1","data2"], index = ["a","b","c","d","e"]) test_02 = [[1.2, np.nan], [3.4, 6.6], [np.nan, -3.2], [1.2, 3.0], [1.3, -3.4]] df_test_02 = pd.DataFrame(test_02, columns = ["data3","data4"], index = ["a",".. 2019. 5. 2.
006. add( ), sub( ), mul( ), div( ) 메서드 파악하기 먼저 시작하기 앞서 두개의 데이터 프레임을 만들겠습니다. test_01 = [[2.3, np.nan], [4.0, 1.5], [np.nan, 11.2], [-0.5, -3.0], [.3, 14]] df_test_01 = pd.DataFrame(test_01, columns = ["first","second"], index = ["a","b","c","d","e"]) test_02 = [[1.2, np.nan], [3.4, 6.6], [np.nan, -3.2], [1.2, 3.0], [1.3, -3.4]] df_test_02 = pd.DataFrame(test_02, columns = ["first","second"], index = ["a","b","c","d","e"]) 다음과 같은 두개의 데이터 프레.. 2019. 5. 1.
005. pandas 데이터 전처리하기 1. describe( )함수 먼저 이 함수는 R에서 summary함수와 비슷한 역할을 합니다. 결과 값은 아래와 값이 설명할 수 있습니다. count : 데이터의 개수 mean : 평균 값 std : 표준편차 min : 최솟값 25% : 4분위수(25%) 50% : 4분위수(50%) 75% : 4분위수(75%) max : 최댓값 df.describe() 실행을 위해 다음과 같은 명령어를 실행한 결과값은 아래와 같습니다. 2. info( )함수 다음 함수는 R에서 str함수와 비슷한 역할을 함수입니다. df_test.info() 이런 명령어를 실행하면 다음과 같은 결과를 출력합니다. 3. columns 데이터에 어떤 컬럼이 있는지 살필 수 있습니다. df_test.columns 출력 값은 다음과 같습니다.. 2019. 5. 1.
004. pandas를 이용하여 데이터 프레임 만들기 요번에 대학교 확률과 통계시간에서 교수님께서 와인에 관한 이야기를 하였습니다. 그래서 전에 저는 wine다양한 자료를 담고 있는 데이터를 한번 사용해본적 있어서 이것을 통해 데이터 프레임을 만들고 이것을 통해 데이터 프레임을 만들어 보겠습니다. 먼저 데이터 프레임을 만들기 전에 wine_dataset 파일을 판다스를 실행하는 곳에 위치하겠습니다. 그후 os 라이브러리를 이용해 데이터의 경로를 확인한 후 df_test라는 데이터 프레임을 만들겠습니다. import io import os 이렇게 io와 os라는 라이브러리를 불러온후 다음 명령어를 사용해 데이터가 저장된 위치의 경로를 확인합니다. os.listdir('파일명') 그러면 다음과 같은 결과를 확인할 수 있습니다. 그 후 이런식으로 csv_path.. 2019. 5. 1.