본문 바로가기

데이터분석34

003. pandas series - 다양한 메서드들 먼저 pandas series에서 사용하는 다양한 연산 메서드를 알아보겠습니다. Series에서 바이너리 연산 메서드 Function 설명 add( ) Series에서 길이가 같은 객체 또는 Series를 더하는 데 사용되는 메서드 입니다. sub( ) Series에서 길이가 같은 객체 또는 Series를 빼는 데 사용되는 메서드 입니다. mul( ) Series에서 길이가 같은 객체 또는 Series를 곱하는 데 사용되는 메서드 입니다. div( ) Series에서 길이가 같은 객체 또는 Series를 나누는 데 사용되는 메서드 입니다. sum( ) Series에서 열의 값을 더한 후 반환합니다. prod( ) Series에서 열의 값을 곱한 후 반환합니다. mean( ) Series에서 열의 평균값을.. 2019. 4. 30.
002. pandas series-기초 1. Series 개요 Pandas에서 series 라는 것은 pandas의 1차원적인 데이터 타입을 말합니다. 또한 모든 유형(정수, 문자열, 부동 소수점, 파이썬 객체 등)의 데이터를 보유할 수 있습니다. 2. Series 만들기 간단한 series를 만드는 예제입니다. series = pd.Series([1,3,5,np.nan,7,9]) series 출력은 다음과 같습니다. 3. Pandas에서 slice 기능은 R에서 filter과 비슷한 기능을 합니다. series[series>3.0] 출력은 다음과 같습니다. 4. 또한 series를 이용하여 바이너리 연산을 수행할 수 있습니다. data1 = pd.Series([11,13,21,17,23], index = ['a','b','c','d','e'.. 2019. 4. 30.
005. 데이터 그래프 만들기 Index 산점도 막대그래프 선그래프 상자그림 1. 산점도 먼저 산점도는 연속 값으로 된 두 변수의 관계를 표현할 때 사용됩니다. ※ ggplot2 문법은 레이어 구조입니다. 3단계를 확인 해 봅시다. 배경 설청(축) 그래프 추가(점, 막대, 선) 설정 추가(축 범위, 색, 표식) 1-1. 배경 설정하기 먼저 산점도를 사용하기 위해 mpg 데이터를 불러 온 후 aes를 통해 x축과 y축에 사용할 변수를 지정하겠습니다. 다음과 같은 방식으로 배경을 설정할 수 있습니다. 실행을 하면 다음과 같이 배경이 생성됩니다. 배경만 있고 안에 그래프가 없는것을 확인할 수 있습니다. 따라서 geom_point( )를 추가해 산점도를 그리겠습니다. 1-2. 그래프 추가하기 geom_point( )함수를 사용하는 방법은 아.. 2019. 4. 16.
004. psych패키지, descr패키지 사용하기 앞에 나왔던 summary( ) 함수로는 최솟값, 1사분위수, 중앙값, 평균, 3사분위수, 최댓값까지 확인할 수 있지만 "psych" 패키지를 설치하고 로드한 후 describe( )함수를 이용하면 summary( )함수에서 이용한 것과 변수 개수, 관측치 수, 표준편차, 범위, 첨도, 왜도 까지 알 수 있습니다. 예를들면 summary 한 값은 아래 그림과 같습니다. 다음은 describe한 값입니다. 이것을 통해 summary로만 부족한 내용을 describe를 통해 보충해서 확인 할 수 있습니다. 다음은 "descr"패키지를 이용해 freq( ) 함수를 사용해서 빈도수를 확인시켜주는 함수를 만들겠습니다. 먼저 mpg데이터에 있는 자동차 브랜드의 빈도수를 파악하기 위해 다음과 같은 명령어를 사용했습니.. 2019. 4. 16.
003. 데이터 파악하기 데이터를 파악할 때 사용하는 함수들은 아래와 같습니다. 함수 기능 head( ) 데이터 압부분 출력 tail( ) 데이터 뒷부분 출력 View( ) 뷰어 창에서 데이터 확인 dim( ) 데이터 차원 출력 str( ) 데이터 속성 출력 summary( ) 요약 통계량 출력 1. head( ) : head( )는 데이터 프레임에서 앞부분 6행을 출력할 때 쓰는 함수입니다. 2. tail( ) : tail( )은 데이터 프레임에서 뒤에서 6행을 출력할 때 쓰는 함수입니다. 3. View( ) : View( )은 데이터 뷰어 창을 열어 시각적으로 확인할 수 있게 만들어 줍니다. 4. dim( ) : dim( )은 데이터가 몇행 몇열로 이루어져 있는지 확인시켜 줍니다. 5. str( ) : str( )은 데이터 .. 2019. 4. 15.
인공지능을_활용한_업무자동화_With_Google_Developers_Group_JEJU #인공지능을_활용한_업무자동화_With_Google_Developers_Group_JEJU #무료책 #Notion #Notion으로_집필 안녕하세요. 이호준입니다. 즐거운 월요일이네요. 올해 초에 2박 3일로 제주 플레이스캠프에서 열렸던 ‘인공지능을 활용한 업무자동화 With Google Developers Group JEJU’에 내용을 무료 교재로 집필하였습니다. 이 책은 19년 1월 캠프 참여자 중 공공의 목적으로 기존 교재를 보강하여 배포하고자 했던 16분들의 공헌으로 세상에 나온 책입니다. 캠프가 열릴 수 있도록 도와주신 여러 대표님과 교수님, 팀장님, 매니저님에게 먼저 감사의 말씀을 올립니다. 열정으로 함께해주시는 참여자 여러분에게도 감사의 말씀을 올립니다. 무엇보다 밤낮없이 열정으로 책을 집필.. 2019. 4. 15.