002. pandas series-기초
1. Series 개요 Pandas에서 series 라는 것은 pandas의 1차원적인 데이터 타입을 말합니다. 또한 모든 유형(정수, 문자열, 부동 소수점, 파이썬 객체 등)의 데이터를 보유할 수 있습니다. 2. Series 만들기 간단한 series를 만드는 예제입니다. series = pd.Series([1,3,5,np.nan,7,9]) series 출력은 다음과 같습니다. 3. Pandas에서 slice 기능은 R에서 filter과 비슷한 기능을 합니다. series[series>3.0] 출력은 다음과 같습니다. 4. 또한 series를 이용하여 바이너리 연산을 수행할 수 있습니다. data1 = pd.Series([11,13,21,17,23], index = ['a','b','c','d','e'..
2019. 4. 30.
004. psych패키지, descr패키지 사용하기
앞에 나왔던 summary( ) 함수로는 최솟값, 1사분위수, 중앙값, 평균, 3사분위수, 최댓값까지 확인할 수 있지만 "psych" 패키지를 설치하고 로드한 후 describe( )함수를 이용하면 summary( )함수에서 이용한 것과 변수 개수, 관측치 수, 표준편차, 범위, 첨도, 왜도 까지 알 수 있습니다. 예를들면 summary 한 값은 아래 그림과 같습니다. 다음은 describe한 값입니다. 이것을 통해 summary로만 부족한 내용을 describe를 통해 보충해서 확인 할 수 있습니다. 다음은 "descr"패키지를 이용해 freq( ) 함수를 사용해서 빈도수를 확인시켜주는 함수를 만들겠습니다. 먼저 mpg데이터에 있는 자동차 브랜드의 빈도수를 파악하기 위해 다음과 같은 명령어를 사용했습니..
2019. 4. 16.