※ 데이터 가공하기 입문(제주 키워드 데이터)

자유자재로 데이터 가공하기에서 명령어를 배우고 나서 데이터 분석에 재미가 생겨서 주변 데이터 자료를 찾아 분석하는 시간을 가져 보았습니다.

데이터 자료는 네이버 키워드 검색 자료를 이용하였습니다.

https://github.com/HyunAm0225/Rstudy 를 들어가면 데이터를 확인할 수 있습니다.

1. 먼저 excel 파일을 읽기 위해 readxl 패키지를 install 하고 library로 불러왔습니다.

2. View를 통해 keyword의 데이터 프레임을 보면 아래처럼 출력이 됩니다.

※먼저 변수와 상수를 정리하자면

연관키워드, 월간검색수(PC), 월간검색수(모바일), 월평균클릭수(PC), 월평균클릭수(모바일)

월평균클릭률(PC), 월평균클릭률(모바일), 경쟁정도, 월평균노출광고수 입니다.

연관키워드와 경쟁정도만 상수이고 나머지는 변수입니다.

3-1. 먼저 저는 제주도 관련 검색어 키워드를 PC와 mobile에서 한것을 total로 만든다음 상위 10개를 출력하는 명령어를 사용해 보았습니다.

3-2. 출력은 다음과 같이 출력됩니다.

4-1. 다음은 경쟁력을 정리한 degreecompitition열을 이용해서 경쟁력이 중간인 값중에 상위 10개를 출력하는 명령어를 만들었습니다.

4-2. 출력값은 다음과 같이 출력됩니다.

중간값으로 대부분 맛집검색이 많다는 점을 파악할 수 있습니다.

5-1. 마지막으로 낮은값만 정리해서 출력해 보겠습니다.

5-2. 출력값은 다음과 같습니다.

대부분 키워드가 길어서 검색을 많이 안하는 경우가 있는 자료들이었습니다.

※참고로 10이라고 적힌 값은 10이하인 값입니다.

※ mpg데이터를 이용해 분석 문제를 해결해 보기 (0)	2019.04.09
※ 결측치가 들어 있는 mpg 데이터를 이용해 분석문제 해결하기 (0)	2019.04.09
※ 주식 자료로 형변환 및 데이터 분석 이해하기 (0)	2019.04.07
※분석 도전 ! p.123 풀기 (0)	2019.04.01

댓글