본문 바로가기
Data·AI/관련자료

구글의 인공지능 open API인 Vision API 설명

by hyun-am 2019. 4. 13.

Google vision

 

 

먼저 구글의 인공지능 API인 google Vision은 수천 가지 카테고리(예: '범선')로 빠르게 이미지를 분류하고, 이미지 안의 개별 객체와 얼굴을 감지하고, 이미지에 인쇄된 단어를 판독합니다. 이미지 카탈로그에서 메타데이터를 제작하거나, 불쾌감을 주는 콘텐츠를 검토하거나, 이미지 감정 분석을 통해 새로운 마케팅 시나리오를 세울 수 있습니다.

 

예를들면 아래와 같은 기술을 사용할 수 있습니다.

 

1. 이미지에서 유용한 정보 도출 

 

이미지를 분석해서 꽃, 동물, 교통수단에서부터 이미지 내에 일반적으로 나타나는 수천 개의 기타 객체 카테고리에 이르기까지, 이미지에서 손쉽게 광범위한 객체를 감지할 수 있습니다. 또한 시간이 지날수록 학습을 많이해서 더 좋은 결과값을 얻을 수 있습니다. 

 

2. 텍스트 추출

 

이 기술은 광학 문자 인식 기술인(OCR)을 사용해 사진이나 책에 나와있는 글자를 읽어 문자를 추출하는 기능입니다. 저는 이 기술을 파이썬을 통해 사용해 봤는데 필기한 내용을 읽어 텍스트 파일로 만들어 주는 것을 보고 아주 좋은 기술이라고 생각했습니다.

 

3. 웹 활용

 

웹에서 일반적인 글을 입력해서 검색하는 방식이 아닌 이미지를 입력해서 비슷한 이미지를 찾는 이미지 검색으로 사용할 수 있습니다. 

 


※ 추후에 이 google vision을 활용해 이미지를 인식하는 과정을 보여주는 글을 포스팅 하겠습니다.

※ 링크는 다음과 같습니다.  https://cloud.google.com/vision/

댓글