내가 본 구글 I/O 2013 (1) 머신 러닝

2013-05-21 07:08 오전
손재권

 

래리페이지01
구글 I/O 2013 키노트에 등장한 래리 페이지 CEO


내가 본 구글I/O 2013

“구글은 우리를 너무나 많이 알고 있는데 우리는 구글을 너무 모른다”
지난 15일부터 17일까지 샌프란시스코 모스콘 센터에서 열린 구글 연례개발자대회(I/O)를 현장 취재하고 받은 느낌이다.
올해 I/O에서 구글이 보여준 것은 현재 인터넷, 검색 회사가 보여줄 수 있는 기술의 정점이었다. 지난해까지 구글은 안드로이드 기기(스마트폰, 태블릿), 구글TV, 구글글라스 등으로 자신의 플랫폼을 확장했다. 하지만 올해는 달랐다. 젤리빈에 이은 안드로이드 OS 5.0 버전 ‘키라이파이’도 선보이지 않았고 ‘넥서스Q’와 같은 새 디바이스도 공개하지 않았으며 지난해 나온 구글글라스의 새로운 버전도 선보이지 않았다. 
CEO 3년차의 래리 페이지는 대신 ‘구글 2.0’으로 불릴 수 있을 정도로 검색, 이메일, 구글맵, 구글플러스 등 구글 본연의 서비스를 진화시켰다. 
그리고 그 결과는 놀라울 정도였다. 구글은 그동안 수년간 웹 검색과 안드로이드 무료 배포를 통해 쌓은 데이터를 통해 콘텐츠를 추천하고 어느정도 예측할 수 있을정도가 됐고 정확도가 크게 향상됐다. 구글이 15일 I/O 키노트를 하는 동안 트위터에서는 “구글이 스카이넷(Skynet)이 되고 있다!”는 말이 펴졌을 정도였다. 전문가들은 구글을 더욱 신뢰하기 시작했고 미래를 더 기대하기 시작했다. 그래서일까. 구글의 주가는 키노트 중간에 900달러를 돌파했다. 구글은 지난 5년간 한번도 I/O 이후에 주가가 오르지 않았다. 오히려 떨어지기도 했다. 하지만 올해는 달랐다. I/O이후에 주가는 뛰어올랐다. 투자자들은 구글이 이날 밝힌 미래에 대해 긍정적으로 평가하고 있다는 증거였다. 도대체 이번 I/O는 어떤 의미가 있었던 것일까? 



1. 머신러닝 : 분석, 추천, 예측

구글은 I/O 2013에서 검색, 구글맵, 구글플러스, 안드로이드  등 많은 내용을 발표했는데 이 주제를 관통하는 화두이자 핵심 트렌드는 ‘머신러닝(Machine Learning)’이었다. 
구글은 한번도 ‘머신러닝’이나 그 상위 개념인 ‘인공지능(AI)’에 대해 언급한 적이 없다. 하지만 전문가들은 구글을 움직이는 힘이자 오늘날 테크놀로지의 핵심 트렌드는 이 것임을 알고 있던 것이다. 
머신러닝은 스탠포드에서 요새 가장 인기 있는 수업(개방형 온라인 대학(MOOCs) 코세라(Coursera)의 창업자 앤드류 응 스탠포드 교수가 머신 러닝을 가르친다)이기도 하고 실리콘밸리의 가장 뜨는 기술 분야이기도 하다. 머신 러닝, 데이터 분석(Data Analytics) 전공자들은 무조건 데려간다는 말이 나올 정도다. 
구글이 수집하는 많은 정보, 언어(Language), 말(Speech), 번역(Translation), 비주얼 프로세스 등은 머신러닝에 의존하고 있다. 
머신러닝이란 데이터를 쌓아 기계가 스스로 생각, 판단할 수 있게 하는 방법이다. 예를들어 스팸 메일과 정상적인 메일을 사람들이 구분해주다 보니 이제 기계적으로 학습이 돼 스스로 스팸과 정상 메일을 구분할 수 있게 한다. 
실제로 구글의 지메일에는 ‘스팸신고’란이 있는데 지메일 이용자들이 스팸을 신고해주다 보니 이 데이터가 쌓여 구글의 엔진이 스팸과 정상적인 메일을 구분할 수 있게 됐다. 스팸 메일 구분은 머신러닝의 시작에 불과했다. 지메일과 웹 검색 그리고 모바일 검색을 바탕으로 구글은 이용자들의 관심사와 ‘관계’를 파악할 수 있게 됐고 이것을 바탕으로 이용자의 취향과 필요한 정보를 분석, 추천해주고 예측도 가능하게 된 것이다. 
데이터 마이닝(Data Mining)이 기존의 데이터를 추출하고 분석하는 일이라고 한다면 머신 러닝은 훈련된 데이터(예를들어 스팸과 정상 메일 구분)를 바탕으로 예측하는 것이라고 보면 이해하기 쉬울 것 같다. 
이처럼 ‘머신러닝’에 대해 설명한 이유는 구글이 I/O 2013에서 새로 선보인 서비스 대부분이 이 같은 머신러닝을 기반으로 하고 있기 때문이다. 구글이 자랑하는 ‘개인화(Personalized)된 이용자 맞춤형(Customized)’ 서비스는 머신러닝을 기반으로 하고 있다. 



구글이 한단계 업그레이드 시킨 ‘검색(Search)’이 대표적이다. 아밋 싱할 구글 수석 부사장(검색 총괄)은 “우리가 알던 검색은 끝났다(The end of search we know it)”이라며 새 검색 시스템을 공개했다. 
싱할 부사장은 “검색은 이제 근본적으로 바뀌고 있다. 이제 검색이 전세계를 향해 응답하기 시작했다. 이 것은 삶이라는 여행을 바꿀 것이다”고 말했다. 
싱할 부사장은 이날 ‘대화형 검색’과 ‘지식 그래프(Knowledge Graph)’ 그리고 이용자의 다음 질문을 예측해서 결과를 보여주는 검색을 선보였다. 
대화형 검색은 구글 검색창에 “오케이 구글(OK Google)”이라고 하면서 질문하면 구글이 말로 검색 결과를 보여주는 것이다. 이 대화형 검색은 모바일(스마트폰, 태블릿PC)뿐만 아니라 PC에서도 할 수 있다. 
사실 구글의 ‘대화형 검색’ 도입은 적지않은 의미가 있다. 말로 입력하고 말로 대답한다는 것은 ‘음성 검색’ 및 ‘음성 인식’에서 이미 시도된 것이다. 구글이 꾸준히 시도하고 애플이 시리(Siri)를 통해 대화형 검색의 대중화를 알렸다. 여기에 구글은 한발 더 나가 컴퓨터에 입력하는 명령어까지 ‘말’로 해결했다. 예전엔 음성검색을 하려면 마이크 표시가 된 아이콘을 누르고 해야 했으나 앞으로는 ‘오케이 구글’이라고 말을 하면 “이 사람이 검색을 하려는구나”라고 인지하고 대답할 준비를 하게 되는 것이다. 
구글이 2012년 처음 도입한 이후 올해 I/O에서 발전시킨 ‘지식 그래프’도 예측형 검색이 무엇인지를 보여준다. 지식 그래프 기술은 서로 다른 정보간 연결을 만들고 사람들의 검색에서 맥락을 이해하는 것이 핵심이다. 
예를들어 구글에서 ‘한국의 인구(South Korea population)’을 검색하게 되면 구글은 한국의 인구 정보만 보여주는 것이 아니라 북한 및 일본, 중국, 미국과의 인구 비교, 한국의 GDP 등 다음 검색까지 예측해 한번에 보여주는 것이다. 그리고 중국 상하이로 여행을 가기 위해 구글 검색을 하게 되면 상하이까지 가는 비행기 스케줄 뿐만 아니라 호텔, 식당 등 다음에 할 검색을 예측해 미리 보여주게 된다. 
또 구글의 모바일 검색 엔진 ‘구글 나우(Google Now)’를 실행하면 날씨, 교통상황, 식당 등을 이용자의 위치에 따라 제시하게 되는데 곧 ‘음악’ ‘영화’ ‘책’ ‘비디오 게임’ 등 이용자가 좋아할만한 콘텐츠를 추천한다. 
구글이 쌓은 방대한 데이터를 기반으로 이용자의 취향을 파악해 추천하고 예측하는 시스템이 검색에 그대로 반영된 것이다. 
이는 구글이 이번 I/O에서 발표한 가장 중요한 서비스인 ‘구글 맵’에서도 그대로 반영됐다. 
구글맵에서도 ‘추천’과 ‘예측’ 기능이 포함됐다. 샌프란시스코를 검색하면 지도에 이용자가 구글에서 했던 검색을 기반으로 좋아할만한 식당과 주변 상점을 추천해준다. 
그리고 ‘실시간 교통정보’를 반영해 실시간으로 내비게이션 방향을 바꿔주고(Turn by Turn) 특정 장소에 갈때 현재 시간 기준으로 ‘대중교통’이 빠른지 ‘자가용’을 운전해서 가는 것이 빠른지 예측하고 알려주기도 한다. 
구글의 이 같은 서비스는 이미 ‘구글 맵’을 통해 방대한 이용자 정보를 쌓았고 이를 개인화하는 단계에 도달했다는 것을 의미한다. 구글은 500억회의 턴바이턴 정보를 쌓았다고 밝히고 있다. 
한국에서도 이 정도 서비스는 될 수도 있다. 하지만 미국뿐만 아니라 전세계 20억명을 대상으로 서비스를 하려면 사람의 손이 아닌 기계에 맡겨야 하며 기계의 학습에 의한 예측 시스템인 ‘머신러닝’에 의지할 수밖에 없다. 
여기서 끝이 아니다. 이번게 공개된 9.99달러에 음악을 스트리밍으로 즐길 수 있는 ‘구글플레이 뮤직 올 억세스(Music All Access)’에서도 개인화된 추천엔진(Personalized Recommendation)을 기반으로 해서 이용자의 취향에 맞는 음악을 추천해준다. 지금 듣기(Listen Now)는 그동안 들었던 음악과 친구들이 찜한 음악 기반으로 내가 즐겨들을 만한 음악을 추천해준다. 



이처럼 ‘머신러닝’을 기반으로 한 개인화된 추천, 예측 엔진을 구축한 것은 구글이 처음은 아니다. 
오히려 아마존이 ‘원조’라고 볼 수 있다. 아마존은 이용자의 쇼핑 습관과 같은 물건을 산 다른 사람들이 어떤 물건을 구매했는지를 분석해 이용자가 구매할만한 상품들을 보여준다.
아마존은 “이용자가 한번 클릭한 물건은 언젠가는 구매한다”는 것을 알고 있다. 그래서 클릭한 물건을 바탕으로 지속적으로 패턴을 분석, 구매율이 높은 상품을 추천해 실제 구매로 까지 이어지게 하는 것이다. 

한번 아마존에서 쇼핑을 하면 벗어날 수가 없는데 이는 배송 시스템이 훌륭한 점도 있지만 상품 관련성이 높으면서도 질좋은 상품을 추천해주기 때문이다. 아마존 뿐만 아니라 넷플릭스도 이용자 개개인에 맞춘 영화 및 TV 시리즈를 보여준다. ‘개인화’ 및 ‘맞춤형’ 검색과 추천은 실리콘밸리 기업의 핵심 트렌드다. 
여기서 질문. 인터넷이 등장한 이후 ‘개인화’ ‘맞춤형’이 화두가 아닌 적이 있었나? 그렇다. 개인에 맞는 콘텐츠를 보여주는 것은 인터넷 기업의 영원한 숙제다. 
하지만 기존 ‘개인 맞춤형’이 이용자가 먼저 정보를 입력하고 이에 맞게 이용자 환경을 바꾸는 것이 주류였다면 이제는 이용자가 따로 정보를 입력하지 않더라도 사용 패턴을 추적, 알아서 추천하고 예측하는 것이 다르다. (계속)

2편은 구글 글라스 




4 개의 댓글
2013-05-21 9:26 오전

재밌네요. 다음 편을 기대하겠습니다!

2013-05-21 11:33 오후

좋은 정보 잘 읽었습니다^^

2013-05-27 9:29 오전

재밌게 읽었습니다.^^

2013-07-03 4:49 오후

우연히 들렀습니다. 좋은 글 잘 읽었습니다.

댓글을 남겨 주세요!