"빅데이터 파워?"…구글, 월드컵 8강 다 맞혔다


데이터 분석 통해 경기력 예측…4강 진출팀도 가려낼까?

[김익현기자] 2010년 남아공월드컵 당시 점쟁이 문어 ‘파울’이 단연 화제였다. 당시 파울은 월드컵 경기 결과를 정확하게 예측해 전 세계 축구팬들의 사랑을 독차지했다.

4년 만에 다시 열린 2014 브라질 월드컵에선 점쟁이 문어는 없다. 하지만 그 자리를 빅데이터로 무장한 구글이 깔끔하게 채워줬다.

구글은 2일(현지 시간) 클라우드 플랫폼 공식 블로그를 통해 월드컵 16강전 8경기 결과를 정확하게 예측했다고 밝혔다. 구글은 지난 달 샌프란시스코에서 열린 ‘I/O 2014 개발자회의’에서 빅데이터 분석을 이용해 월드컵 경기 결과를 예측했는데 정확하게 맞아 떨어졌다고 설명했다.

◆전 경기 활동 데이터로 경기력 예상

이번 월드컵 16강전은 브라질이 칠레를 승부차기 끝에 3대2로 꺾은 것을 시작으로 매 경기 팽팽한 승부가 이어졌다. 열띤 승부 끝에 ▲콜롬비아(우루과이) ▲프랑스(나이지리아) ▲독일(알제리) ▲네덜란드(멕시코) ▲코스타리카(그리스) ▲아르헨티나(스위스) ▲벨기에(미국)가 단두대 매치에서 살아남았다.

이 같은 결과는 구글이 사전에 전망한 것과 정확하게 일치한다.

일단 구글이 승부를 예측한 방법부터 한번 살펴보자. 구글은 우선 축구 통계 전문 사이트인 옵타(OPTA)의 데이터를 활용했다. 옵타는 월드컵 경기 뿐 아니라 각국 프로리그의 각종 데이터를 축적해놓고 있다.

구글은 선수들의 직전 게임 활동을 바탕으로 다음 게임에서 어느 정도 경기력을 보일지 분석하는 데 옵타의 데이터를 활용했다. 연속선상에서 선수들의 경기력을 분석한 셈이다. 여기에다 빅쿼리의 파워랭킹 시스템도 함께 적용했다.

여기까지는 객관적인 데이터 분석이다. 구글은 이런 분석 기법에다 주관적인 요소를 결합했다. 브라질 현지로 직접 응원온 관중들의 숫자와 그들의 응원 열광 정도를 또 다른 변수로 추가한 것. 이런 요소들은 ‘홈 어드밴티지’ 같은 현장 분위기를 고려하는 데 도움이 됐다고 구글 측이 설명했다.

이런 다음엔 구글 클라우드 데이터플로우를 비롯해 구글 빅쿼리, 구글 컴퓨트엔진 등을 활용해 분석 작업을 진행했다. 덕분에 구글은 경기 결과를 정확하게 예측할 수 있었다고 강조했다.(아래 첨부한 동영상 26분 부분부터 월드컵 예측 장면이 나온다.)

◆16강전 이변 없어…8강전까지 맞춰야 진정한 '지존'

과연 구글의 경기 결과 예측이 어느 정도로 대단한 걸까? 단순 확률로만 따지면 엄청나다. 8개 경기 결과를 모두 맞출 확률은 0.5X0.5X0.5X0.5X0.5X0.5X0.5X0.5X=0.0039란 계산이 나온다. 확률로 따질 경우 약 0.4%다. 1천 번 전망을 하면 4번 정도 맞출 수 있는 확률이다.

하지만 축구 경기 전망은 단순 확률은 아니다. 객관적인 경기력이란 게 있기 때문이다. 게다가 이번 16강전은 사상 최초로 조별리그 1위팀들이 전원 생존했다. 이변이라고 할만한 경기가 많지 않았다는 의미다.

8강 진출팀 중 브라질, 아르헨티나, 독일, 프랑스, 네덜란드 같은 전통 강호들의 승리를 점치는 건 그다지 어렵지 않았다. 실제로 상당수 축구팬들은 브라질을 비롯한 다섯 개 팀들은 무난하게 승리할 것으로 예상했다.

오히려 경기 결과만 놓고 보면 구글의 예측이 다소 비현실적인 부분도 있었다. 이를테면 독일이 알제리에 이길 확률이 93%라고 전망했지만 실제 경기에서 독일은 고전을 면치 못했다. 결국 연장 승부 끝에 2대 1로 간신히 승리했다.

구글의 빅데이터 예측이 과거 데이터 분석 뿐 아니라 미래 예측력까지 갖고 있는 지 여부를 판단하기엔 다소 성급할 수도 있다는 얘기다.

결국 구글이 ‘점쟁이 파울’ 자리를 대신하려면 한 번 더 신통력을 보여줄 필요가 있다. 구글도 또 다시 미끼를 던졌다.

오는 5일부터 시작될 8강 경기 결과도 예측한 것. 구글은 4강 진출 팀으로 브라질, 프랑스, 네덜란드, 아르헨티나를 꼽았다.

브라질이 콜롬비아를 이길 확률은 71%에 이른다고 전망했으며, 네덜란드 역시 68% 확률로 코스타리카를 물리칠 것으로 전망했다. 남미의 또 다른 강호 아르헨티나 역시 벨기에에 이길 확률이 81%라고 구글은 예측했다.

가장 관심을 끄는 것은 유럽의 두 강호인 독일과 프랑스 경기다. 자국 IT기업인 SAP의 빅데이터 도움을 받은 독일과 ‘아트사커’ 부활을 선언한 프랑스 경기는 예측이 쉽지 않은 승부. 하지만 구글은 프랑스의 손을 들어줬다. 승리할 확률은 69%.

구글은 우승팀 예측도 내놨다. 브라질과 아르헨티나가 결승에 진출해 브라질이 우승할 가능성이 많다고 전망했다. 승리할 확률은 55%. 하지만 구글은 확률 차이가 너무 적어서 예측하기 힘들다(too close to call)는 설명도 함께 덧붙였다.

월드컵 16강전 8경기 결과를 정확하게 예측한 구글이 과연 8강전 4경기에서도 신통력을 발휘할 수 있을까? 이번에도 구글 예측대로 승부가 갈릴 경우엔 ‘점쟁이 문어 파울’은 그만 잊어버려도 될 것 같다.

김익현기자 sini@inews24.com







포토뉴스