최강 스타크래프트 AI, 직접 붙어보니…


스타크 AI, 인공지능 학회서 바둑 이상 치열한 경쟁

[성상훈기자] 최강의 인공지능 알파고와 인간 최고수 이세돌 9단의 바둑 대결이 마무리된 가운데 이번엔 인공지능과 인간의 게임 대결이 화두로 떠올랐다.

지난 9일 구글 시니어 펠로우 제프 딘이 "딥마인드 팀은 게임을 테스트베드로 삼아 인공지능을 강화하는 훈련을 진행하고 있다"며 "스타크래프트에 인공지능을 적용하는 방안도 고민 중에 있다"고 언급한 바 있다.

제프 딘의 이같은 발언 때문에 '인공지능 vs 프로게이머'의 대결이 알파고와 이세돌9단의 대결만큼 핫 이슈로 부각됐다.

이에 대해 데이비드 하사비스 구글 딥마인드 최고경영자(CEO)는 인공지능을 게임에 접목할 계획에 대해서는 인정하면서도 당장 스타크래프트에 적용하는 등의 구체적인 계획은 아직 없다고 선을 그었다.

그러나 하사비스 CEO가 적용 가능성을 일부 내비쳤다는 것 만으로도 인공지능과 인간의 스타크래프트 대결이 성사될 가능성은 충분하다.

◆스타크래프트 인공지능, 어디까지 왔나?

바둑은 현재 이세돌 9단과 제 5국을 펼치고 있는 알파고 외에도 프랑스의 '크레이지스톤', 일본의 '젠', 한국의 '돌바람' 등 다양한 인공지능 바둑 프로그램이 존재한다.

스타크래프트 분야에서도 지난 2010년부터 AI 공식 대전 'AIIDE(Artificial Intelligence and Interactive Digital Entertainment)'가 매년 열리고 있다.

지난 2012년, 2013년에서는 호주의 '스카이넷'이 우승했으며 2014년에는 일본의 '아이스봇'이 대회를 석권했다. 그러나 지난해 노르웨이의 'TSCMO'가 혜성같이 등장해 수많은 스타크래프트 인공지능을 제치고 우승을 차지했다.

스타크래프트 인공지능 대회는 크게 학생들을 위주로 열리는 SSCAI, 미국전기전자공학회(IEEE) 주최의 CIG, 캐나다 알버타 대학 주최의 AIIDE 등이 있다.

이중 가장 많은 경기가 치러지는 대회는 AIIDE로 마지막 대회는 지난 2015년 10월과 11월에 걸쳐 알버타대학 컴퓨터과학부에서 개최됐다. 노르웨이의 TSCMO는 이 대회에서 호주의 ZZZBOT을 꺾고 1위를 차지했다. 한국의 '젤나가'는 9위에 랭크됐다.

◆세계 최강 스타크래프트 인공지능, 실력은?

한국의 젤나가를 개발한 세종대학교 컴퓨터공학과 CI(코그니션 인텔리전스) 연구소 도움을 받아 직접 TSCMO(노르웨이 인공지능)와 스타크래프트로 대결해 봤다.

TSCMO는 스타크래프트 종족 중 하나인 '저그'로만 플레이한다. TSCMO는 스타크래프트 게임 내 AI 엔진과 근본적으로 다르다. 인간처럼 상대를 정찰해 시야를 확보하고 제한된 정보를 수집해 스스로 전략을 선택한다.

TSCMO의 명령입력속도(손빠르기에 해당)는 세계 최정상급 프로게이머보다 12배~50배 빠르다.

손빠르기를 가늠하는 지표인 분당행동입력(APM) 수치도 일반인은 평균 50 이하에 그친다. 세계 최정상급 프로게이머들은 경기 시작부터 끝날때까지 150~300을 오르내린다. 1분에 150번에서 300번의 명령을 입력한다는 의미다. TSCMO는 APM 수치가 느릴때는 500 이상, 빠를때는 4천 이상이다. 명령을 내릴 때 실수도 없다.

스타크래프트 경기는 초반에는 전략의 유리함과 불리함을 가늠짓는 '빌드 대결'부터 시작한 후 교전에서 승부가 나지 않을 경우 대부분 '운영 대결'에 돌입한다.

운영 대결이란 본진 이외에 멀티 기지를 추가로 건설하고 자원을 더 많이 획득해 여러 곳의 기지를 콘트롤하면서 전투 유닛(병기)을 생산하며 후반을 도모하는 것을 뜻한다.

운영 대결에서는 유닛 생산 속도와 여러 기지를 멀티태스킹(동시다발적인 조작)할 수 있을 정도의 손빠르기를 필요로 한다. e스포츠에서는 이를 '매크로 콘트롤'로 부른다. 또한 교전시 유닛 한기까지 세밀하게 조작하는 것은 '마이크로 콘트롤'이라 부르고 있다.

직접 상대해본 TSCMO는 인간의 플레이를 매우 유사하게 흉내낸다. 예를 들면 저그의 오버로드(인구 수 유지를 위한 공중 유닛)로 상대를 정찰해 타이밍에 맞게 철수시킨다거나, 저글링 1기로 홀드(완전 정지)돼 있지 않은 상대 유닛을 유인해 없애는 등의 플레이도 곧잘 해낸다.

심지어 뮤탈리스크(저그의 공중 공격 유닛)를 한곳에 뭉쳐 테란의 미사일 터렛(공중방어 유닛)피해를 최소화하면서 SCV(자원채취 유닛)만 점사 하는 고난도의 콘트롤도 구사한다. 프로게이머들은 이를 속어로 '뮤짤'이라 부른다.

판단 능력도 인간과 흡사하다. 시야가 확보된 곳에 많은 수의 머린(해병)이 공격해 오는 것을 발견하면 멀티기지에 순간적으로 3~4개의 성큰 콜로니(저그의 지상방어 건물)를 연달아 건설하는 등의 판단을 스스로 해낸다.

세종대 컴퓨터공학과 인공지능 CI랩 오인석 연구원은 "TSCMO는 시야에 아주 잠깐이라도 노출이 되면 이를 놓치지 않는다. 노출 되는 즉시 눈으로 보는 것과 같다"며 "그러나 유동적인 전략의 변화를 자유자재로 구사하는 것은 아직 걸음마 수준"이라고 설명했다.

실제로 테란의 극초반 공격 전략인 '9/9 2배럭 빌드'로 SCV와 함께 극초반 공격을 가면 TSCMO도 이를 막아내지 못하는 경우가 대부분이었다. 반면 '운영 대결'에 돌입하면 10명 이상이 따로 콘트롤 하는 듯한 착각이 들 정도로 동시다발적인 공격과 수비를 실시간으로 해낸다.

하지만 아주 작은 틈이라도 놓치지 않는 프로게이머들의 플레이 스타일을 고려해볼 때 초반-중반에 승부를 내지 못하고 후반 운영 대결에 들어갈 가능성은 거의 없어 보인다.

전직 프로게이머인 온게임넷 박태민 게임해설자는 "만약 최강의 프로게이머가 인공지능과 대결하는 이벤트가 펼쳐진다면 이영호 선수나 임요환 선수가 될 확률이 높다"며 "이영호 선수는 운영 대결이라면 누구에게도 지지 않는다고 자부하는 스타일이라 인공지능이라도 정면 승부를 펼칠 것 같고 임요환 선수는 철저히 약점을 파헤치는 스타일로 나올 것"이라고 예상했다.

인공지능 세계 챔피언 자리에 오른 TSCMO는 알파고처럼 몬테카를로 트리 탐색(MCTS) 알고리즘을 사용한다. MCTS는 난수를 이용해 '최악의 판단'에서 '최후의 판단'에 이르기까지 수백만번 이상 반복을 통해 가장 '최적의 판단'을 선택하도록 하는 알고리즘이다. 알파고 이전의 인공지능 바둑프로그램도 바로 이 MCTS 알고리즘을 기반으로 하고 있다. 다만 바둑처럼 최적의 수를 찾아낼 확률 자체가 존재하기 어렵다.

스타크래프트는 유닛 간의 상성, 맵에 따른 종족 간의 상성, 전략간의 상성이 존재하긴 하지만 유리한 상성이라고 해서 반드시 이기는 법은 없으며 불리한 상성이라고 해서 반드시 지는 것도 아니다.

압도적으로 병력이 유리해도 지형 지물이나 콘트롤, 히든 유닛 등에 의해 역전이 되는 장면도 프로게이머들의 경기에서 자주 등장하곤 한다.

이같은 게임 특성상 인공지능이 스타크래프트를 플레이하면서 '최적의 수'를 발견하는 것이 매우 어렵다는게 오 연구원의 설명이다.

◆구글 딥마인드, 스타크래프트 언급한 이유는

구글 제프 딘 시니어 펠로우가 '스타크래프트'를 언급한 것은 인공지능학계에서 가장 활발한 인공지능 연구가 진행되고 있기 때문이다.

실시간 전략 게임과 바둑은 인공지능이 아직 인간을 뛰어넘지 못한 분야다. 지난해 8월 독일에서 열린 CIG 당시 인공지능 전문가들을 대상으로 '인공지능이 바둑으로 인간을 이길 수 있는 날은 언제일까' 라는 주제로 설문 조사를 한 결과 참가자 대부분이 '5년~10년' 으로 예상했다.

알파고의 아버지로 불리는 데미스 하사비스 구글 딥마인드 CEO 조차도 "인공지능이 바둑으로 인간을 이기는 것은 불가능하다고 생각했다"라고 말했을 정도다. 그러나 불과 2달 뒤 알파고가 등장해 판 후이 2단을 꺾었고 이세돌 9단마저 이겼다.

실시간 전략 게임은 인공지능에게 남은 마지막 과제 이기도 하지만 구글 딥마인드에게도 중요한 테스트베드가 될 가능성이 크다.

학계에서는 이미 인공지능이 가장 가까운 미래에 새롭게 적용되는 분야로 '화상을 이용한 의료 진단'을 꼽는다. 이미지 인식 정확도를 비약적으로 향상 시켜 이미지만으로 환자를 진단하는 것을 가능하게 하기 위함이다.

구글 딥마인드는 지난 2월 영국 런던 임페리얼 대학과 왕립 마스덴 NHS 재단 트러스트와 제휴를 통해 '딥마인드 헬스' 프로그램을 공동 개발하기로 제휴했으며 딥마인드 헬스 프로그램을 위한 의사도 채용했다.

스타크래프트 플레이는 정찰을 통해 상대의 진영을 파악하고 제한된 시야로 얻어진 소수의 정보를 '인식'해 전략을 결정해야 한다.

또한 '실시간'으로 진행되는 만큼 정교한 이미지 인식과 분석, 정확한 순간 판단과 인지 능력을 요구한다. 만약 딥마인드가 인공지능 기술을 의학에 적용하려 한다면 게임을 통한 인공지능 기술의 테스트가 중요한 과제가 될 수 있다.

뿐만 아니라 스타크래프트는 전세계적으로 인기를 끌었던 게임이니만큼 구글 딥마인드의 인공지능 기술을 만천하에 알릴 수 있는 또 다른 이벤트 무대가 될지도 모른다.

한편 데미스 하사비스 구글 딥마인드 CEO는 향후 계획에 대해 "영국으로 돌아가게 되면 이번 대국의 데이터를 면밀하게 분석하겠다"며 "이후 더 많은 대국을 할 것인지 관련 기술을 공개할 것인지에 대해 고민할 것"이라며 알파고 인공지능 기술의 오픈소스화 가능성을 시사했다.

성상훈기자 hnsh@inews24.com







포토뉴스