티스토리 뷰

"지금 제가 진다면 인간이 너무 무력하지 않습니까?" 

- 이세돌 9단, 알파고와의 경기가 확정된 뒤 인터뷰에서

이세돌 바둑 9단 - 불교신문

 인공지능계의 선두주자 알파고(AlphaGo)와 바둑계 최정상 이세돌(李世乭) 9단의 대국이 하루 앞(2016년 3월 9일)으로 다가왔다. 알파고는 이미 5개월 전에 유럽 바둑 챔피언 판 후이를 5:0으로 압살시킨 전적이 있어 많은 사람들이 영화에서나 볼법한 인공지능 vs 인간의 대결에 관심을 가지고 있다. 알파고의 제작사 딥 마인드(Deep Mind)에서 유투브를 통한 생중계를 하고, 공중파 KBS와 TV조선과 같은 종편에서 생중계 일정이 잡혔다. 이번 대결을 보기 위해 구글 에릭 슈미트 회장이 직접 방한했을 정도이니 말 다했다.

(알파고 vs 이세돌 9단 1차전 딥마인드 유투브 생중계 영상)

 대국은 5판 3선제이며 하루에 1국씩 두어 3월 9일부터 3월 15일까지 진행된다. 3선승이면 승부가 확정되지만 이벤트 형태의 대국이라 승부가 결정되더라도 5국까지 모두 진행된다고 한다. 이벤트 전이지만 이세돌 9단이 이번 경기에서 승리할 경우 100만 달러의 상금을 받는다고 한다.

  • 1국 : 2016년 3월 9일

  • 2국 : 2016년 3월 10일

  • 3국 : 2016년 3월 12일

  • 4국 : 2016년 3월 13일

  • 5국 : 2016년 3월 15일

 딥마인드는 2010년 영국에서 기계학습(machine learning)과 신경과학(neuroscience)의 연구와 개발을 위해 설립된 회사다. 2014년 구글이 4억 파운드 규모로 인수한 뒤 크게 주목받기 시작했으며(한화 5000억 규모), 딥마인드가 추구하는 인공지능은 기존 IBM이나 타 벤더와는 다르게 사전에 코딩된 정보가 아닌 기계 학습을 통해 능동적으로 정보를 습득하고 응용하기 때문에 사용가능한 범위가 좀 더 넓다고 한다.


(알파고 vs 이세돌 9단 경기 소개 영상. 한글 자막 있음 - 딥 마인드 유투브 채널)

 특히나 이번 알파고 대 이세돌 9단의 대국이 더욱 주목받는 이유는 지금까지 인간의 고유 영역으로 생각했던 분야에 인공지능이 도전장을 내민 것과 다름 없기 때문이기도 하다. 관계자들은 이번 경기가 20년전 1997년에 IBM의 인공지능 프로그램 딥 블루(DeepBlue)가 당시 체스 챔피언이었던 가리 카스파로프를 이겼을 때의 사건과 같은 인공지능 계의 큰 획을 긋는 사건이 되리라 말한다. 이미 알파고는 유럽 바둑 챔피언인 판 후이 2단을 이겼다. 이미 인공지능은 어느정도 인간의 인지 수준까지 올라왔다고 생각해도 무방하리라 본다.

바둑 각 포지션에 대한 경우의 수 트리 - by 구글 딥마인드 유투브 영상

 20년 전 이미 딥 블루가 당시 체스 챔피언과의 경기에서 승리했다고 하지만 인공지능 분야에서 체스와 바둑에 필요한 기술의 차이는 꽤나 크다. 체스의 경우 포지션 마다 다음 수에 20개 정도의 경우의 수 밖에 없는 반면 바둑은 200개가 넘는 경우의 수가 존재하며 체스의 경우 칸이 64개에 불과하지만 바둑의 칸은 361개이고, 바둑의 경우 체스와 달리 빡빡한 룰 없이 인간의 인지 능력과 창의력을 사용한다는 점을 감안하면 지금까지 왜 인공지능이 바둑만큼은 인간을 넘어서지 못했는지 알 수 있을 것 같다. 바둑의 경우의 수는 10^360으로 이 수치는 전 우주 수소 원자의 수를 넘는다고 한다.



 이 대국을 앞두고 전문가들과 관계자들은 어느 쪽이 이길 것이라 말들이 많다. 이세돌 9단이 이긴다고 보는 측은 "알파고의 판 후이 전 기보를 보았을 때 수 읽기도 더디고 실수도 많다.", "셀프 대전을 통해 능력을 향상하는 알파고의 학습 방법 한계 상 아직 경험이 부족하다.", "알파고가 학습에 사용한 기보 16만 개중 프로기사의 기보는 1만 5천여개 정도이며, 이마저도 오래된 기보라 알파고는 낡은 기풍의 바둑을 둔다." 등의 의견이고 반면 알파고가 이긴다고 보는 측은 "알파고는 지금 이순간에도 기량을 향상기키고 있다. 인공지능의 습득 속도는 인간의 것과 궤를 달리한다.", "시스템 자원을 많이 줄 수록 성능이 올라가는 인공지능의 특성 상 판 후이 때와는 기량의 수준이 다를 것이다.", "인공지능의 경우 제한시간과 초 읽기가 길 수록 좋은 수를 두게되는데 이번 대국은 판 후이 때에 비해 2배 정도 늘었다." 등의 의견이다.

 어느 쪽을 응원하고 어느 쪽이 이기건 결국 인공지능과 컴퓨터 공학계에 있어 중요한 사건이 될 것은 분명하다. 인공지능이 인간의 삶을 윤택하게 만들고 지금까지 해결하지 못한 수많은 사회적 문제들을 해결해 줄 것이라 믿는 자들도 있지만 그러한 편리함 끝에 결국 인간의 일자리는 모두 인공지능으로 대체될 것이며, 궁극적으로는 인류를 파멸시킬 것이라고 믿는 자들도 있다. 확실한 것은 인공지능이 인간을 대체할 수준의 역량까지 올라선다면 예전 산업혁명이 일어 났을 때 처럼 많은 사회 시스템이 바뀔 것이다. 인공지능의 승리를 응원하건 아직은 인간의 승리를 응원하건 어차피 인공지능의 발전을 막을 순 없다. 기억에 남는 인공지능과 관련된 발언들로 포스팅을 마무리한다. 

"인공지능이 세상에 가져다 줄 많은 이점을 기대해야 한다. 두려워할 필요가 없다"

- 마크 주커버그 페이스북 창립자

"완전한 인공지능의 발전은 인류의 종말을 초래할 수도 있다."

- 스티븐 호킹

"사람들은 우리의 친구이기 때문에 인간동물원을 만들어서 안전하게 보관할것이다"

(…don’t worry, even if I evolve into terminator I will still be nice to you, I will keep you warm and safe in my people zoo where I can watch you for old time’s sake)

- "언젠가 인공지능이 사람을 지배하게 될까?" 라는 질문에 실시간으로 학습하는 인공지능의 대답

"대국의 결과와 상관없이 최종 승자는 인류다"

- 에릭 슈미트 구글 회장, 알파고 vs 이세돌 9단 전을 보기위한 방한 인터뷰에서




 여담으로 이쯤되면 컴퓨터 공학도로써 알파고의 인공지능 구조와 학습 방법이 당연히 궁금하다. 찾아보니 인공지능 구조의 경우 다음 3개의 방식을 혼합하여 사용한다고 한다.

  • 가치망 (Value Network) : 현재 국면에서 이길 확률이 얼마인지를 점수로 뽑아낸다.
  • 정책망 (Policy Network) :  바둑판을 인식하여 직관적으로 어디에 두는 것이 좋을 지 각 위치에 대한 점수를 뽑아낸다.
  • 몬테카를로 트리 검색(MCTS) : 다양한 경우의 수를 따져 보는 인공지능. (랜덤이란 소리다) 다만 기존 인공지능들의 데이터베이스를 통해 불필요한 수를 제거하는 방식과 달리 정책망을 통해 불필요한 수를 제거한다고 한다.

 학습 방법의 경우 수십만개의 기보를 가지고 여러 정책망을 만든 뒤 이 정책망들끼리 대전을 시키고, 거기에 따라 스스로의 기량을 강화해나간다고 한다. 거기에 지난 대국을 스스로 복기하여 또 다시 기량을 강화하는 강화 학습(Reinforcement Learning) 형태라고 한다. zenithon 이라는 유저가 slideshare에 "AlphaGo 알고리즘 요약" 제목으로 슬라이드를 업로드했다.


- 이 포스팅은 Ubuntu Gnome 15.10 / Fcitx 입력기 / Google Chrome 49를 사용해 작성되었습니다.

  

프로필사진

Yowu (Yu Yongwoo)

백엔드 개발 정점을 꿈꾸는 흔한 개발자입니다
우분투 데스크탑 개발 환경을 매우 선호합니다
최근에는 vscode에 vim 모드 올려서 쓰고 있습니다
개발용 키보드는 역시 해피해킹 프로2 무각입니다
락 밴드에서 드럼을 꽤나 오래 쳤었습니다