일반 지능을 가진 인공지능

2017. 1. 7. 21:31C.E.O 경영 자료

 

일반지능을 가진 인공지능, 디지털 우주 안에서 인공지능이 모든 것을 다 할 수 있도록 훈련시키는 방법. 곧 인간은 인공지능만 가지면 모든 일 시킬수 있다. 인공지능혁명2030저자

박영숙 인공지능혁명2030저자  

    트위터 페이스북 구글 네이버블로그

디지털 우주 안에서 인공지능이 모든 것을 다 할 수 있도록 훈련시키는 방법

인공지능은 이미 60년의 역사를 가졌다. 많은 사람들이 노력하고 정부들이 투자하여 인공지능은 마침내 돈이 되는 산업이 되고 있다. 인간닮은 인공지능이 나왔고, 감정을 느끼는 인공지능, 그리고 체스, 어휘게임인 제퍼디, 그리고 바둑챔피온을 이겼다. 인간을 이기는 정도의 지능을 가진 인공지능이 탄생한 것이다. 인공지능은 배우면 배울수록 더 똑똑해진다. 인간의 뇌는 3기가 정도의 용량을 채우면 다른 정보를 지우고 새 정보를 넣지만, 인공지능은 지속적으로 용량을 증가시킬 수 있다. 그래서 인공지능은 인간의 모든 역할을 대행할 수 있게된다. 결국 이런 인공지능을 인간이 훈련시켜 "앵벌이"를 시킬 수 있는 것이다. 인간은 놀고 인공지능에게 일을 대신 시킬 수 있게되는 것이다.

내가 일하러 가는 길에 유치원이 있다. 나는 매일 안을 들여다보았다. 장난감과 퍼즐, 음악과 책, 화분과 가끔 고양이까지 있는 교실은 분명히 아이들이 서로 그리고 세상과 상호 작용하면서 놀 수 있는 풍부한 환경을 가지고 있었다. 아이들의 놀이는 그 의미와는 달리 단순하지 않다. 재미있기만 한 것은 아니다. 놀이는 세계를 이해하는 과정이다. 다양하고 흥미로운 우주에서 놀게 하는 것은 아이들의 지능을 키우는 방법이다. 인공지능은 같은 방법으로 학습할 수는 없을까?

오픈AI(OpenAI)는 미국을 대표하는 기업가와 투자자가 모여 인공지능을 오픈소스화하기 위해 설립한 비영리 연구기관이다. 오픈AI(OpenAI)는 최근 인공지능이 마음껏 탐색하고 놀 수 있는 가상 세계를 공개했다. 유니버스(Universe)라는 이름의 플랫폼의 목표는 그 이름만큼 광대하다. 유니버스는 인공 지능을 훈련시키는 것을 목표로 하는 인공지능 학습 플랫폼이다. 오픈AI는 개별 인공지능 ‘에이전트’에게 다양한 실제 업무를 가르침으로써 인간이 가지고 있는 유연한 추론 기술을 갖춘 진정한 지능형 봇에 한 발 더 가까이 다 가설 수 있기를 희망하고 있다.

일반 지능(General intelligence)

인공 지능이 스마트하다는 것은 의심의 여지가 없다. 컴퓨터는 이제 언어를 정확하게 보고, 듣고, 번역할 수 있으며 경우에 따라 사람을 능가한다. 올해 초에 바둑에서 구글 딥마인드의 알파고는 18번이나 세계 챔피언을 지낸 이세돌 기사에게 놀라운 승리를 거두었으며 이는 전문가들이 예측한 것보다 10년 이상이나 빠른 성과였다. 그러나 인공지능은 여전히 훈련받은 분야에만 능숙하다는 것이 사실이었다. 알파고에게 체스 게임을 하도록 한다면 규칙을 자세하게 설명해준다 하더라도 프로그램은 완전히 당황스러운 상황을 연출하게 될 것이다. 현재의 인공지능 시스템은 한 가지의 특별한 재능을 갖고 있다. 인공지능이 훈련받는 방식은 부분적으로 잘못되었다. 연구원들은 일반적으로 인공지능을 초기화하고, 하나의 작업을 마스터하고 종료할 때까지 수백만 번의 시도를 거친다.

인공지능이 결코 다른 것을 경험하지 않았으므로 다른 문제를 해결하는 방법을 알 수 없는 것이 당연하다. 새로운 문제를 해결하기 위해 이전 경험을 사용하는 인간과 같은 일반 지능을 얻기 위해서는 인공 지능도 자신의 경험을 다양한 새로운 과제로 옮길 수 있어야 한다. 유니버스가 하는 일이 이것이다. 오픈AI의 연구원들은 인공지능에게 다양한 시나리오로 가득 찬 세계를 경험하게 하여 하나의 루프에 갇혀있지 않고 ‘생각할 수 있는’ 지식과 유연한 문제 해결 기술을 개발할 수 있게 되었다.

전혀 새로운 세상

요컨대, 유니버스는 연구원이 인공지능 에이전트를 교육할 수 있는 일반적인 방법을 제공하는 수천 개의 환경을 포괄하는 강력한 플랫폼이다.

소프트웨어 플랫폼인 유니버스는 다른 소프트웨어를 실행할 수 있는 단계를 제공하며, 각각의 프로그램은 서로 다른 환경을 제공한다. 예를 들어 아타리와 플래시 게임, 앱, 웹 사이트는 이미 적용되고 있다. 인공지능을 학습에 이용하는 게임 중에는 GTA5 등 다양한 종류의 게임이 있고 이를 이용해 강화학습과 같은 인공지능 학습을 진행할 수 있다. 이론적으로는 유니버스가 모든 컴퓨터에서 모든 소프트웨어를 실행할 수 있기 때문에 연구원들이 인공지능에게 인간처럼 컴퓨터를 이용해 다양한 작업을 수행하게 할 수 있다. 마치 여러 활동을 수행하는 여름 캠프에 아이들을 데려 오는 것과 같다. 좋아하는 조카딸을 데려와서, 활동을 선택하고, 익숙해질 때까지 기다렸다가, 다른 활동을 선택하고, 이를 반복하는 것이다.

유니버스는 기존 라이브러리인 텐서플로우(TensorFlow)와 티아노(Theano)를 그대로 이용할 수 있다. 인공지능이 학습을 하려면 다양한 작업을 경험하게 할 필요가 있는 것이다. 오픈AI는 지난 4월 인공지능 훈련 환경을 제공하는 짐(Gym)을 공개한 바 있다. 이번에 새로 출시한 유니버스는 프로그램을 짐 환경으로 바꾸는 것도 가능하기 때문에 지금까지 짐을 이용해온 인공지능 연구자라면 순조롭게 환경을 마이그레이션할 수도 있다. 유니버스는 가상 네트워크 컴퓨팅(가상 네트워크 컴퓨팅, VNC)를 비롯한 원격 데스크톱을 통한 자동 작동 프로그램, 소스코드와 봇, API 등에 대한 특별한 접근도 필요 없다. 유니버스의 목표는 어려운 환경이나 알 수 없는 작업도 빠르게 학습할 수 있는 플랫폼을 제공하는 것이다. 일반 지능을 갖춘 인공지능 생성을 위해 중요한 단계가 될 수 있기 때문이다.

학습의 결과는?

유니버스에 연결된 모든 인공지능들은 알파고의 성공을 뒷받침한 강력한 기술인 강화 학습을 통해 교육을 받게 된다. 사실, 그 기술은 우리가 돌고래, 개, 그리고 아이들을 교육하는 방법에 대한 멋진 용어일 뿐이다. 시행착오를 통해 배우는 것이다. 행동을 선택하고 보상을 받으면 계속 하는 것이다. 그렇지 않다면 다른 것을 시도하는 것이다. 연구원들은 완전히 비어 있는 인공 지능으로 시작하는 대신 인간이 문제를 해결하는 방법을 "보게" 하여 학습과정을 향상시킬 수 있다. 이를 통해 인공지능은 초기 인상을 형성하고 솔루션을 최적화하는 방법을 더 잘 이해할 수 있다.

강화 학습은 이미 많은 인공지능 응용 프로그램에서 사용되고 있다. 그러나 유니버스 안에서 이 기술의 힘이 매우 빛난다. 인공지능은 게임과 앱 사이를 뛰어 넘을 수 있기 때문에 하나의 앱에서 배운 것을 받아들여 다른 앱을 쉽게 사용할 수 있다. 이러한 학습 전이는 배우기는 힘들지만 지능을 갖춘 기계로 가는 길에 필수적인 기술이다. 오픈 AI에 의하면 우리는 느리지만 그렇게 가고 있다. 일부 인공지능 에이전트들은 이미 하나의 운전 게임에서 다른 학습 게임으로 학습전이를 할 징후를 보여주고 있다.

게임에서 비트 세계로

많은 다른 인공지능 개발자와 마찬가지로 오픈AI는 게임을 사용하여 유니버스를 시작했다. 그 이유는 쉽게 벤치마크 할 수 있기 때문이다. 게임은 다양한 통계와 점수로 측정되기 때문에 시스템이 인공지능의 프로세스를 측정하여 그에 따라 보상을 하는 것이 쉽다. 이는 강화 학습에 절대적으로 중요한 요소이다.

게임의 경우 인공지능 에이전트는 더 나은 점수를 낼 수 있도록 플레이하는 방법을 배우는 것이다. 그리고 게임 화면에 뭔가 수치가 표시되는 경우가 많은 만큼 이를 이용해 더 나은 점수를 낼 수 있도록 인공지능이 학습을 하는 것이다. 게임 외에도 웹브라우저를 통해 빈번하게 이뤄지는 드래그앤드롭이나 텍스트 박스에 문자를 입력하고 슬라이더 이동 등 다양한 작업에도 이용할 수 있다. 그러나 게임은 디지털 세계와의 상호 작용의 한 가지 방편일 뿐이다. 유니버스는 이미 미니 비트 세계(Mini World of Bits)라고 부르는 프로젝트를 통해 한계를 뛰어 넘고 있다.

비트는 인터넷을 탐색하는 동안 우리가 접하게 되는 다양한 웹 브라우저들의 상호 작용 모음이다. 드래그앤드롭이나 텍스트 박스에 문자를 입력하는 일은 단순하지만 웹에서 부물을 찾는 방법의 기초를 형성한다. 궁극적으로 오픈AI는 목표를 위해 웹을 유동적으로 탐색할 수 있는 인공지능(예 : 항공편 예약)을 구상하고 있다. 유니버스 환경 중 하나에서 연구원들은 이미 인공지능에게 원하는 예약 일정을 부여하고 여러 항공사의 항공편을 검색하도록 교육 하고 있다.

이러한 일은 시작에 불과하다. 유니버스는 더 커지기 위한 세트이다. 마인크래프트를 테스트 환경으로 이용하고 있는 인공지능 플랫폼인 마이크로소프트의 말모(Malmo)는 인기 있는 단백질 접기 게임인 폴드잇(fold.it), 안드로이드앱, HTML5 게임, ‘실제로 사람들이 생각하는 모든 것’을 이용하고 있으며 조만간 유니버스와 통합될 예정이다.

기계 안의 유령

이제 인공지능을 훈련시켜 여러 가지 게임을 하고 웹을 탐색할 수 있게 되었다. 큰 성과이다. 이제 인공지능이 일반지능을 얻게 될까? 아마 먼 길을 더 가야 하겠지만 그렇게 될 것이다. 그러나 당신이 주는 모든 게임에서 이기는 방법을 알고 있는 인공지능은 논리적으로, 여러 단계로 이기는 법을 이미 알고 있다. GTA5(Grand Theft Auto V)의 혼란스러운 세계를 헤쳐 나갈 수 있는 인공지능은 이미 실제 물리학의 기초와 폭력과 보복까지 이해하고 있다. 웹 서핑을 할 수 있는 인공지능은 이미 인간이 서로 이야기하는 방식을 이미 알고 있으며 정보를 얻거나 자신의 웹 ID를 설정하거나 당신의 정보를 엿볼 수 있다. 우리는 매일 디지털 영역 안에서 배우고, 놀고, 일하고 성장한다. 많은 사람들에게 0과 1의 세계는 우리가 태어난 자연의 세상과 같다. 이제 인공 지능이 디지털 세계에 접근할 수 있게 되었다. 이제 인공지능이 얼마나 멀리 갈 수 있는지 살펴보자.

Banner Image Credit: Shutterstock