로봇 IT산업의미래

인공지능의 미래

박송 입니다. 2019. 12. 10. 15:17

인공지능

AI, artificial intelligence

인공지능이 인간을 지배할 수 있을까?

2015년, 인공지능 전쟁의 서막

세계 최고의 기술 산업들이 탄생한다는 미국 캘리포니아의 실리콘밸리. 인텔, HP 등 전 세계를 호령하는 IT기업이 탄생한 미래 기술의 진원지 실리콘밸리는 스타트업 열풍으로 그 어느 때보다 뜨거운 한 해를 보냈다. 집의 빈방을 여행객에게 공유하는 서비스인 에어비앤비의 시가총액은 약 32조 원으로 거대 호텔체인 힐튼월드와이드의 26조 원을 넘어선 지 오래이고, 모바일로 택시를 부르는 서비스 우버 역시 시가총액 약 80조 원으로 현대자동차의 시가총액 33조 원을 두 배 이상 뛰어넘었다. 신기술로 끊임없이 세상에 파괴적 혁신을 가져오는 실리콘밸리, 지금 이곳의 IT기업들이 가장 주목하고 있는 기술은 무엇일까?

그것은 바로 공상과학 영화에서 많이 봐왔지만 아직까지 실현되지 않았던 미래기술, 바로 '인공지능(Artificial Intelligence, AI)'이다. 구글은 인공지능을 이용해 사람 없이 스스로 운전할 수 있는 차량인 자율주행차를 개발해 현재 실전 투입을 눈앞에 두고 있다. IBM이 개발한 슈퍼컴퓨터 왓슨(Watson)은 2011년 미국의 유명 퀴즈프로그램 제퍼디(Jeopardy)에서 문제를 음성으로 듣고 부저를 눌러 푸는 동등한 환경에서 기존 퀴즈의 달인들을 제치고 우승한 바 있다. 뿐만 아니라 체스, 장기 등에 이어 경우의 수가 많아 정복이 어렵다던 바둑마저 인공지능에 의해 정복당할 기세이다. 비록 얕은 속임수를 쓰기도 한 것으로 알려져 있긴 하지만 2014년 인공지능이 튜링테스트를 통과했다는 소식은 우리에게 인간의 지능에 가까운 인공지능의 출현에 대한 경각심을 안겨주기도 하였다.

    • 1인간
    • 2인공지능

사실 인공지능이 우리의 삶에서 아주 동떨어진 기술은 아니다. 우리가 매일 사용하는 스마트폰에도 인공지능 기술이 들어 있다. 대표적인 것이 바로 카메라의 초점을 자동으로 잡아주는 '얼굴인식' 기능과 애플 시리(Siri)와 같은 '음성인식' 기능이다. 이들은 인간의 인위적인 개입 없이 인간이 의도하는 바를 '알아서' 처리해 주는데, 이러한 기능을 하는 모든 에이전트들을 우리는 인공지능이라 부를 수 있다. 인터넷 검색을 할 때 자동으로 추천 검색어를 띄워 주는 것도, 유튜브에서 외국 영상을 보면 자동으로 자막이 생성되는 것도 모두 인공지능이 우리에게 주는 혜택들이다. 이렇듯 이제 많은 미래상품들의 경쟁력은 인공지능 기능에 따라 그 성패가 갈릴 것으로 보인다. 이것이 바로 실리콘밸리 기업들이 인공지능을 파괴적 혁신을 가져올 미래의 주역으로 보는 이유 중 하나이다.

청소하는 인공지능 로봇

ⓒ 과학동아북스 | 저작권자의 허가없이 사용할 수 없습니다.

현재에도 조금씩 인공지능에 파괴적 혁신이 이루어지는 분야들을 볼 수 있다. 대표적인 예로는 의료 분야와 금융 분야를 들 수 있다. 인공지능이 잘 적용되려면 (i) 빅데이터를 쉽게 수집할 수 있어야 하고, (ii) 그것이 정형화된(일정한 틀을 따르는) 데이터이면 더욱 유리하며, (iii) 애매한 상황보다는 숫자로 읽힐 수 있고 숫자로 기여 가능한 환경이면 더더욱 인공지능의 적용이 용이해진다. 그런 측면에서 볼 때 의료 분야와 금융 분야는 인공지능이 접근하기 비교적 용이한 산업으로 분류된다.

의료 분야에서는 X-레이 · CT · MRI 등 메디컬 이미지를 인공지능을 이용해 자동분석하는 분야가 급부상하고 있으며, 미래엔 간단한 진료 역시 방대한 의학데이터를 기반으로 한 인공지능이 해결해 줄 수 있을 것이란 전망이다. 금융 분야에서는 사람이 주식변동 그래프를 보고 투자를 판단하는 것이 아니라 인공지능이 다양한 자료들을 직접 숫자로 받아들여 투자를 판단하는 알고리즘이 각광을 받고 있다. 보험업계 역시 보험료 계산을 데이터에 따른 위험률에 기반하여 인공지능이 판단하도록 하고 있다. 이러한 산업에 대한 인공지능의 잠식은 단지 미래사회의 예고편에 불과하다. 앞으로 많은 영역들이 인공지능의 자동알고리즘에 의해 대체될 것으로 보이며, 이에 따른 직업군의 변화 역시 매우 클 것임에 틀림없다.

순위직업위험성종사자 수
1텔레마케터99.0%43,000
2(컴퓨터)입력 요원98.5%51,000
3법률비서98.0%44,000
4경리97.6%132,000
5분류업무97.6%22,000
6검표원97.6%63.000
7판매원97.2%70,000
8회계관리자97.0%
9회계사97.0%35,000
10보험사97.0%77,000
11은행원96.8%146,000
12기타 회계 관리자96.8%175,000
13NGO 사무직96.8%60,000
14지역 공무원96.8%147,000
15도서관 사서96.7%26,000
총 종사자 수1,527,000
BBC가 발표한 미래에 사라질 위험이 있는 직업군 순위

미래 기술사회에서 인공지능의 역할은 아무리 그 중요성을 강조해도 지나침이 없다. 하지만 이 기술을 올바르게 이해하고 더 발전시키기 위해서는 인공지능을 단지 SF영화의 이야깃거리로 말하는 것에서 벗어나 좀 더 현실적으로 다룰 필요가 있다. 인공지능은 과연 어떠한 과정을 통해 발전되어 왔을까? 최근 들어 왜 갑자기 인공지능 기술이 주목받는 것일까? 많은 사람들에게 회자되는 기계학습과 딥러닝이란 과연 어떤 기술일까? 지금부터 이 질문들에 대해 답해 보도록 하자.

20세기의 인공지능 : 탐색과 추론

인공지능에 대한 이야기를 할 때 꼭 나오는 이야기 중 하나가 바로 강한 인공지능과 약한 인공지능에 대한 이야기이다. 강한 인공지능은 인간과 같이 감정을 갖고 사리판단을 할 수 있는 인간과 비슷한 객체로서의 인공지능을 이야기하고, 약한 인공지능은 특정 기능만을 대체하는 부분적 인공지능을 일컫는다. 이는 매우 오래된 담론으로 현대에 있어서는 그리 중요한 이야기는 아닌 것 같다. 왜냐하면 현대에는 이에 대한 특별한 구분 없이 핸드폰과 같은 기기에 탑재되는 약한 인공지능에 대한 연구부터 시작하여 종합적 사고판단을 할 수 있는 강한 인공지능을 목표로 활발한 연구가 이루어지고 있기 때문이다. 참고로 많은 이들이 인공지능의 잠재적 해악을 이야기할 때 '인공지능이 인간을 해치면 어떻게 하는가?'와 같은 질문을 던지는데, 강한 인공지능에 도달하기까지의 기술개발의 길이 아직 매우 멀기에 그것에 대한 두려움을 갖기엔 아직은 약간 이른 담론이 아닌가 싶다.

지금부턴 인공지능의 순차적 발전 과정을 살펴보고자 한다. 그것을 이해한다면 아마도 지금의 인공지능 붐과 미래의 인공지능에 대해 연속성 있게 예측할 수 있는 눈을 갖추게 될 것이다. 초기의 인공지능은 트리 탐색(tree search) 문제풀이에 가까웠다. 대표적인 인공지능 문제 중 하나인 하노이의 탑을 한번 생각해 보도록 하자. 이 문제의 규칙은 간단하다: (i) 원판은 한 번에 하나씩만 옮길 수 있으며, (ii) 큰 판은 작은 판 위로 올라갈 수 없다. 이 두 가지 규칙을 지키며 한쪽에 있는 원판들을 모두 다른 한쪽으로 옮기는 것이 하노이의 탑 문제의 목표이다. 이 문제는 매우 간단해 보이지만 직접 해보면 그리 간단하게 풀리는 문제는 아니란 점을 깨닫게 될 것이다.

인공지능의 고전 문제 중 하나인 ‘하노이의 탑’ 문제.

이 문제는 탑의 현재 상태와 이 상태에서 취할 수 있는 행동들을 기반으로 트리를 만들어 그 트리의 탐색 문제로 대치하여 풀 수 있다.

ⓒ 과학동아북스 | 저작권자의 허가없이 사용할 수 없습니다.

고전의 인공지능은 이 문제를 트리 탐색 문제로 대치하여 해결한다. 예를 들어 초기 상태에서 내가 할 수 있는 행동은 맨 위에 있는 원판을 두 번째 또는 세 번째 칸으로 옮기는 것이다. 이것은 첫 노드에서 다른 두 노드로 가지를 뻗어나가는 것으로 생각할 수 있다. 마찬가지로 그 이후의 노드들 역시 각각의 상태에서 취할 수 있는 행동과 이후 얻어지는 결과 상태의 가지들로 표현할 수 있을 것이고, 이를 반복하면 모든 경우의 수에 방대한 트리를 얻을 수 있을 것이다. 남은 일은 어떠한 경로를 따라가야 원하는 정답 상태까지 도달할 수 있을지 트리를 탐색하는 것이다.

고전의 인공지능 문제는 이러한 거대한 트리 속에서 어떻게 하면 빠르게, 그리고 정확히 해답을 찾을 수 있을까에 대한 문제였다. 다시 말해 현실에 해결해야 할 문제가 있다면 그것을 내가 취할 수 있는 행동과 결과 상태들에 대한 경우의 수로 나열하여 방대한 트리를 만들고, 그 트리를 탐색함으로써 문제에 대한 해결책을 얻는 것이다. 모든 노드를 모두 탐색(방문)한다는 것은 모든 경우의 수를 다 따져보는 것과 동일한 뜻인데, '어떤 순서로 노드들을 탐색하느냐'가 인공지능의 성능을 크게 좌우한다. 대표적인 트리 탐색방법으로는 한 가지 줄기씩 모두 탐색하는 깊이우선탐색(depth-first search, DFS)과 같은 높이의 노드들을 모두 방문하며 내려가는 너비우선탐색(breadth-first search, BFS)이 있다. 미로 찾기나 체스 같은 간단한 인공지능 문제들은 이렇게 트리 탐색 문제로 대치하여 문제를 해결할 수 있다.

    • 1너비우선탐색(BFS)
    • 2깊이우선탐색(DFS)

고전의 인공지능 문제는 선택의 경우의 수에 따른 트리 탐색으로 대치할 수 있다. 위의 그림은 3번의 양자택일 선택에 따른 경우의 수 트리를 보여주는데, 각 단계별로 선택 가능한 경우의 수를 모두 따져보는 너비우선탐색(BFS)과 한 가지 길씩 체크해 보는 깊이우선탐색(DFS)을 보여주고 있다.(그림에서 숫자는 노드를 방문하는 순서를 나타낸다.)

하지만 이러한 접근 방법에는 문제가 존재한다. 우리가 현실에서 맞이하는 문제들은 하노이의 탑이나 체스처럼 명확하게 정의가 되지 않는 경우가 대부분이기 때문이다. 사진에서 얼굴을 인식하는 문제를 예로 들어보자. 이미지에는 어떠한 상태들을 정의할 수 있을까? 100×100 사이즈의 흑백사진만 해도 각 픽셀이 0(흑) 또는 1(백)을 가리킨다고 하면 총 21만 가지의 셀 수 없을 정도로 많은 상태가 존재하게 될 것이다. 이들 하나하나의 경우의 수에 의미를 부여하는 것이 과연 현명한 방법일까? 결과적으로 트리 탐색의 인공지능은 문제를 시스템적으로 해결하고자 하는 최초의 시도로서 의미가 있었지만 그것들은 간단한 게임과 같은 정형화된 상황에만 적용 가능한 인공지능이었을 뿐, 인간이 마주하는 현실을 잘 해결할 수 있는 접근 방법은 아니었던 것이다.

모든 경우의 수를 따져 문제를 해결하고자 하는 트리 탐색 기반의 인공지능과 달리, 많은 양의 지식을 에이전트에 주입시킴으로써 인공지능이 지식을 기반으로 판단하게끔 하는 지식추론 기반의 전문가 시스템(expert system)도 고전 인공지능의 한 축을 이루었다. 예를 들면 이 세상의 모든 의학지식을 에이전트에 주입하여 의사의 역할을 할 수 있는 인공지능을 꿈꾸거나 법률에 대한 모든 지식을 주입하여 법률가의 역할을 할 수 있는 인공지능을 꿈꾸었던 것이다. 연구자들은 세상에 있는 모든 지식을 모두 에이전트에 탑재해 그 지식을 기반으로 옳은 판단을 내리는 인공지능을 개발하려는 시도를 했으며, 만약 세상의 모든 지식을 에이전트에 담을 수 있다면, 그 에이전트는 인간보다 뛰어난 판단력을 가질 수 있을 것이라 기대했었다.

하지만 이 역시도 결국 미완의 시도로 끝이 났다. 실패한 가장 큰 이유는 세상에 존재하는 대부분의 판단은 매우 '애매한' 조건들 속에서 이루어지는 '종합적' 판단이라는 것이다. 예를 들어 우리는 친구가 문을 열고 들어와 축 처진 어깨로 슬픈 눈빛을 하며 “안녕”이라고 말하는 것만으로도 “너 오늘 무슨 일 있어?”라며 그 상황을 이해하고 대응할 수 있다. 하지만 인공지능을 위해 이러한 애매한 조건들 속의 지식을 일일이 코딩하는 것은 거의 불가능에 가깝다. (예를 들어 '슬픈 눈빛이란 평소의 눈 크기보다 30%가량 작은 눈 크기로 10도 이상 처진 눈꼬리를 가졌을 때를 말한다'라고 정의하는 것 자체가 불완전하고 거의 불가능에 가까운 작업들이다.) 따라서 세상의 모든 상황을 알려줄 순 없다는 점, 그리고 사람은 모순된 상황들 속에서 종합적인 판단을 한다는 점에서 전문가 시스템 기반의 인공지능은 이내 한계점을 맞이하게 된다.

다양한 각도에서 찍힌 한 사람의 모습

ⓒ 과학동아북스 | 저작권자의 허가없이 사용할 수 없습니다.

위의 사진은 비록 다양한 각도에서 찍힌 한 사람의 모습이지만 인간은 이것을 보고 같은 인물임을 곧바로 알 수 있다. 하지만 인공지능은 어떨까? 물체(얼굴)가 보여질 수 있는 모든 가능성들을 빠짐없이 코딩하는 것이 가능할까? 그러한 방식으로 과연 완벽한 인공지능을 만들 수 있을까? 아마 쉽지 않을 것이다. 이러한 점에서 전문가 시스템 기반의 인공지능은 금세 한계점을 나타내었다. 이러한 한계들 속에서 새로운 인공지능의 패러다임으로 떠오른 것이 바로 기계학습(Machine Learning)이다. 기계학습은 기존의 논리, 추론 위주의 인공지능과는 달리 경험을 통해 쌓인 데이터로부터 귀납적으로 판단을 내린다. 이는 인간의 학습방법과도 매우 유사하다고 볼 수 있다. 어떠한 룰에 따라 판단하는 것이 많은 경험의 '패턴'을 통해 별 고민 없이 판단을 내릴 수 있듯, 인공지능도 데이터를 기반으로 그러한 시도를 해보자는 것이 바로 기계학습의 시작이었다. 스스로 학습하는 인공지능인 기계학습, 기계학습은 21세기의 새로운 핫 키워드로 떠오른다.

현재 기술 사회의 가장 핫한 이슈, 기계학습

기계학습이란 경험(experience)을 통해 특정 작업(task)의 성능(performance)을 향상시키는 방법을 말한다. 이는 몇 가지 특정한 사건들보다 다수의 사건에 대한 경험을 통해 그들의 추세(패턴)를 학습하고, 이를 기반으로 판단을 내린다는 점에서 '패턴인식(Pattern Recognition)'이라고도 불리는데, 전통적인 통계학을 기반으로 한 인공지능의 새로운 패러다임이라고 할 수 있다.

기계학습 이전의 고전 인공지능은 다양한 상황들에 대해 인간이 정해준 규칙에 따라 판단하는 논리 기계와 유사했다. 하지만 세상일은 워낙 다양한 요인들에 의해 발생하고 일반적인 규칙으로는 설명할 수 없는 예외적인 상황도 종종 발생하다 보니 실제 문제의 적용에 있어서 고전 인공지능은 무한한 케이스들에 대한 끝없는 수정과 보완을 필요로 했었다. 그럼에도 불구하고 우리는 무한한 케이스들 모두를 대응할 수 없기에 기존의 인공지능은 단순한 문제에만 적용 가능한 불완전한 인공지능일 수밖에 없었다.

간단한 기계학습 문제 중 하나. 만약에 데이터가 선형모델을 따른다고 가정한다면, 우리는 주어진 문제를 직선의 매개 변수 a, b를 찾는 문제로 치환할 수 있을 것이다. 이를 통해 우리는 새로운 질문(예를 들면 '키 180cm인 사람의 몸무게는 몇 kg일까?')에 대해 답을 예측할 수 있다.

하지만 기계학습은 인간의 사전 지식(prior knowledge)에 의존하기보다는 데이터 그 자체에서 의미 있는 판단을 뽑아내는 데 중점을 둔다. 예를 들어 위의 그림과 같이 키와 몸무게의 상관관계에 대한 데이터를 얻었다고 하자. 그렇다면 우리는 이 데이터들을 가장 잘 표현하는 추세선(fitting curve)을 얻은 뒤, 이 추세선을 기반으로 새로운 질문에 대해 답을 할 수 있을 것이다. 예를 들면 “키가 180cm인 사람의 몸무게는 얼마인가?”란 질문에 대해 “80kg”이라고 대답하듯 말이다.

물론 키가 180cm인 사람이 모두 몸무게가 80kg인 것은 아니겠지만, 인공지능은 이 질문에 대해 가장 높은 확률을 가진 답이 80kg이라고 답하며, 이와 함께 다른 몸무게를 가질 가능성이 있는 확률분포를 제공하기도 한다. 이처럼 기계학습은 기존 데이터의 패턴을 기반으로 새로운 질문에 답을 하는 알고리즘인데, 그 성능은 데이터의 양과 질에 크게 의존하기에 무엇보다 예측에 필요한 양질의 데이터를 수집하는 것이 중요하다. 이것이 바로 구글과 같은 기업이 사용자 데이터 수집에 사활을 걸고 있는 이유이기도 하다.

기계학습

주어진 데이터를 기반으로 가장 적합한 답을 예측하는 것이 목표이다.

ⓒ 과학동아북스 | 저작권자의 허가없이 사용할 수 없습니다.

보통 기계학습은 주어진 훈련데이터를 가지고 데이터의 패턴을 파악한 후 이를 바탕으로 새로운 질문에 대해 예측(prediction)하는 것을 목적으로 하는데, 이는 크게 지도학습(supervised learning)과 비지도학습(unsupervised learning)으로 구분할 수 있다. 지도학습은 훈련데이터(초기 패턴을 학습할 수 있도록 이용 가능하게 주어진 데이터)에 조건 X뿐만 아니라 이에 대한 정답(또는 라벨) Y까지 주어져 있는 경우의 기계학습을 말한다.

지도학습과 비지도학습의 예제.

지도학습의 경우는 훈련데이터 각각에 대해 라벨이 주어져 있는 반면에 비지도학습은 그런 것 없이 단지 데이터의 분포만을 활용하여 어떠한 부류의 군집(clustering)들이 있는지 분석해낸다.

ⓒ 과학동아북스 | 저작권자의 허가없이 사용할 수 없습니다.

예를 들어 우리에게 주어진 사진 자료들이 “얘는 영희, 얘는 철수, 얘는 강아지……”와 같이 사진마다 일일이 라벨링이 되어 있다면 이를 학습하고 다른 사진들에서 영희, 철수, 강아지들을 찾아내는 문제는 지도학습 문제로 볼 수 있다. 반면 여러 동물 사진을 섞어 놓고 이 사진에서 비슷한 동물끼리 자동으로 묶어보라고 이야기한다면 이는 비지도학습 문제라고 볼 수 있다. 인간은 이러한 지도학습과 비지도학습의 과정을 모두 이용한다고 알려져 있으며, 아직까지의 인공지능은 지도학습 연구가 더욱 활발하다. 하지만 인간이 세상을 라벨링 없이도 이해할 수 있듯이(예를 들어 굳이 '강아지'라고 배운 적 없어도 비슷한 종류를 모두 강아지라고 구분할 수 있듯), 미래의 인공지능 역시 라벨링 없이 세상을 이해할 수 있는 비지도학습이 더욱 강조될 전망이다.

기계학습은 어떠한 종류의 특징값(feature)들을 입력값으로 이용하는지가 기계학습의 성능에 매우 큰 영향을 준다. 예를 들어 기계학습을 이용해 우리가 사진 속 얼굴들이 누군지 인식해야 한다면 우리는 이미지의 개별 픽셀들을 기계학습의 입력값으로 사용할 수도 있겠지만, 그 대신 눈, 코, 입 등을 따로 떼어서 입력값으로 이용할 수도 있을 것이다. 또 다른 예로 인간의 보행동작을 기계학습을 이용해 분석하려고 한다면, 관절들의 위치를 기계학습의 입력값으로 사용할 수도 있겠지만, 관절들의 각도 또는 각속도를 입력값으로 선택할 수도 있을 것이다. 이처럼 우리가 선택할 수 있는 특징값의 형태는 무궁무진하다. 더욱 좋은 기계학습 성능을 얻기 위해서는 같은 사물들을 비슷한 특징들로 묶어주고 다른 사물들을 구별되는 특징들로 묶어주는 특징값을 찾는 것이 매우 중요하다.

머신러닝

기계학습은 여러 재료(입력값)를 받아 요리를 하는 요리도구와 같다. 어떤 재료를 요리도구에 넣느냐가 그 맛(성능)을 크게 좌우한다.

ⓒ 과학동아북스 | 저작권자의 허가없이 사용할 수 없습니다.

예를 들어 우리가 개와 물고기 사진을 구분하는 분류(classification) 문제를 기계학습으로 풀어야 한다고 생각해보자. 색깔이 이들을 구분하는 데 좋은 특징값이 될까? 아마도 아닐 것이다. 한 가지 가능한 방법으로는 사진에서 먼저 털을 검출해낸 뒤 털이 많은 것을 개, 털이 거의 없는 것을 물고기라고 판단할 수 있을 것이다. 이처럼 우리는 원본 사진 대신 전처리(preprocess)를 통해 사진 속의 털을 강조한 사진을 기계학습에 입력값으로 이용할 수 있는데, 이것이 바로 좋은 특징값을 이용한 예일 것이다. 이처럼 기계학습의 성능은 기계학습 알고리즘의 우수성과도 관련이 있지만, 이에 못지않게 사용자가 입력하는 특징값에도 많은 영향을 받는다. 좋은 특징값을 찾기 위해 기계학습 연구자들은 원래의 데이터를 또 다른 공간으로 매핑하여 사용하는 커널(kernel) 방법을 이용하기도 했다.

그럼에도 불구하고 어떠한 특징값을 사용해야 좋은지는 여전히 기계학습의 어려운 과제 중 하나이다. 이러한 어려움을 극복하기 위해 새로운 방법론이 제시되었는데, 이것이 바로 최근 큰 관심을 끌고 있는 딥러닝이다. 미래 인공지능의 희망이라 불리는 딥러닝, 그것은 과연 무엇일까?

딥러닝이 이끄는 인공지능의 미래

딥러닝(Deep Learning) 또는 딥뉴럴네트워크(Deep Neural Network)라고 불리는 기술은 사실 오랜 역사를 가진 인공신경망(Artificial Neural Network)이 발전한 형태라고 할 수 있다. 이 방법은 사람의 뇌가 수많은 신경세포들에 의해 움직인다는 점에 착안하여 만들어졌는데, 많은 수의 노드들을 놓고 그들을 연결하여 이들의 연결값들을 훈련시켜 데이터를 학습한다. 즉, 관측된 데이터는 많은 요인들이 서로 다른 가중치로 기여하여 만들어졌다고 생각할 수 있는데, 인공신경망에서는 요인들을 노드로, 가중치들을 연결선으로 표시하여 거대한 네트워크를 만든 것이다. 딥러닝은 간략히 말해 이러한 네트워크들을 층층이 쌓은 매우 깊은 네트워크를 일컫는다.

1920년대부터 꾸준히 연구되어 온 인공신경망은 이내 한계에 부딪혔는데, 그 이유는 거대한 네트워크를 학습시키는 방법이 많이 발달되지 않았기 때문이었다. 또한 거대한 네트워크를 학습시키려면 많은 양의 데이터와 이를 처리할 수 있는 컴퓨팅 파워가 필요했는데, 당시에는 이러한 조건들이 받쳐주지 않아 인공신경망은 불완전한 방법으로 여겨졌었다. 하지만 2000년대 중반부터 깊은 인공신경망인 딥뉴럴네트워크를 학습하는 방법이 개발되어 현재는 이미지인식, 음성인식, 자연어처리 등 다양한 분야에서 표준 알고리즘으로 자리 잡고 있으며, 매우 빠른 속도로 기존의 기계학습 방법들을 대체하고 있다.

그렇다면 딥러닝이 여러 머신러닝 챌린지에서 다른 기계학습 방법들을 압도할 정도로 좋은 성능을 보일 수 있는 비결은 과연 무엇일까? 그것은 바로 특징값 학습(representation learning)에 있다. 기계학습의 단점 중 하나는 좋은 특징값을 정의하기가 쉽지 않다는 점이었는데, 딥러닝은 여러 단계의 계층적 학습 과정을 거치며 적절한 특징값(입력값)을 스스로 생성해낸다. 이 특징값들은 많은 양의 데이터로부터 생성할 수 있는데, 이를 통해 기존에 인간이 포착하지 못했던 특징값들까지 데이터에 의해 포착할 수 있게 되었다.

딥러닝은 마치 인간이 사물을 인식하는 방법처럼, 모서리, 변, 면 등의 하위 구성 요소부터 시작하여 나중엔 눈, 코, 입과 같이 더 큰 형태로의 계층적 추상화를 가능하게 하였는데, 이는 인간이 사물을 인식하는 방법과 유사하다고 알려져 있다. 구체적으로는 나선형 뉴럴네트워크(Convolutional Neural Network, CNN)와 순환형 뉴럴네트워크(Recurrent Neural Network, RNN)란 방법이 널리 쓰이는데, 최근의 이미지인식이나 음성인식 등의 비약적 발전은 대부분 이들 방법의 역할이 크다고 할 수 있다.

딥뉴럴네트워크의 모습.

구글은 딥러닝과 빅데이터를 이용해 컴퓨터가 스스로 많은 사진들을 학습하여 사람의 얼굴과 고양이의 얼굴을 학습해내는 비지도학습 결과를 발표해 세상을 놀라게 한 바 있다.

ⓒ 과학동아북스 | 저작권자의 허가없이 사용할 수 없습니다.

딥러닝은 하드웨어의 발전과 함께 더욱 날개를 펴고 있다. 딥러닝은 수많은 뉴런과 깊은 신경망을 학습해야 하기에 기존 컴퓨터로는 학습에 몇 주가 소요되기도 한다. 하지만 최근에는 GPU를 이용한 병렬처리 연산의 발달과 함께 딥러닝을 위한 미래 하드웨어 디자인도 고안되고 있어 그 처리 속도가 더욱더 빨라지고 있다. 또한 클라우드 컴퓨팅을 이용하여 많은 양의 연산을 디바이스가 아닌 서버에서 처리하도록 함으로써 딥러닝의 혜택을 모바일로도 가져오고 있다. 바야흐로 딥러닝이 점점 우리의 생활 속에 침투하고 있다고 해도 과언이 아닐 것이다.

딥러닝의 또 다른 장점 중 하나는 다양한 분야에서 공통적으로 활용될 수 있다는 것이다. 예를 들어 이미지 인식과 자연어 처리는 예전에는 전혀 다른 방법들이 적용되었지만 딥러닝은 이 두 가지 문제를 같은 방법으로 해결할 수 있다. 이를 이용하면 더욱 흥미로운 상상들을 할 수 있는데, 그 대표적인 예가 딥러닝을 이용해 이미지를 분석하고 이에 대한 자막을 자동으로 달아주는 것이다. 이 방법이 보편화된다면 미래엔 시각장애인도 컴퓨터로부터 눈앞의 상황에 대한 설명을 들을 수 있는 날이 올 것이다.

딥러닝의 특징값 추출 예시

딥러닝은 깊은 학습구조 속에 단계적으로 좋은 특징값들을 자동으로 뽑아낸다. 예를 들어 이미지 인식의 경우 낮은 단계에서는 선들을 추출하는 반면, 더욱 높은 레이어에서는 사람의 얼굴 부분도 추출한다. 이러한 단계적 특징 추출 방식 덕분에 딥러닝이 비약적으로 발전할 수 있었다.

ⓒ 과학동아북스 | 저작권자의 허가없이 사용할 수 없습니다.

딥러닝은 미래 인공지능의 희망으로 떠오르고 있다. 그도 그럴 것이 이미지 인식 등의 분야에선 이미 인간의 오차율을 넘어섰으며, 이제껏 불가능이라 여겨졌던 일들도 척척 해내고 있기 때문이다. 테크기업들의 인공지능 기술 경쟁은 이미 시작되었다. 특히 그 경쟁은 미래 인공지능 기술의 핵심으로 불리는 딥러닝 연구인력들의 영입 전쟁으로 촉발되고 있다. 딥러닝의 거장으로 불리는 토론토대학의 제프리 힌톤 교수, 뉴욕대학의 얀 레쿤 교수, 그리고 스탠퍼드 대학의 앤드류 응(Andrew Ng) 교수는 구글, 페이스북, 바이두에 각각 영입되었고, 딥러닝 인재들이 모여 만든 기업 딥마인드는 50명 남짓의 뚜렷한 제품도 없는 작은 기업임에도 구글에 무려 5000억가량에 인수되어 세계를 놀라게 하기도 하였다. 최근에는 테슬라 자동차의 창업주 엘론 머스크 등의 지원 하에 1조 원 규모의 비영리 인공지능 연구단체 오픈 에이아이(Open AI)가 출범하기도 하였다.

딥러닝이 생성한 자동 자막.

딥러닝은 사진에서 물체를 인식한 후 그것의 기능적 관계를 파악해 자막을 만들어줄 수 있다.

ⓒ 과학동아북스 | 저작권자의 허가없이 사용할 수 없습니다.

미래의 인공지능을 향한 꿈에 세계가 딥러닝 기술을 주목하고 있다. 하지만 한 가지 잊지 말아야 할 것은 딥러닝 역시 오랜 세월 동안 외면받아 왔던 기술이었으며, 그럼에도 꾸준히 그 방법을 연구했던 연구자들이 있었기에 지금의 딥러닝도 있을 수 있었다는 것이다. 최근에는 많은 연구들이 딥러닝 트렌드에 치우치는 경향이 있는데, 이 또한 경계하며 다른 인공지능 방법론에 대해서도 연구를 게을리하지 말아야 할 것이다. 그럼에도 불구하고 미래의 인공지능의 중심에 딥러닝이 있을 것이란 사실엔 모두가 수긍하는 분위기다. 딥러닝이 이끄는 인공지능의 미래, 그 미래는 과연 어떤 모습일까?