IT 정보 기술

딥러닝 기술에 대한 고찰

2016. 10. 24. 19:22

안녕하세요, 최근 딥러닝 이라는 말이 유행하고 있습니다. 언론에서 뿐만 아니라 일반인들도 많은 관심을 가지고 있는 것 같습니다. 최근에 한국의 프로 기사 이세돌을 이겼다는 인공 지능 알파고는 바둑으로 유명해진 기계학습 프레임 워크로 딥러닝 이라고 정의할 수 있습니다. 딥러닝의 기술력은 우리가 축적해온 지식기반의 데이터를 IT 기술에 접목하여 최단기간에 많은 데이터 학습을 하는 것을 말합니다. 원래 딥러닝은 다중 신경망 이라는 기계 학습 프레임 워크중 하나입니다. IQ가 높은 고등 동물의 신경 시스템의 학습 능력에 대한 연구 성과를 도입한 것 입니다. 처음에는 입력층과 출력계층으로 구성되어 시스템의 중간층에 필요한 여러 요소를 더한 시스템입니다. 인간의 사고도 오감에서 입력 데이터를 도입해 복잡한 사고 후 어떤 결정을 행동으로 옮긴다는 점에서 매우 비슷하다고 볼 수 있습니다. 


인간이 가지는 생각과 응용이란 것은 학습이 선행되지 않으면 할 수 없습니다. 학습을 위해서는 가능한 자료 즉, 데이터가 필요합니다. 학습 방법에 대해서는 감독학습과 자율학습이 있을 수 있습니다. 즉, 올바른 결과를 내기위해 누구의 가르침을 받는 경우와 가르쳐 주지 않고 자율적으로 자신이 학습하는 경우가 있습니다. 컴퓨터도 인간이 가르쳐주지 않는 경우에도 입력된 데이터를 토대로 자율적인 학습이 가능하게 되었습니다. 컴퓨터는 단순하게 사람이 가르쳐주는 프로그램에 의존해 왔습니다. 응용을 할 수 없다는 의미이며, 사람에게 짜여진 로직에 의해서 프로그램이 실행되는 것이 일반적 이었습니다. 


감독 학습에서 컴퓨터는 오로지 인간의 가르침을 따르게 됩니다. 잘못된 대답을 하면 인간이 버그를 수정하고 인간이 원하는 대답이 나오도록 코드를 변경 또는 추가 합니다. 이런 일종의 프로그래밍 하는 과정을 코딩과 디버깅 이라는 표현을 합니다. 컴퓨터의 자율학습이란 인간과 흡사한 생각을 하여 데이터에 근거한 가장 정확한 대답을 컴퓨터도 할 수 있게 하는 것입니다. 컴퓨터가 자율적인 학습에 의해 인간이 만들어온 빅데이터를 딥러닝 하는 것입니다. 이러한 기술이 회귀 (regression)라고 합니다. 회귀 방법은 3 가지로 나눌 수 있습니다. 선형 회귀 분석, 로지스틱 회귀, 소프트 맥스 회귀입니다. 유전학(genetics)에서 사용되는 방법과 동일합니다. 회귀와 최대 가능성은 유전학에서 유래하는 개념입니다. 유전자와 환경이 표현형에 미치는 영향은 선형 함수, 물류 기능, 소프트 맥스 함수로 표현되고, 실제 데이터에 비교하여 그것에 가깝도록 계수를 추정하고 관계를 검증하고 있습니다. 유전학은 현실 데이터를 함수에 입력하고 가능성을 판단하며 가능성을 최대화 합니다. 딥러닝 기술도 위와 동일한 방법을 사용합니다. 


딥러닝을 도입하고 있는 것은 신경 시스템에서의 지식, 유전학의 지식뿐만 아니라, 물리학, 열역학의 아이디어도 받아들이고 있습니다. 볼츠만 머신, 엔트로피, 깁스 자유 에너지 등입니다. 열역학의 입장에서 엔트로피 통계 역학적 해석을 준 것은 볼츠만 입니다. 엔트로피가 증가하고 깁스 자유 에너지가 감소하는 방향으로 자연 현상은 진행계가 안정이 된다는 열역학 제 2 법칙의 내용입니다. 이와 같이, 유전학, 신경 과학, 열역학, 통계 역학의 지식을 섭취하는 프레임 워크가 바로 딥러닝 입니다. 바로 인간의 깊은 생각, 과학 생각의 역사를 도입 한 시스템이라고 말할 수 있습니다. 과학 프레임 워크 신경계의 프레임 워크와 유전학의 프레임 워크는 서로 매우 비슷합니다. 그 이유는 생명을 지배하는 생활 게놈(GENOM) 시스템의 프레임 워크를 신경계가 도입하여 그것에 의해 만들어진 과학의 프레임 워크가 그 틀을 복사하기 때문인 것으로 생각됩니다.


우리는 지금 인공 지능에 많은 관심을 가지고 있습니다. 하지만 그 틀에 대한 자세한 딥러닝의 깊은 의미, 그 유래보다 완성 된 소프트웨어를 사용하여 우리가 체험하고 할 수 있는 일에만 관심이 집중되고 있는 것 같습니다. 딥러닝의 가장 큰 특징은 입력층 레이어와 출력층 사이에 숨겨진 레이어에 있습니다. 우리는 아무래도 입력계층, 출력 층에만 주목하는 경향이 있다고 생각합니다. 숨겨진 레이어는 보이지 않기 때문입니다. 우리의 과제로서 깊은 학습(Deep learning)은 깊은 생각(Deep thinking), 깊은 이해(Deep understanding)에 더 의미를 가질 필요가 있습니다. 깊게 숨어 있는 층은 많은 사람들에게 보이지 않습니다. 누구에게나 보이는 것은 누구나 흉내 내게 될 것입니다.  보이지 않는 것은 쉽게 흉내 낼 수 없기 때문에, 딥러닝 기술을 연구 개발하려는 많은 나라들이 있습니다. 딥러닝은 인류에 엄청난 혁명으로 다가올 것으로 보입니다. 18 세기에 일어난 산업 혁명은 제조 산업 혁명으로 정의 할 수 있습니다. 그 후, 정보 산업 혁명 이 일어나고, 제2차 세계 대전에도 큰 영향을 주었습니다. 그것이 지금 확실히 세계 최대의 산업이 되고 있습니다. 하지만 딥 러닝은 보이지 않는 데 인식하기 어렵고, 아직 우리에게는 충분히 이해되지 않는 이야기인 것 같습니다만, 우리는 이미 알파고의 저력을 확인하였기에 딥러닝 기술에 더욱 많은 관심을 가지게 될 것입니다.


감사합니다.

+ Recent posts