조현욱 과학과 소통 대표
다세포 생물 중 유전체 전체의 DNA 서열, 즉 게놈이 모두 밝혀진 최초의 동물이다. 두 차례의 노벨생리의학상(2002년 세포자살, 2006년 RNA 간섭)에 직접 기여했으며 2008년에는 녹색형광단백질 연구에 이용돼 노벨화학상 수상에 한몫했다. 2019년에는 뉴런(신경세포) 전체의 연결망을 그린 지도, 즉 커넥톰이 완성돼 과학저널 네이처의 표지를 장식했다. 무엇보다 이 벌레는 자연에서 매우 다양한 행동을 한다. 예컨대 좋아하는 온도를 찾아가고, 수컷이 배고플 때는 먹이를, 배부를 때는 짝짓기 상대를 찾아간다. 먹고 배탈이 난 먹이는 다시 먹지 않고, 주변에 먹이가 적으면 알을 덜 낳으며, 술에 취하면 물에서 수영하는 행태와 땅에서 기어가는 행태를 뒤섞어서 보인다.
단순한 구조에도 불구하고 정보를 효율적이고 조화롭게 처리하는 능력을 갖춘 것이다. 이 같은 성능은 인공지능 연구자들의 눈길을 끌었다. 지난해 10월 미국 MIT와 오스트리아 과학기술대의 공동 연구진이 ‘네이처기계지능’에 발표한 논문을 보자. 이들은 예쁜꼬마선충의 신경계를 모방하는 새로운 수학 모델을 개발해 인공신경망에 장착했다. 인공신경망은 살아 있는 뇌와 마찬가지로 서로 연결된 많은 신경세포로 구성된다. 특정 세포의 활성화 여부는 수신하는 신호를 합산해 결정된다. 합계값이 어떤 문턱값을 넘으면 해당 세포는 자신과 연결된 신경세포들에 신호를 보낸다. 다음 세포들에게서도 동일한 과정이 반복된다. 신경망에서는 이러한 문턱값 혹은 가중치를 매개변수라고 한다. 이들 매개변수에 대한 조정은 신경망이 특정한 과제를 해결할 수 있을 때까지 자동학습 과정을 통해 계속된다.
연구팀은 자율주행차의 차선 유지라는 과제를 선정했다. 도로의 이미지가 계속 입력되면 이를 바탕으로 핸들을 오른쪽으로 꺾을지, 왼쪽으로 꺾을지를 결정하는 것이다. 이들의 알고리즘은 다른 최첨단 기계학습 알고리즘보다 훨씬 간단했지만 성능은 뒤지지 않는 것으로 나타났다.
논문의 저자들은 “오늘날 수백만 개의 매개변수가 있는 심층학습 모델은 자율주행과 같은 복잡한 작업을 학습하는 데 자주 사용된다. 그러나 우리는 새로운 접근 방식을 통해 신경망의 크기를 100분의1 규모로 줄일 수 있었다. 이 시스템에서 사용하는 훈련 가능한 매개변수는 7만 5000개에 불과하다”고 밝혔다.
이 연구팀은 지난주 미국에서 열린 인공지능학술대회(AAAI)에서 진전된 성과를 발표했다. 훈련 단계뿐만 아니라 업무수행 과정에서도 학습을 계속하는 인공신경망을 개발한 것이다. 유연하게 모습을 바꾼다는 의미에서 ‘액체’망이라는 이름을 붙였다. 새로운 데이터 입력에 지속적으로 적응하도록 기본 방정식의 매개변수를 변경하는 게 특징이다.
“앞으로 로봇제어, 자연어와 영상 처리 등 모든 형태의 시계열 데이터를 처리하는 성공적인 방법이 될 것”이라고 논문의 주 저자인 라민 하사니는 말한다.
또한 대부분 신경망의 행태는 학습단계 후에 고정되므로 수신하는 데이터 흐름의 변화에 적응하지 못한다. 폭우로 인해 자율주행 차량의 카메라 시야가 가려지는 경우에 제대로 작동하지 못하는 것이다. 이와 달리 ‘액체’ 신경망은 예상 밖이거나 잡음이 심한 데이터에 더 탄력적으로 대응할 수 있다. 새 신경망은 다른 최첨단 시계열 알고리즘을 몇 퍼센트 포인트로 앞서는 성능을 보였다. 대기 화학에서 교통 패턴에 이르기까지 데이터 세트의 미래값을 보다 정확하게 예측한 것이다. 또한 네트워크의 크기가 작은 덕분에 막대한 컴퓨팅 능력을 동원하지 않고도 과제를 수행했다. 저자들은 “자연에서 영감을 받은 뛰어난 신경망은 미래 지능 시스템의 핵심 요소가 될 수 있다”고 말한다.
2021-02-17 30면
Copyright ⓒ 서울신문 All rights reserved. 무단 전재-재배포, AI 학습 및 활용 금지