'딥러닝(Deep Learning)' 구조적인 한계..."2021년 ‘알파고’ 뛰어넘을 뇌 닮은 AI칩 나온다"

'딥러닝(Deep Learning)' 구조적인 한계..."2021년 ‘알파고’ 뛰어넘을 뇌 닮은 AI칩 나온다"


‘뉴로모픽(신경망 모사)  컴퓨팅’ 주제 공개 세미나

장준연 한국과학기술연구원(KIST) 차세대반도체연구소장

"앞으로 새로운 방식 AI 필요"


  “딥러닝(심층기계학습)은 바둑 인공지능(AI) ‘알파고’로 큰 돌풍을 일으켰지만 구조적인 한계를 갖고 있습니다. 사람이 방대한 양의 사전 학습 데이터를 일일이 만들어야 하고, 계산 양이 많아지면 고성능 슈퍼컴퓨터 없이는 구동하기 어렵습니다.”




거대 슈퍼컴퓨터-방대한 학습데이터 필요없는 ‘뉴로모픽 AI’

사람의 두뇌에는 1000억 개의 뇌신경세포(뉴런)이 있고 뉴런과 뉴런을 연결하는 100조 개의 시냅스가 있다. 뉴런은 전기적 자극을 통해 정보를 전달하고 시냅스는 도파민, 세로토닌 같은 화학적 신호(신경전달물질)를 통해 뉴런 간 정보를 교환하며 신호의 잔상을 남겨 정보를 저장한다. 경험을 통한 기억과 학습은 이런 뉴런과 시냅스의 작용을 통해 일어난다. 비슷한 경험(자극)을 반복하면 신호의 잔상(기억)이 더 강렬하게 남아 학습 효과로 이어지는 식이다.


   장준연 한국과학기술연구원(KIST) 차세대반도체연구소장은 23일 서울 성북구 KIST 본원에서 ‘뉴로모픽(신경망 모사) 

   컴퓨팅’을 주제로 열린 공개 세미나에서 앞으로는 새로운 방식의 AI가 필요하다며 이처럼 밝혔다. 뉴로모픽 컴퓨팅

   은 인간의 두뇌를 이루는 뇌신경망의 물리적인 구조와 기능을 모방한 인공신경망 반도체칩을 이용해 AI를 구현하는 

   컴퓨팅 기술로 딥러닝의 한계를 뛰어 넘을 것으로 최근 큰 주목을 받고 있다.




인간 뉴런의 정보처리속도는 10㎐(초당 10회 연산)로 ㎓(기가헤르츠·1㎓는 10억 ㎐)급 수준의 그래픽처리장치(GPU)에 훨씬 못 미치지만, 수많은 연결구조 덕분에 방대한 양의 데이터를 한꺼번에 빠르게 처리하는 데 유리하다. 시냅스 연결은 작업이 많은 부위에서는 연결이 늘어나고 작업이 없는 부위에서는 연결이 끊어지는 등 효율적인 구조를 갖고 있어 에너지 소모도 적다.


뉴로모픽 컴퓨팅은 이런 사람의 뇌신경망처럼 뉴런과 시냅스로 구성된 반도체 칩(하드웨어)으로 뇌에서 일어나는 작용을 모사한다. 특정 시점에 발생하는 스파이크(전기 자극)를 기반으로 작동하는 ‘스파이킹 신경망(SNN)’이 대표적이다. 한 뉴런에서 스파이크가 발생하면 이 뉴런과 연결된 뉴런들을 기반으로 정보를 찾거나 입력하고 출력한다. 데이터를 순차적으로 주입해 학습시킬 수 있기 때문에 사전 학습 데이터를 축적할 필요가 없어 비용과 자원이 적게 든다.


딥러닝 알파고와 이세돌 9단의 바둑 대결/사이언스온

edied by kcontents




가상의 인공신경망(소프트웨어)인 딥러닝은 하나의 사건을 인식하려 해도 알고리즘의 각 명령어를 하나씩 처리하는 수많은 연산 과정을 거쳐야 한다. 이를 위해서는 방대한 양의 사전 학습 데이터가 필요하다. 가령 사물인식 AI을 학습시키려면 각 사물을 다양한 각도에서 본 장면과 함께 장면의 방향(정면, 측면 등)과 장면 속 사물의 공간상 위치, 특정 사물의 픽셀 범위, 정답 등 ‘라벨’을 사람이 일일이 달아 줘야 한다. 알파고가 바둑게임을 하기 위해 중앙처리장치(CPU) 1202개와 GPU 176개를 비롯한 100만 여 개의 반도체 칩을 동원한 이유다.


반면 뉴로모픽 칩은 정보를 사건(이벤트) 단위로 받아들이기 때문에 시각과 청각, 후각 등 다양한 패턴의 수많은 데이터를 동시다발적으로 신속하게 처리할 수 있다. 따라서 인간의 지도가 필요 없다. 곽준영 KIST 차세대반도체연구소 선임연구원은 “인간의 두뇌활동은 비(非)지도 학습이 일반적”이라며 “뉴로모픽 칩도 라벨 없는 입력 데이터로 특성이 비슷한 데이터를 군집화해 스스로 학습해나간다”고 설명했다.


    딥러닝(심층기계학습) 방식의 인공지능(AI)에 활용되는 지도학습(왼쪽)과 뉴로모픽 컴퓨팅에 활용되는 비지도학습

    (오른쪽)의 차이. 지도학습은 사람이 일일이 정답과 관련된 정보를 입력하는 라벨이 필요한 반면, 뉴로모픽 칩은 

    인간의 뇌처럼 다양한 정보를 비슷한 특징별로 스스로 분류해 기억한다. 정보를 사건(이벤트) 단위로 받아들이기 

    때문에 시각과 청각, 후각 등 다양한 패턴의 데이터를 동시다발적으로 신속하게 처리할 수 있다. 

    자료: 웨스턴디지털




박종길 KIST 차세대반도체연구소 선임연구원은 “뉴로모픽 컴퓨팅과 기존 컴퓨팅 기반의 딥러닝 AI의 차이 중 가장 와 닿는 것은 전력소비 차이일 것”이라며 “알파고는 바둑게임 하나를 학습하기 위해 170kW(킬로와트)의 전력을 소모하지만 사람은 바둑을 두는 동시에 주변의 냄새를 맡거나 소리를 듣고 먹은 음식을 소화시키는 등 여러 가지 일을 하면서도 20W밖에 소모하지 않는다”고 설명했다.

 

뉴로모픽 칩 개발 경쟁…국내서도 2021년 시냅스 2억 개 가진 ‘네오2C’ 개발 목표

정보기술(IT) 업계에서 뉴로모픽 칩 개발 경쟁은 치열하다. 2012년 인텔은 뉴로모픽칩 설계도를 공개했고 퀄컴은 2013년 뉴로모픽칩의 일종인 ‘제로스’를 선보였다. IBM이 2014년 컴퓨팅 칩과 신경망 모사 칩을 하나의 칩에 구현해 ㎽(밀리와트)급 전력으로 구동하도록 만든 뉴로모픽 칩 ‘트루노스’는 같은 해 국제학술지 ‘사이언스’가 선정한 ‘올해의 10대 연구 성과’에 선정되기도 했다. 다만 자가 학습능력을 갖추지는 못했었다.

 

이런 가운데 인텔은 지난해 9월 사람이 입력 데이터와 함께 정답을 알려 주는 지도학습 대신 실시간으로 유입되는 정보를 받아들여 스스로 학습하는 뉴로모픽 칩 ‘로이히’를 개발해 화제를 모았다. 0.47㎟ 크기의 코어 128개로 이뤄진 로이히에는 총 13만 개의 뉴런과 1억3000만개 시냅스가 있다. 반도체 집적도는 14㎚(나노미터·1㎚는 10억분의 1m) 수준으로 현재까지 개발된 뉴로모픽 칩 중 세계 최고 수준이다.




국내에서도 2016년부터 KIST를 중심으로 KAIST, 서울대, 포스텍, 울산과학기술원(UNIST), 국민대, 어바인 캘리포니아대 등 7개 기관 연구진이 실시간 자가 학습이 가능한 뉴로모픽 칩 ‘네오(NeO)2C’를 개발 중이다. 2021년까지 총 120억 원이 투입된다. 네오2C의 반도체 집적도는 55㎚, 소모전력은 56㎽ 수준이다. 코어당 뉴런 수는 1000개로 로이히와 같다.

 

최근 연구진은 뉴런 1024개, 시냅스 19만9680개로 이뤄진 16㎟ 크기의 네오2C 코어 프로토타입을 완성하고 이를 이용해 발광막대가 움직이는 각도에 따라 고양이 뇌와 유사한 패턴으로 칩의 뉴런이 반응하는 것을 확인했다. 이런 외부 자극은 신경망의 물리적인 변화를 통해 기억으로 저장된다. 장 소장은 “2021년까지 뉴런 100만 개, 시냅스 2억 개 수준의 뉴로모픽 칩을 구현하는 게 목표”라고 밝혔다. 


   한국과학기술연구원(KIST) 등 국내 공동 연구진이 개발한 자가 학습 가능한 뉴로모픽 칩 ‘네오(NeO)2C’. - KIST 제공


뉴로모픽 칩은 목소리 인식과 신호 인식, 이미지 인식, 데이터 마이닝처럼 문자와 영상, 음성 등이 혼재돼 있는 복합 데이터를 처리하는 차세대 AI 전용 칩으로 활용될 것으로 기대를 모은다. 뉴로모픽 칩 시장은 올해 660만 달러에서 2022년 2억7290만 달러로 연평균 86%씩 성장할 것으로 전망되고 있다. 삼성전자, SK하이닉스 등 국내 기업들도 앞 다퉈 뉴로모픽 칩 개발에 나섰다.




다만 김재욱 KIST 차세대반도체연구소 선임연구원은 “뉴로모픽 칩이라고 해도 뉴런이나 시냅스의 양이 점점 많아지면 정보를 색인하는 데 시간이 오래 걸리면서 성능이 떨어진다는 단점이 있다”며 “이를 보완하기 위해 네오2C도 메모리를 병렬로 분산하는 멀티코어 방식을 도입하기 위한 연구를 수행하고 있다”고 밝혔다. 한편 이날 세미나에는 뉴로모픽 컴퓨팅 관련 산·학·연 전문가 20여 명이 참석했으며 발표 후에는 뉴로모픽 칩 시연회가 이어졌다.

송경은 기자 kyungeun@donga.com 동아사이언스


케이콘텐츠

댓글()