[헬로디디] [과기원 리포트] 2 모니터를 넘어 세상 밖으로, AI에 '신체'를 입히다
페이지 정보
작성자 최고관리자 작성일 2026-01-12 17:30 조회 564회본문
현재 개발 중인 웨어러블 로봇과 함께한 엔젤로보틱스 대표, 공경철 교수. 로봇 공학자로서 피지컬 AI에 대해 현장감 짙은 의견을 피력했다. [사진=카이스티안]
2024년 초 젠슨 황 엔비디아 CEO가 'AI의 다음 물결은 피지컬 AI'라고 선언했을 때, 많은 사람들의 상상은 자연스레 인간을 대신해 일하는 로봇의 미래로 향했다. 휴머노이드가 공장에서 24시간 일하고, 가사 노동을 전담하는 미래가 곧 도래할 것이라는 기대였다. 그러나 지난 1년간 로봇공학 현장에서 확인한 현실은 조금 달랐다. 페이페이 리 스탠퍼드대 교수가 이끄는 '월드 랩스' 등 선도 그룹은 이제 자동화를 넘어 '공간 지능'을 이야기한다. 이는 기계가 물리적 세계의 형상을 인지하는 것을 넘어, 그 안에 존재하는 인간과어떻게 상호작용할 것인가에 대한 근본적인 물음을 던진다.
KAIST는 피지컬 AI의 본질을 '대체'가 아니라 '확장'과 '상호작용'에서 찾는다. 공경철 기계공학과 교수(엔젤로보틱스 대표)는 "피지컬 AI가 마케팅 용어에 그치지 않으려면, 로봇이 단독으로 움직이는 것을 넘어 인간의 물리적 의도를 이해하고 반응하는 기술로 진화해야 한다"고 강조한다. KAIST가 그리는 피지컬 AI의 청사진은 모니터 속에 갇힌 지능을 현실로 꺼내어, 인간의 삶을 가장 가까이서 물리적으로 돕는'따뜻한 기술'로 포지셔닝 된다.
◇ 피지컬 AI의 현주소, '물리적 환각'과 폐쇄 루프의 딜레마
로봇공학과 AI는 오랫동안 서로 다른 문제를 다뤄 왔다. 1980년대 로봇공학자 한스 모라벡은 "인간에게 어려운 체스나 수학 증명은 컴퓨터에게 쉽지만, 인간에게 쉬운 걷기나 물건 집기는 컴퓨터에게 가장 어렵다"는 통찰을 내놓았다. 이후 AI는 '뇌'를 모사하며 데이터 패턴 인식과 기호 처리에 집중했고, 로봇공학은 '몸'을 제어하기 위해 정교한 수학적 모델링과 동역학에 몰두했다. 서로 다른 언어를 써온 셈이다.
이러한 상황에서 최근 거대언어모델LLM을 로봇에 적용하려는 시도는 필연적으로 충돌을 일으킨다. LLM은 텍스트라는 기호 데이터를 학습하지만, 로봇은 중력과 마찰력, 관성같은 연속적 물리 법칙이 지배하는 세계에서 움직여야 하기 때문이다. 두 기술은 서로 전혀 다른 조건에서 작동해 왔고 같은 프레임으로 다루기 어렵다.
그럼에도 연구자들이 피지컬 AI를 다시 논의하기 시작한 이유는 이 간극을 좁히려는 변화가 AI 내부에서 나타나기 때문이다. AI는 텍스트를 넘어 물리적 맥락을 추론하는 단계로 확장되고 있다. "이 컵을 잡으려면 손목을 30도 꺾어야 한다"는 식의 기초적 물리 추론이 가능한 Vision-LanguageActionVLA 모델이 등장하면서 두 세계를 연결할 가능성이 처음으로 포착된 것이다.
하지만 가능성이 열렸다는 사실이 곧바로 문제 해결을 의미하지는 않는다. 현재 로봇 공학계가 느끼는 가장 큰 우려 역시 '언어 지능'의 성공 문법을 '신체 지능'에 그대로 적용하려는 시도에서 나온다. 공경철 교수는 "텍스트 모델의 입력과 출력은 분리되어 있지만, 로봇은 움직임 자체가 데이터를 만들고 그 데이터가 다시 다음 움직임을 결정하는 '폐쇄 루프구조' 속에 있다"고 설명한다.
이때 가장 먼저 드러나는 문제가 '물리적 환각'이다. 언어모델의 오류가 문장 하나의 불일치로 끝난다면, 로봇의 오류는 즉시 물리적 사고로 이어질 수 있다. 예를 들어 요리 로봇이 김치를 볶는 과정에서 재료를 바닥에 흘렸다고 가정해보자. 현재의 비전-언어모델 기반 로봇은 쏟아진 김치를 감지하지 못하고 빈 프라이팬에 밥을 볶는 '환각 행동'을 지속할 수 있다.
공 교수는 "물리적 순서가 있는 로봇의 행동은 텍스트와 달리 단 한 번의 오류도 용납되지 않는다"며, 이것이 로봇 공학자들이 '데이터 만능주의'를 경계하는 이유라고 지적한다. 결국 피지컬 AI의 난제는 단순한 지능의 문제가 아니라 '안전'과 '신뢰'의 문제다. 최근 중국의 로봇 학회에서 "휴머노이드가 인간의 일자리를 대체하는 것은 20년 내에는 불가능하다"는 결론이 나온 것도 이 때문이다. KAIST는 이러한 한계를 직시하고, 인간의 개입 없이 확률에만 의존하는 AI가 아니라, 명확한 물리적 통제와 인간의 의도가 결합된 기술을 지향한다.

엔젤로보틱스가 개발한 여러 모델들. 왼쪽부터 순서대로 평창동계올림픽 때 이용로 박사가 착용해 화제가 된 ‘워크온슈트’, 이를 보완하여 의료용 재활 로봇으로 완성된 ‘엔젤렉M20’,
무릎 관절을 보조하게 설계된 웨어러블 슈트 ‘엔젤슈트K10’, 작업자를 위한 무동력 보조기구인 ‘ 엔젤기어’.[사진=카이스티안]
◇ 데이터는 모든 것을 해결할 수 있을까? 로봇 공학의 제언
그렇다면 진정한 피지컬 AI는 어떻게 구현되어야 하는가. 현재 로봇 학계의 딜레마는 LLM이라는 거대한 '지능'을 로봇의 '몸'에 어떻게 연결할 것인가에 있다. 공경철 교수는 이지점에서 생물학적 영감을 받은 '하이브리드 지능' 구조를 해법으로 제시한다. 그는 이를 '등산'에 비유해 설명한다.
"산을 처음 타는 초보자는 발을 딛을 때마다 눈으로 지면을 확인하고, 뇌로 판단한 뒤, 조심스럽게 발을 옮깁니다. 이는 시각 정보가 대뇌를 거쳐 운동 신경으로 전달되는 '피드백(Feedback)' 과정으로, 반응이 느리고 뇌의 에너지 소모가 극심합니다. 반면 숙련된 산악인은 매 순간 생각하지 않습니다. '저 위로 가겠다'는 의도만 있을 뿐, 실제 몸의 움직임은 훈련된 근육과 반사 신경(소뇌·척수)에 맡깁니다. 뇌를 거치지 않고 몸이 기억하는 리듬대로 움직이는 '피드포워드(Feedforward)' 방식이죠."
지금의 로봇 제어는 모든 움직임을 거대한 모델이 직접 계산하려는 형태에 가깝다. 초보 등산자가 매 걸음을 세세하게 확인하듯, 반응은 느리고 에너지 사용은 크다. KAIST가 지향하는 피지컬 AI는 이 역할을 명확히 분리한다. 고차원적인 상황 판단과 추론은 거대 AI 모델이 수행하되(대뇌의 역할), 즉각적이고 물리적인 균형 잡기는 정교한 동역학 제어 이론(소뇌·척수)이 담당하는 계층적 구조다. 이것이 물리적 세계의 불확실성을 통제하면서도 AI의 유연성을 활용할 수 있는 가장 현실적인 대안이다.
이러한 계층적 구조가 갖춰질 때 비로소 로봇은 인간과 자연스러운 상호작용을 시도할 수 있다. 여기서 공 교수는 재활 로봇 분야에서 경험한 '타는(Ridable) 로봇'과 '입는(Wearable)로봇'의 결정적 차이를 피지컬 AI의 중요한 방법론으로 가져온다. 과거의 로봇은 인간이 그 안에 탑승하면 기계가 알아서 움직이는 수동적 방식이었다. 이는 인간의 개입을 배제하기에 제어는 쉽지만, 인간의 신경계와 상호작용하지 못한다는 한계가 있었다. 이러한 기술적 분리가 마련되면 로봇이 인간의 움직임에 어떻게 맞춰야 하는가라는 더 본질적인 질문이 남는다.
"피지컬 AI가 가야 할 길은 '타는 로봇'이 아니라 '입는 로봇'의 철학을 따르는 것입니다. 입는 로봇은 기계가 혼자 움직이지 않습니다. 사용자가 움직이려는 미세한 의도를 먼저 파악하고, 그 타이밍에 맞춰 부족한 힘만큼만 정확히 보조합니다. 로봇이 인간의 의도를 기다려주고, 그 의도에 반응하여 물리력을 제공할 때, 비로소 인간과 기계는 하나처럼 동기화됩니다."
'동기화'란 사람의 행동을 '보조'하는 수준에 그치지 않는다. 공 교수의 연구에 따르면, 로봇이 사용자의 의도를 정확히 읽고 반응해 주었을 때 인간의 뇌는 이를 '보상'으로 인식한다. "내가 움직이려 하니 로봇이 도와주네?"라는 긍정적 피드백이 뇌에 전달되면서, 사용자는 더 적극적으로 움직이려 하고 이 과정에서 신경 가소성이 활성화되는 '인체 강화학습'이 일어난다.
관련링크
- 378회 연결
- 이전글[로봇신문사] 공경철 교수, 올해의 KAIST인상 수상 25.02.12
- 다음글[MSN] KAIST, 과학과 예술의 만남…G아티언스 2025 커넥팅위크 개최 25.11.26