글로벌미디어학부 김희원 교수 연구팀, 인공지능 로봇 조작 챌린지 세계대회 3위 달성

2024년 7월 4일
180070

<(왼쪽부터)박성용 학생, 이상민 학생, 김희원 교수(사진=숭실대)>

숭실대학교 IT대학 글로벌미디어학부 김희원 교수 연구팀(석사과정 이상민, 박성용)이 지난 18일 미국 시애틀에서 열린 ‘인공지능 로봇 조작 챌린지 세계대회(ARNOLD Challenge)’에서 ‘상태 보간을 이용한 단계-특화 에이전트’ 알고리즘으로 3위를 차지했다.

이 대회는 인공지능을 이용해 시뮬레이션 상의 로봇이 다양한 작업을 수행하도록 학습시키는 챌린지로, 컴퓨터 비전 및 머신 러닝 분야의 세계 최대 학회인 ‘CVPR 2024’의 임바디드 AI(Embodied AI) 워크샵의 일환으로 개최됐다.

임바디드 AI는 환경 내에서 인식, 상호작용 및 추론이 가능한 AI 에이전트(또는 로봇)을 개발하는 기술이다. 이는 휴머노이드를 포함한 가사 로봇, 산업 로봇, 자율주행, 헬스케어, 재난 대응 등 다양한 분야에서 차세대 인공지능의 핵심 기술로 여겨지고 있다.

올해 챌린지의 주제는 ‘Open World Embodied AI’로, 미지의 사물과 상황을 다루는 AI 에이전트를 개발하는 데 중점을 뒀다. 참가 팀들은 ‘컵에 물을 반만 부어라’와 같은 연속적인 상태가 포함된 8개의 고난도 작업을 수행하도록 지시받았다. 챌린지 환경에는 학습 데이터에 존재하지 않는 새로운 물체와 새로운 환경, 새로운 목표 상태를 포함한 도전적인 상황들이 추가됐다. 이는 로봇의 인공지능이 사람처럼 상황을 이해하고 다양한 실생활의 작업을 해낼 능력을 평가하는 중요한 요소이다.

처음으로 인공지능 로봇 조작 대회에 참가한 숭실대 연구팀은 연속적인 상태 변화와 고난도 작업에 최적화된 딥러닝 모델을 개발하여 획기적인 성능 향상을 이뤄내 3위를 기록했다. (1위: 중국과학기술대학, Deep Space Exploration Laboratory, Sangfor Research Institute 연합 팀).

이상민 학생은 “Embodied AI에 대해 접하고 처음 참여한 대회에서 좋은 성적을 거두어 기쁘다”며 “앞으로도 vision과 robot을 엮는 프로젝트에서 좋은 성과를 내도록 하겠다”는 포부를 밝혔다. 박성용 학생은 “챌린지 과정에서 많은 조언과 지도를 해주신 김희원 교수님께 감사의 말씀을 전하고 싶다”며 “앞으로도 계속 성장해 더 큰 성과를 이루도록 노력하겠다”고 소감을 전했다.

김희원 교수는 “새롭게 제안된 딥러닝 기반 로봇 조작 알고리즘을 통해 로봇이 처음 접하는 낯선 환경에서도 언어만으로 복잡한 작업을 수행할 수 있게 됐다. 이를 이용하면 로봇에게 가사 노동도 시킬 수 있게 되는 등 로봇의 활용 범위가 넓어질 것이다”며 “석사과정 1학기 학생들이 세계 대회에서 큰 성과를 거둬 기쁘고, 앞으로의 발전이 기대된다”고 말했다.

한편, 올해 5회를 맞은 CVPR(Computer Vision and Pattern Recognition) 임바디드 AI 워크샵은 엔비디아, 구글, 애플 등의 기업 후원으로 스탠포드, UCLA, 메타(META)를 비롯한 전 세계 대학 및 기업의 연구자들이 함께 조직해왔다. 특히 올해는 마이크로소프트, 로지컬 로보틱스, 프로젝트 아리아의 후원과 더불어 엔비디아, AI2, 로지컬 로보틱스의 연구자들이 조직위원장으로 참여했다.

 

 

홍보팀(pr@ssu.ac.kr)