숭실대 김희원 교수 연구팀, 'CVPR 2025'서 로봇 조작 데이터 생성 기술 논문 발표

기사입력:2025-07-15 18:33:27
[로이슈 전여송 기자] 숭실대학교(총장 이윤재)는 본교 글로벌미디어학부 김희원 교수 연구팀이 지난 11일부터 15일까지 미국 내슈빌에서 열린 컴퓨터비전 분야 최우수 국제 학술대회 'CVPR 2025(Conference on Computer Vision and Pattern Recognition 2025)'에서 연구 논문을 발표하고, ‘인공지능 로봇 조작 챌린지 세계대회(ARNOLD Challenge)’에서 1위를 차지하는 성과를 거뒀다고 밝혔다.

이 대회는 CVPR의 세부 프로그램인 ‘Embodied AI 워크숍’ 내에서 개최된 국제 로봇 조작 대회로, AI 에이전트가 실제 환경과 상호작용하며 복잡한 작업을 수행하는 능력을 겨루는 자리다. 김 교수 연구팀은 지난해 같은 대회에서 3위를 기록한 데 이어, 올해는 최종 1위를 차지하며 기술력을 입증했다.

연구팀은 김희원 교수와 이상민·박성용 학생(미디어학과 석사과정)으로 구성됐으며, 챌린지에는 김도원 학생(글로벌미디어학부 4학년)과 임채우 학생(메타버스·문화콘텐츠학과 석사과정)이 참여했다. 발표 논문의 제목은 ‘DynScene: Scalable Generation of Dynamic Robotic Manipulation Scenes for Embodied AI’다.

AI 로봇이 다양한 작업을 학습하려면 대규모의 고품질 데이터가 필수적이지만, 실제 환경에서 이러한 데이터를 수집하는 데는 막대한 시간과 비용이 소요된다는 어려움이 있었다. 연구팀은 텍스트 지시만으로 현실감 있는 로봇 조작 장면을 자동 생성하는 프레임워크 ‘DynScene’을 개발해, 대량의 학습 데이터를 효율적으로 확보할 수 있는 방법을 제시했다.

‘DynScene’은 정적인 장면 구성 데이터와 로봇 동작 데이터를 분리해 생성하던 기존 방식에서 벗어나, 두 요소를 동시에 생성함으로써 데이터의 다양성과 현실감을 획기적으로 높인 것이 특징이다. 또한, ▲장면 간 충돌을 피하는 레이아웃 샘플링 ▲물체가 안정적으로 배치되도록 돕는 쿼터니언 양자화 ▲로봇 동작을 유연하게 표현하는 잔차 좌표(residual coordinate) 기반 방식 ▲물리적으로 타당한 장면만을 선별하는 시뮬레이터 기반 검증 등 다양한 핵심 기술이 적용돼, 실제 환경에 부합하는 고품질 데이터를 자동으로 만들어낼 수 있다. 챌린지에서는 이 프레임워크를 기반으로 한 로봇 기초 모델(Robotic Foundation Model)이 다양한 작업에서 높은 일반화 성능과 성공률을 달성함을 입증했다.

연구를 지도한 김희원 교수는 “이 기술은 기초 모델과 생성 모델을 활용해 적은 양의 학습 데이터만으로도 로봇 조작을 정교하게 구현할 수 있다는 점에서 의미가 크다”며 “AI 기반 로봇 기술에 대한 진입장벽을 낮춰, 대규모 데이터 확보가 어려운 기업들에게도 실질적인 도움이 될 것”이라고 설명했다.

또한 그는 “이번 논문은 숭실대학교 학생들이 주저자로 참여해 CVPR 본 학회에서 직접 발표한 첫 사례라는 점에서도 더욱 뜻깊다”며, “앞으로도 학생들과 함께 세계 무대에서 경쟁력 있는 연구를 이어가겠다”고 밝혔다.

이상민 학생은 “첫 논문이었지만 교수님의 세심한 지도 덕분에 세계적인 학회에서 연구를 발표할 수 있었다”며 “챌린지 대회에서도 작년의 아쉬움을 올해 팀원들과 함께 1위로 만회하게 되어 더욱 뜻깊다”고 전했다.

박성용 학생은 “세계적 학회에서 연구를 발표하고, 챌린지 대회에서도 좋은 성과를 거둘 수 있어 영광”이라며 “이번 경험을 바탕으로 앞으로도 의미 있는 연구를 이어가고 싶다”고 소감을 밝혔다.

챌린지에 함께 참여한 김도원 학생은 “교수님과 선배님들의 조언 덕분에 좋은 성과를 낼 수 있었다”며 “앞으로도 Embodied AI 분야에서 의미 있는 연구를 이어가고 싶다”고 포부를 밝혔다. 임채우 학생은 “대회를 준비하는 과정에서 많은 것을 배울 수 있었고 스스로 한 단계 성장할 수 있었다”며 “함께 성과를 만들어낸 팀원들과 지도 교수님께 감사드린다”고 말했다.

한편, 이번 연구는 산학협력 파트너인 LLM 기반 AI 솔루션 스타트업 ㈜코르카(대표 정영현)의 AI 서버 인프라 지원을 받아 수행됐다.

전여송 로이슈(lawissue) 기자 arrive71@lawissue.co.kr

주식시황 〉

항목 현재가 전일대비
코스피 3,254.47 ▲23.90
코스닥 803.67 ▼0.78
코스피200 439.81 ▲3.97

가상화폐 시세 〉

암호화폐 현재가 기준대비
비트코인 162,903,000 ▼53,000
비트코인캐시 783,500 ▲3,500
이더리움 5,215,000 ▼8,000
이더리움클래식 29,280 ▼10
리플 4,277 ▲30
퀀텀 2,961 ▲10
암호화폐 현재가 기준대비
비트코인 163,011,000 ▲83,000
이더리움 5,220,000 ▼2,000
이더리움클래식 29,290 ▲50
메탈 1,032 ▲1
리스크 608 ▲4
리플 4,278 ▲24
에이다 1,054 ▼1
스팀 192 ▲0
암호화폐 현재가 기준대비
비트코인 162,880,000 ▼150,000
비트코인캐시 784,000 ▲4,000
이더리움 5,215,000 ▼15,000
이더리움클래식 29,290 ▼50
리플 4,275 ▲24
퀀텀 2,980 0
이오타 271 0
ad