AI융합학부 이길호 교수 연구팀, 온디바이스 AI 성능 향상 기술로 국제 학술대회 ICCAD 2025 발표 /2025.11.20(목)
- 관리자
- 2025.11.20 17:08
- 조회 13
- 추천 0
AI융합학부 이길호 교수 연구팀, 온디바이스 AI 성능 향상 기술로 국제 학술대회 ICCAD 2025 발표
- 임베디드 환경의 자원 경합 문제 해결해 AI 추론 지연시간 절반 단축
- 온디바이스 AI 성능 혁신 주도하며 숭실대의 융합형 기술 연구 역량 입증
<(좌)AI융합학부 이길호 교수와 (우)FlexOn 프레임워크의 AI 모델 분할 및 런타임 적응형 자원할당 구조 개요>
숭실대학교(총장 이윤재)는 AI융합학부 이길호 교수 연구팀이 제한된 연산 자원이 경합하는 임베디드 환경에서 AI 추론의 반응성을 크게 높일 수 있는 온디바이스 AI 프레임워크 핵심 기술(FlexOn)을 개발했다고 밝혔다.
이번 연구는 임베디드 시스템 분야의 세계적 학술대회 IEEE/ACM ICCAD 2025(International Conference on Computer‑Aided Design)에서 발표됐다.
연구에는 김민성, 이지훈, 주성진(지능형반도체학과 석사과정), 정휘수, 김인우(AI융합학부 학사과정)가 참여했으며, DGIST·중앙대·고려대 연구팀과 협업으로 진행됐다.
이 연구는 자율주행차, 드론, 로봇 등 온디바이스 AI 환경에서 예측이 어려운 자원 경합(resource contention) 문제를 해결하기 위한 새로운 AI 프레임워크 구조를 제시했다.
기존 온디바이스 AI 프레임워크는 CPU·GPU 등 연산 자원에 고정된 자원 할당(static allocation) 방식을 사용해 AI 추론과 다른 응용 프로그램이 동시에 수행될 경우 성능 저하와 지연이 불가피했다.
이러한 한계를 해결하기 위해 이길호 교수 연구팀은 ‘FlexOn’ 프레임워크를 개발했다.
이 기술은 AI 모델의 구조를 자동으로 분할(segmentation)하고 실행 중 가용한 자원을 동적으로 할당한다.
연구팀은 또한 다단계 모델 분할(multi‑level segmentation) 구조를 적용하고, 환경 변화에 따라 분할 수준과 자원 할당을 조정하는 기법을 제시해 예측하기 어려운 자원 변화에도 유연하게 대응할 수 있도록 했다.
그 결과, 다양한 형태의 자원 경합이 발생해도 신속하게 적응해 실행 중인 작업 간 충돌을 효과적으로 회피하고 안정적인 성능을 보였다.
실험 결과에 따르면, FlexOn은 기존 온디바이스 AI 프레임워크(LiteRT, Google) 대비 AI 추론의 평균 지연시간을 약 54%, 최악 지연시간(95th percentile)을 약 58% 단축했다. 또한 다양한 사양의 임베디드 기기와 AI 모델에서도 일관된 성능 향상을 보였다.
이길호 교수는 “스마트 자동차나 IoT 기기 등은 점점 더 개방된 시스템으로 발전하고 있다”며 “예측 불가능한 자원 경합은 AI 성능의 병목이 될 수 있다. FlexOn과 같은 지능형 자원 관리 프레임워크가 차량·로보틱스·무인항공기 등 온디바이스 AI 응용 전반에 폭넓게 활용될 것”이라고 밝혔다.
(논문명: Mitigating Resource Contention for Responsive On‑device Machine Learning Inferences, IEEE/ACM ICCAD 2025)
<AI융합학부 이길호 교수 연구팀이 세계적 학술대회 IEEE/ACM ICCAD 2025에서 온디바이스 AI 프레임워크 핵심 기술(FlexOn)을 발표했다.>
홍보팀(pr@ssu.ac.kr)

