실시간 뉴스



셀렉트스타, 'ICLR 2026' 메인 트랙 논문 채택…"국가별 AI 안전성 시험문제 자동 생성"


자체 개발 ‘레드티밍 벤치마크 생성’ 프레임워크, 세계 최상위 AI 학회서 연구 성과 인정

[아이뉴스24 서효빈 기자] 인공지능(AI) 데이터·신뢰성 평가 전문기업 셀렉트스타가 자체 개발한 AI 안전성 검증 기술로 세계 최고 권위 학회에서 기술력을 인정받았다.

'CAGE' 논문에 참여한 셀렉트스타 임용택 연구원(왼쪽), 김민우 AI 세이프티 팀장. [사진=셀렉트스타]
'CAGE' 논문에 참여한 셀렉트스타 임용택 연구원(왼쪽), 김민우 AI 세이프티 팀장. [사진=셀렉트스타]

셀렉트스타는 AI Safety팀 연구 논문 'CAGE: A Framework for Culturally Adaptive Red-Teaming Benchmark Generation'이 오는 4월 브라질에서 열리는 ICLR 2026 메인 컨퍼런스에 채택됐다고 19일 밝혔다.

ICLR은 AI·머신러닝 분야 최상위권 국제 학회로 꼽힌다. 올해는 1만9000여 건의 논문 중 약 28%만 채택됐다. 셀렉트스타 논문은 가장 비중이 큰 메인 트랙에 선정돼 독창성과 기술 완성도를 인정받았다. 이번 연구는 기획부터 구현·검증·논문 게재까지 외부 교수진이나 연구기관 도움 없이 내부 인력만으로 수행했다.

CAGE는 국가별 문화와 법적 맥락을 반영해 AI 안전성을 검증하는 레드티밍 데이터를 자동 생성하는 프레임워크다. AI가 위험 질문에 안전하게 대응하는지 점검하는 시험문제를 언어·문화권별로 자동 생성한다. 기존 검증은 영미권 데이터셋을 번역해 활용하는 방식이 주를 이뤘다. 이 경우 각국의 실제 위험 상황을 충분히 반영하지 못하는 한계가 있었다.

연구팀은 '시맨틱 몰드(Semantic Mold)' 개념을 제안해 국가 문화 특성을 반영한 공격 질문을 생성했다. CAGE로 만든 공격 시나리오는 사람이 작성한 수준의 자연스러움을 보였다. AI 모델의 방어율을 넘어 잠재 위험을 찾아내는 공격 성공률도 높게 나타났다. 캄보디아어 등 데이터가 부족한 언어권에서도 우수한 성능을 확인했다.

논문에는 CAGE를 한국에 적용한 한국형 안전성 벤치마크 'KoRSET'도 함께 공개했다. KoRSET은 단순 번역 데이터셋보다 AI 모델 취약점을 효과적으로 탐지했다. 한국 문화 기반 안전성 검증에 최적화된 성능을 입증했다.

김민우 셀렉트스타 AI Safety 팀장은 "이번 ICLR 채택은 셀렉트스타가 독보적 원천 기술을 보유한 AI 기업임을 입증한 사례"라며 "CAGE는 대기업 AI 프로젝트에 적용돼 취약점 점검과 운영 효율 개선에 활용되고 있다"고 말했다. 임용택 연구원은 "이제 AI 경쟁력은 성능을 넘어 안전성"이라며 "현장에서 바로 활용 가능한 안전 평가 기술로 글로벌 기준 마련에 기여하겠다"고 했다.

/서효빈 기자(x40805@inews24.com)




주요뉴스



alert

댓글 쓰기 제목 셀렉트스타, 'ICLR 2026' 메인 트랙 논문 채택…"국가별 AI 안전성 시험문제 자동 생성"

댓글-

첫 번째 댓글을 작성해 보세요.

로딩중

뉴스톡톡 인기 댓글을 확인해보세요.



포토뉴스