[아이뉴스24 윤소진 기자] “1차 목표 모델 대비 104% 성능을 달성했고, 오픈웨이트 모델 기준 글로벌 톱5 수준에 도달했다.”
![최정규 LG AI연구원 AI에이전트그룹장이 30일 오후 서울 삼성동 코엑스에서 열린 독자AI 프로젝트 1차 발표회에서 K-엑사원 개발 성과를 발표하고 있다. [사진=윤소진 기자]](https://image.inews24.com/v1/4f962e72da75c6.jpg)
최정규 LG AI연구원 AI에이전트그룹장은 30일 오후 서울 삼성동 코엑스에서 열린 독자AI 프로젝트 1차 발표회에서 초대형 AI 모델 ‘K-엑사원(EXAONE)’의 성능을 공개하며 이같이 밝혔다.
K-엑사원은 프런티어급 236B(매개변수 2,360억 개) 규모의 오픈 웨이트 모델로 개발됐다. 오픈 웨이트 모델은 학습된 가중치(weight)를 공개해 누구나 모델을 내려받아 활용·개선할 수 있는 방식으로, 폐쇄형(클로즈드) 모델과 달리 기술 경쟁력과 생태계 확산 가능성을 동시에 평가받는 영역이다.
최 그룹장은 “글로벌 최신 AI 모델 대비 100% 이상 성능이라는 도전적인 목표로 개발에 착수했다”며 “1차 평가에서 목표 모델로 설정한 알리바바 큐원(Qwen)3 235B를 상회하는 성능을 확보했다”고 말했다. ‘K-엑사원’은 13개 공통 벤치마크 평균 점수에서 72.03점을 기록해 Qwen3 235B(69.37점) 대비 104% 성능을 달성했다.
그는 이어 “300B 이하 오픈 웨이트 모델 가운데 강자로 평가받는 오픈AI GPT-OSS 120B와 비교해도 103% 수준의 성능을 확보했다”며 “글로벌 오픈 웨이트 모델 기준 톱5를 노릴 수 있는 성능”이라고 밝혔다. GPT-OSS 120B와 Qwen3 235B는 글로벌 AI 분석 기관 ‘아티피셜 어낼리시스(Artificial Analysis)’ 기준 오픈 웨이트 모델 중 각각 6위와 7위권에 해당한다.
핵심적인 차별화 기술로는 △독자적인 전문가 혼합(MoE) 모델 △하이브리드 어텐션 △고도화된 강화학습(Advanced GRPO) 등을 제시했다.
최 그룹장은 "독자적인 MoE 구조를 적용해 전체 모델을 항상 구동하는 대신 상황에 맞는 일부 전문가 네트워크만 선택적으로 활용하도록 설계했다"며 "연산 효율을 높이면서도 기존 MoE 구조의 단점으로 지적되던 학습 불안정성은 구조 보완을 통해 개선했다"고 설명했다.
그는 이어 "슬라이딩 윈도우 기반의 로컬 어텐션에 일부 핵심 레이어에서 글로벌 어텐션을 결합한 하이브리드 어텐션) 구조를 적용해 성능 저하는 최소화하면서도 학습에 필요한 연산량을 기존 대비 약 30% 수준으로 줄였다”며 "이를 통해 고가의 최신 GPU가 아닌 A100급 GPU 환경에서도 프런티어급 모델 구동이 가능해졌다”고 말했다.
‘K-엑사원’은 이미 산업 현장에서도 활용되고 있다. 최 그룹장은 “석유화학 공정 최적화와 신물질 발굴 AI 적용을 통해 기존 22개월 걸리던 개발 기간을 하루로 단축하는 성과를 냈다”며 “현재는 그룹 전사 업무 생산성 향상은 물론 금융·콘텐츠 분야로도 확산 중”이라고 언급했다.
최 그룹장은 “5개월 만에 글로벌 빅테크 최신 모델과 경쟁 가능한 수준의 성능을 확보했다”며 “앞으로는 성능을 넘어 안전성과 신뢰성에서도 글로벌 경쟁 모델을 상회하는 수준을 목표로 고도화를 이어가겠다”고 밝혔다.
![최정규 LG AI연구원 AI에이전트그룹장이 30일 오후 서울 삼성동 코엑스에서 열린 독자AI 프로젝트 1차 발표회에서 K-엑사원 개발 성과를 발표하고 있다. [사진=윤소진 기자]](https://image.inews24.com/v1/f8dad3e252cc34.jpg)
--comment--
첫 번째 댓글을 작성해 보세요.
댓글 바로가기