SKT 'A.X K1', 한국어 평가 '호랑이 리더보드' 3개 부문 1위

[아이뉴스24 서효빈 기자] SK텔레콤의 초거대 AI 모델 'A.X K1'이 한국어 AI 성능 평가 플랫폼 '호랑이 리더보드'에서 핵심 성능 지표 다수에서 1위를 기록했다.

28일 호랑이 리더보드에 따르면 'A.X K1'은 정부의 독자 AI 파운데이션 모델 개발 프로젝트 1차 평가에 참여한 5개 모델 가운데 일반 지식과 수학적 추론 코딩 능력 등 3개 분야에서 가장 높은 성적을 거뒀다. 수학적 추론 점수는 0.96점 코딩 능력은 0.48점으로 각각 최고치를 기록했다.

매개변수 5190억개 규모의 대형 모델임에도 추론 구조를 최적화해 토큰 효율성에서도 1위를 차지했다. 종합 성능 1위 모델인 LG AI연구원의 'K-엑사원'과 비교하면 평균 4.6배 적은 토큰으로 추론을 수행했다. 수학 추론 영역에서는 토큰 사용량을 약 3.7배 줄이면서도 최고 점수를 유지했다.

호랑이 리더보드는 "수학과 코딩 분야에서 글로벌 모델을 앞서겠다는 목표에 부합하는 기술적 성과"라고 평가했다. 토큰 효율성이 높은 모델은 동일 정확도를 더 적은 연산과 비용으로 구현할 수 있어 대규모 상용 서비스에 유리하다는 분석이다.

다른 국내 모델들도 영역별 강점을 드러냈다. '솔라 오픈 100B'는 정보 검색과 함수 호출 부문에서 각각 0.85점과 0.69점으로 1위를 차지했다. 네이버의 '하이퍼클로바X'는 편향 방지와 윤리 도덕 영역에서 가장 높은 점수를 받았다. '배키'는 환각 방지 영역에서 토큰 대비 효율성이 뛰어난 모델로 평가됐다.

/서효빈 기자(x40805@inews24.com)

SKT 'A.X K1', 한국어 평가 '호랑이 리더보드' 3개 부문 1위

수학·코딩 성능 선두…토큰 효율성도 LG '엑사원' 대비 최대 4.6배 높아

주요뉴스

댓글 쓰기 ^제목 SKT 'A.X K1', 한국어 평가 '호랑이 리더보드' 3개 부문 1위

댓글-

뉴스톡톡 _{인기 댓글을 확인해보세요.}

정렬 인기순 최신순

수학·코딩 성능 선두…토큰 효율성도 LG '엑사원' 대비 최대 4.6배 높아

관련기사

주요뉴스새로고침

댓글 쓰기 제목 SKT 'A.X K1', 한국어 평가 '호랑이 리더보드' 3개 부문 1위

뉴스톡톡 인기 댓글을 확인해보세요. 정렬 인기순 최신순

주요뉴스

댓글 쓰기 ^제목 SKT 'A.X K1', 한국어 평가 '호랑이 리더보드' 3개 부문 1위

뉴스톡톡 _{인기 댓글을 확인해보세요.}

정렬 인기순 최신순