KT '믿:음 K', 글로벌 AI 평가서 국내 중소형 모델 1위

[아이뉴스24 서효빈 기자] KT는 자체 개발한 인공지능(AI) 모델 '믿:음 K'가 글로벌 AI 모델 성능 종합 평가 플랫폼 'AAII'에서 국내 중소형 모델 가운데 1위를 차지했다고 5일 밝혔다.

AAII(Artificial Analysis Intelligence Index)’에 등재된 믿:음 K [사진=AAII]

AAII는 AI 평가 전문 기관 Artificial Analysis가 운영하는 글로벌 평가 플랫폼이다. 단일 시험이 아닌 다수의 공개 벤치마크 결과를 종합해 전 세계 주요 AI 모델 성능을 비교한다. 국내 주요 AI 모델로는 LG 엑사원, 네이버 하이퍼클로바, 업스테이지 솔라, 모티프 등이 함께 등재돼 있다.

이번 평가에서 '믿:음 K'는 추론, 전문 지식, 수학·프로그래밍, 에이전트 수행 능력 등 10여 개 핵심 평가 항목에서 고른 점수를 기록했다. 사용자의 질문에 응답하는 데 그치지 않고 목표를 이해한 뒤 필요한 시스템과 도구를 활용해 과업을 수행하는 에이전틱 AI로서의 경쟁력을 공식적으로 인정받았다.

특히 KT의 '믿:음 K'는 주요 에이전트 성능 벤치마크 중 하나인 'τ²-bench(타우 스퀘어 벤치)'에서 87%를 기록했다. τ²-bench는 AI가 실제 업무 환경에서 사람과 협업하며 여러 도구를 활용해 과업을 끝까지 수행할 수 있는지를 평가하는 지표다. 해당 점수는 구글 최신 모델 제미나이3와 유사한 수준이다.

KT는 '믿:음 K'가 기업 내부 업무 자동화, 문서 분석과 작성, 소프트웨어 개발, 서버 관리 등 실무 중심 영역에서 인간 개입을 최소화하고 자율적으로 과업을 수행할 수 있는 '실전형 AI'로 평가받았다고 설명했다.

오승필 KT 기술혁신부문장 부사장은 "이번 AAII 등재는 KT의 자체 AI 기술력이 글로벌 기준에 도달했음을 입증한 성과"라며 "에이전틱 AI를 통해 한국 기업의 업무 혁신과 디지털 전환을 이끄는 AI 파트너가 되겠다"고 말했다.

/서효빈 기자(x40805@inews24.com)

KT '믿:음 K', 글로벌 AI 평가서 국내 중소형 모델 1위

에이전트 성능 최정상 수준… 한국 기업 위한 ‘에이전틱 AI’ 솔루션 제시

주요뉴스

댓글 쓰기 ^제목 KT '믿:음 K', 글로벌 AI 평가서 국내 중소형 모델 1위

댓글-

뉴스톡톡 _{인기 댓글을 확인해보세요.}

정렬 인기순 최신순

에이전트 성능 최정상 수준… 한국 기업 위한 ‘에이전틱 AI’ 솔루션 제시

관련기사

주요뉴스새로고침

댓글 쓰기 제목 KT '믿:음 K', 글로벌 AI 평가서 국내 중소형 모델 1위

뉴스톡톡 인기 댓글을 확인해보세요. 정렬 인기순 최신순

주요뉴스

댓글 쓰기 ^제목 KT '믿:음 K', 글로벌 AI 평가서 국내 중소형 모델 1위

뉴스톡톡 _{인기 댓글을 확인해보세요.}

정렬 인기순 최신순