실시간 뉴스



[AI브리핑] "토큰도 아껴야 산다"…기업 AI 비용 관리 4계명


에이전틱 AI·멀티턴 확산에 토큰 비용 부담 커져
가트너 “AI 경쟁력은 성능 아닌 토큰 관리 역량”

[아이뉴스24 윤소진 기자] 앤트로픽·오픈AI·깃허브 등 주요 인공지능(AI) 기업들이 생성형 AI 서비스 과금 체계를 정액제에서 토큰 소비량 기반으로 전환하면서기업들의 AI 운영 비용 관리 부담이 커지고 있다. 특히 에이전틱 AI와 멀티턴 대화 등 고소비 구조가 확산되면서 토큰 관리가 새로운 경쟁력으로 부상하고 있다는 분석이다.

[사진=챗GPT 제작]
[사진=챗GPT 제작]

가트너는 이달 발간한 ‘AI 토크노믹스(AI Tokenomics): AI 기반 애플리케이션에서의 LLM 사용량 측정’ 보고서를 통해 “토큰 기반 과금은 기존 좌석 기반(SaaS Seat) 예산 구조를 변동형 비용 구조로 바꾸고 있다”며 “사용량 가시성이 없으면 예산 초과와 비용 대비 가치 추적 실패로 이어질 수 있다”고 진단했다.

토크노믹스(Tokenomics)는 AI 모델이 텍스트를 처리하는 기본 단위인 ‘토큰(Token)’과 경제학을 뜻하는 ‘이코노믹스(Economics)’를 결합한 개념으로, AI 서비스 이용 과정에서 발생하는 토큰 소비와 비용 구조를 관리·분석하는 것을 뜻한다.

토큰은 거대언어모델(LLM)이 텍스트를 처리하는 기본 단위다. 가트너에 따르면 일반적으로 단어 1개는 약 0.75토큰 수준으로 환산된다. 기업들은 입력 토큰과 출력 토큰 모두에 비용을 지불해야 한다. 특히 출력 토큰 비용은 입력 토큰보다 최대 10배 높은 것으로 분석됐다.

가트너는 특히 멀티턴 대화와 에이전틱 AI 구조가 토큰 소비를 급증시키는 핵심 요인이라고 봤다. 멀티턴 대화는 AI가 이전 대화 맥락을 기억한 채 여러 차례 질의응답을 이어가는 방식으로, 대화가 길어질수록 토큰 사용량도 함께 증가한다. 에이전틱 AI 역시 계획·툴 호출·반복 검증 과정에서 모델을 여러 차례 호출해 토큰 사용량이 급증하는 구조다.

AI 비용 통제 위한 4가지 대응 전략

가트너는 기업들의 대응 전략으로 △토큰 사용량 측정 △사용자 교육 △FinOps 통합 △벤더 과금 구조 분석 등 4단계 접근을 제시했다.

우선 API 메타데이터, 관리자 콘솔, 사용량 대시보드 등을 활용해 애플리케이션별 토큰 소비 패턴을 측정해야 한다고 강조했다. 특히 사용자·부서·워크플로우 단위로 사용량을 분석해야 비용 통제가 가능하다고 설명했다.

사용자 교육도 핵심 과제로 꼽혔다. 불필요하게 긴 프롬프트나 반복 질의를 줄이고, 프롬프트 템플릿을 표준화해 비효율적인 토큰 소비를 줄여야 한다는 설명이다.

아울러 가트너는 토큰 비용 관리를 기존 클라우드 비용 관리 체계인 핀옵스(FinOps)에 통합해야 한다고 조언했다. 단순 사용량이 아니라 실제 업무 성과와 연결해 비용 대비 가치를 평가해야 한다는 의미다.

벤더별 과금 구조 차이에 대한 점검 필요성도 제기됐다. 동일 제품군 안에서도 버전별 과금 체계가 달라질 수 있으며, 일부 기업은 토큰 대신 ‘AI 작업 완료 건수’ 기반의 결과 중심 과금 모델을 적용하고 있다는 설명이다.

가트너는 “AI 애플리케이션 확산으로 토큰 소비는 계속 증가할 것”이라며 “기업들은 이제 AI 성능뿐 아니라 토큰 효율성과 비용 가시성까지 관리해야 하는 단계에 들어섰다”고 분석했다.

/윤소진 기자(sojin@inews24.com)




주요뉴스



alert

댓글 쓰기 제목 [AI브리핑] "토큰도 아껴야 산다"…기업 AI 비용 관리 4계명

댓글-

첫 번째 댓글을 작성해 보세요.

로딩중

뉴스톡톡 인기 댓글을 확인해보세요.



포토뉴스