[아이뉴스24 윤소진 기자] 마이크로소프트(MS)는 대규모 AI 토큰 생성의 경제성을 획기적으로 개선하기 위해 설계된 추론 가속기 ‘마이아 200(Maia 200)’을 공개했다고 27일 밝혔다.
![마이아 200(Maia 200). [사진=MS]](https://image.inews24.com/v1/eb03a18dadad86.jpg)
마이아 200은 MS 애저(Azure) 환경에서 AI 모델을 더욱 빠르고 경제적으로 구동할 수 있도록 지원하며 차세대 AI 인프라의 핵심 역할을 수행한다.
마이아 200은 TSMC의 3나노미터(nm) 공정을 기반으로 고성능 AI 추론에 최적화된 구조를 갖췄다. 초당 7TB 대역폭의 216GB HBM3e 메모리 시스템과 네이티브 FP8/FP4 텐서 코어, 그리고 데이터 이동 엔진을 유기적으로 결합해 거대 모델에 최적화된 추론 성능을 제공하는 것이 특징이다.
MS에 따르면 마이아 200은 4비트 정밀도(FP4) 기준 3세대 아마존 트레이니움(Amazon Trainium) 대비 3배 높은 처리량을 기록했다. 8비트 정밀도(FP8)에서도 구글의 7세대 TPU를 상회한다. MS는 이러한 기술력을 바탕으로 자사 인벤토리 내 최신 하드웨어 대비 달러당 성능을 30% 개선하며 효율적인 추론 시스템을 구축했다.
마이아 200은 오픈AI의 최신 GPT-5.2 모델을 비롯한 다양한 모델을 지원한다. 이로써 MS 파운드리와 MS 365 코파일럿(Microsoft 365 Copilot)의 가격 대비 성능 효율을 제공한다.
MS 슈퍼인텔리전스팀은 차세대 사내 모델 개선을 위한 합성 데이터 생성 및 강화 학습에 마이아 200을 투입할 계획이다. 해당 칩은 고품질 도메인 특정 데이터의 생성 및 필터링 속도를 가속화해 후속 학습에 정교한 신호를 공급하는 중추적인 역할을 맡게 된다.
마이아 200은 아이오와주 디모인 인근 미국 중부(US Central) 데이터 센터 지역을 시작으로 배포가 진행된다. 향후 애리조나주 피닉스 인근 US West 3 지역 등으로 확대될 예정이다.
/윤소진 기자(sojin@inews24.com)
--comment--
첫 번째 댓글을 작성해 보세요.
댓글 바로가기