실시간 뉴스



젠슨 황 "그록 칩 생산, 땡큐 삼성"…엔비디아 추론 AI 전략 공개


'베라 루빈'에 그록 LP30 결합…AI 연산 구조 재설계
256개 LPU 묶은 'LPX 랙' 공개…데이터센터 추론 성능 강화

[아이뉴스24 권서아 기자] 엔비디아가 인공지능(AI) 추론 연산에 특화된 칩 '그록(Groq)'을 공개하며 삼성전자 파운드리(반도체 위탁생산)를 직접 언급했다.

젠슨 황 엔비디아 최고경영자(CEO)는 16일(현지시간) 미국 캘리포니아 새너제이에서 열린 연례 개발자 행사 'GTC 2026' 기조연설에서 "그록 LP30 칩을 제조해 준 삼성에 감사하다"고 말했다.

젠슨 황 엔비디아 최고경영자(CEO)가 미국 캘리포니아 새너제이에서 열린 'GTC 2026' 기조연설에서 차세대 AI 플랫폼 '베라 루빈'을 소개하고 있다. [사진=엔비디아 유튜브 캡처]
젠슨 황 엔비디아 최고경영자(CEO)가 미국 캘리포니아 새너제이에서 열린 'GTC 2026' 기조연설에서 차세대 AI 플랫폼 '베라 루빈'을 소개하고 있다. [사진=엔비디아 유튜브 캡처]

그록 칩은 엔비디아의 차세대 AI 플랫폼 '베라 루빈'에 결합되는 구조다.

엔비디아는 AI 데이터센터에서 발생하는 연산을 그래픽처리장치(GPU)와 추론 전용 칩으로 분리하는 새로운 아키텍처를 제시했다.

사용자의 입력을 분석하고 문맥을 계산하는 프리필(prefill) 단계는 루빈 GPU가 담당하고, 실제 응답을 생성하는 디코드(decode) 단계는 그록 칩이 처리하는 방식이다.

엔비디아는 이를 통해 대형 언어모델의 추론 지연 시간을 줄이고 데이터센터 처리 효율을 높일 수 있다고 설명했다.

젠슨 황 엔비디아 최고경영자(CEO)가 미국 캘리포니아 새너제이에서 열린 'GTC 2026' 기조연설에서 차세대 AI 플랫폼 '베라 루빈'을 소개하고 있다. [사진=엔비디아 유튜브 캡처]
젠슨황 엔비디아 최고경영자(CEO)가 16일(현지시간) 미국 새너제이에서 열린 GTC 2026 기조연설에서 차세대 AI 컴퓨팅 플랫폼을 소개하고 있다. [사진=엔비디아 유튜브 캡처]

엔비디아는 이날 256개의 언어처리장치(LPU)를 하나의 시스템처럼 묶은 '그록 3 LPX' 랙도 공개했다.

해당 시스템은 대규모 AI 서비스에서 발생하는 추론 연산을 처리하기 위해 설계된 데이터센터 인프라다.

엔비디아는 이날 차세대 GPU 로드맵도 공개했다. 루빈 이후 아키텍처로 '루빈 울트라(Rubin Ultra)'와 '파인먼(Feynman)' GPU를 제시하며 AI 데이터센터 플랫폼 확장 전략을 밝혔다.

젠슨 황 CEO는 AI 시장 성장 전망도 제시했다. 그는 "엔비디아가 대응하는 AI 칩 시장 기회가 최소 1조달러(약 1500조원)에 이를 것"이라고 말했다.

젠슨 황 엔비디아 최고경영자(CEO)가 미국 캘리포니아 새너제이에서 열린 'GTC 2026' 기조연설에서 차세대 AI 플랫폼 '베라 루빈'을 소개하고 있다. [사진=엔비디아 유튜브 캡처]
미국 캘리포니아주 새너제이 SAP센터에서 엔비디아 개발자 행사 'GTC 2026'이 진행되고 있다. [사진=엔비디아 홈페이지 캡처]
/권서아 기자(seoahkwon@inews24.com)




주요뉴스



alert

댓글 쓰기 제목 젠슨 황 "그록 칩 생산, 땡큐 삼성"…엔비디아 추론 AI 전략 공개

댓글-

첫 번째 댓글을 작성해 보세요.

로딩중

뉴스톡톡 인기 댓글을 확인해보세요.



포토뉴스