[아이뉴스24 윤소진 기자] 오픈AI는 전문적인 업무 수행을 위한 프론티어 모델 GPT-5.4를 6일 공개했다. 챗GPT, API, 코덱스(Codex) 등 주요 제품 전반에 적용되며, 추론능력과 코딩성능, 에이전트 기반 워크플로우를 하나의 모델로 통합한 것이 특징이다.
![챗GPT에 GPT-5.4가 적용된 화면. [사진=오픈AI]](https://image.inews24.com/v1/d673e356161f7e.jpg)
GPT-5.4는 스프레드시트, 프레젠테이션, 문서와 같은 전문 업무 환경에서 다양한 도구와 소프트웨어를 활용하는 방식을 크게 개선했다. 복잡한 실제 업무를 보다 정확하고 효율적으로 수행할 수 있으며, 사용자가 원하는 결과를 얻기까지 필요한 반복 작업도 줄였다.
성능 측면에서는 AI 에이전트가 실제 지식 기반 업무를 수행하는 능력을 평가하는 GDPval 벤치마크에서 GPT-5.4는 전체 업무 과제 비교 중 83%에서 산업 전문가와 동등하거나 더 높은 수준의 결과를 보였다. 이는 GPT-5.2의 71%보다 크게 향상된 결과다. GDPval은 미국 GDP의 주요 산업을 대표하는 44개 직군의 업무 과제를 기반으로 모델의 실제 업무 수행 능력을 평가한다.
오픈AI는 GPT-5.4 개발 과정에서 특히 스프레드시트, 프레젠테이션, 문서 생성 및 편집 능력을 강화했다. 투자은행의 주니어 애널리스트가 수행할 수 있는 수준의 스프레드시트 모델링 작업을 평가한 내부 벤치마크에서 GPT-5.4는 평균 87.5%의 점수를 기록해 GPT-5.2의 68.4%를 크게 상회했다. 프레젠테이션 제작에서도 디자인 완성도와 시각적 다양성, 이미지 생성 활용도와 함께, 모델의 사실 정확성도 개선됐다.
GPT-5.4는 오픈AI가 공개한 범용 모델 가운데 컴퓨터 사용(computer-use) 능력을 기본적으로 탑재한 최초의 범용 모델이다. GPT-5.4는 최대 100만 토큰(1M tokens)의 컨텍스트를 지원한다.
GPT-5.4는 챗GPT에서 이용 가능한 모델 중 ‘GPT-5.4 Thinking’을 선택해서 사용하는 것도 가능하다. 모델이 답변을 생성하기 전에 작업 계획을 먼저 제시해 사용자가 응답 생성 중에도 방향을 조정할 수 있도록 한다. 추가 대화를 반복하지 않아도 원하는 결과에 보다 빠르게 도달할 수 있다. 웹 기반 심층 조사 능력이 강화되어 여러 출처의 정보를 종합해야 하는 복잡한 질문에서도 더 정확하고 일관된 답변을 제공한다.
GPT-5.4는 도구 검색 기능을 도입했다. 에이전트는 다양한 도구와 커넥터가 연결된 환경에서 필요한 도구를 더 정확하게 찾아 사용할 수 있으며, 토큰 사용량과 응답 지연도 줄일 수 있다.
/윤소진 기자(sojin@inews24.com)
--comment--
첫 번째 댓글을 작성해 보세요.
댓글 바로가기