실시간 뉴스



플리토, 38억 규모 국립국어원 '한국어-외국어 말뭉치 구축 사업' 수주


595만 어절 규모 말뭉치 구축…동남아 저자원 언어 데이터 부족 해소

[아이뉴스24 윤소진 기자] 인공지능(AI) 데이터 및 솔루션 전문 기업 플리토(대표 이정수)는 국립국어원이 주관하는 ‘2026년 한국어-외국어 말뭉치 구축 사업’을 수주했다고 13일 밝혔다.

플리토는 국립국어원이 주관하는 ‘2026년 한국어-외국어 말뭉치 구축 사업’을 수주했다. [사진=플리토]
플리토는 국립국어원이 주관하는 ‘2026년 한국어-외국어 말뭉치 구축 사업’을 수주했다. [사진=플리토]

‘한국어-외국어 말뭉치 구축 사업’은 인공지능 시대에 한국어 중심의 언어 데이터 주권을 확보하고 통번역 및 음성인식 등 AI 언어 기술 개발을 지원하기 위해 추진되는 국립국어원의 대표적인 대규모 데이터 구축 사업이다.

이번 사업은 경희대학교 산학협력단이 주관하며 플리토는 공동 수행 업체로 참여한다. 총 사업 규모는 약 38억 원으로, 플리토는 이 중 전체 545만 어절과 음성 50만 어절, 총 595만 어절의 병렬 말뭉치 구축을 담당한다. △베트남어 △인도네시아어 △태국어 △힌디어 △크메르어 △타갈로그어 △러시아어 △우즈베크어 △영어 등 기존 9개 언어에 신규 언어 아랍어를 추가해 총 10개 언어 데이터 구축을 진행한다.

올해의 경우 AI 통번역 기술 개발을 위한 언어 자원으로 활용하기 위해 문장 단위에서 문단 단위로 변환해 병렬 말뭉치를 구축한다. 기존 9개 언어에 대한 STS(Speech to Speech) 기반 말뭉치도 함께 구축해 AI 음성 인터페이스 성능 향상을 도모한다. 신규 언어·유형에 맞춘 평가 기준 및 도구 마련, 번역 플랫폼 개선 등 데이터 정제 및 검수 체계 고도화 연구도 병행한다.

이정수 플리토 대표는 “정부 및 연구기관과 협력해 고품질의 AI 언어 데이터를 지속적으로 공급함으로써 글로벌 시장에서 경쟁력 있는 데이터 중심 한국형 AI 모델 강국으로 자리매김하는 데 힘을 보태겠다”고 밝혔다.

/윤소진 기자(sojin@inews24.com)




주요뉴스



alert

댓글 쓰기 제목 플리토, 38억 규모 국립국어원 '한국어-외국어 말뭉치 구축 사업' 수주

댓글-

첫 번째 댓글을 작성해 보세요.

로딩중

뉴스톡톡 인기 댓글을 확인해보세요.



포토뉴스