구글 "AI 자동 자막 생성 서비스, 70개 언어 지원"

라이브 트랜스크라이브로 청각 장애인 소통 돕는다


[아이뉴스24 민혜정 기자] 구글의 인공지능(AI) 기반의 대화 자동 자막 생성 서비스인 '라이브 트랜스크라이브'가 한국어를 포함해 70개 언어를 지원한다.

구글은 이 서비스가 청각장애를 겪는 전 세계 4억6천만명이 넘는 사람들에게 도움이 될 수 있다고 설명했다.

구글코리아는 14일 서울 강남구 사옥에서 '라이브 트랜스크라이브'를 주제로 AI 포럼을 열었다.

라이브 트랜스크라이브는 머신러닝 기반 음성 텍스트 변환 기술을 활용한다. 이는 진행되는 대화를 실시간으로 자막으로 변환해 보여줘 일상생활 속 청각 장애인의 소통을 돕는다. 현재 전 세계 인구의 80% 이상이 사용하는 70개 이상의 언어를 지원하고 있다. 현재 모바일 애플리케이션 형태로 출시 돼 있다.

구글이 14일 AI 포럼에서 '라이브 트랜스크라이브' 기술을 소개했다.

이 서비스는 데이터 처리에 있어 클라우드를 활용한다. 음성 데이터를 클라우드 서버로 전송하고 서버 측에서 음성을 텍스트로 변환해 높은 정밀도로 텍스트 변환이 가능하다는 게 회사 측 설명이다.

자동 자막 생성 기능에서 중요한 건 소음 수준이다. 기기가 시끄러운 곳에서 사람들의 말을 인식하는 건 쉽지 않다. 이를 해결하기 위해 구글에서는 배경의 소음에 비해 사용자 음성의 음량이 어느 정도인지 시각화해 보여주는 신호를 만들었다.

사가 사블라 구글 AI 리서치 프로덕트 매니저는 "이 신호는 마이크가 화자의 음성을 얼마나 잘 인식하고 있는지를 즉각적으로 보여 준다"며 "사용자가 신호를 확인하며 휴대폰의 위치를 조정할 수 있다"고 말했다.

구글은 이 같은 기반 기술을 바탕으로 시끄러운 경우 통화 음성을 명확하게 해주는 앱 사운드 앰플리파이어(음성 증폭)도 출시했다. 마이크의 음성을 증폭시키고 노이즈를 제거해 보다 음성을 알아 듣기 쉽게 해준다.

구글은 자동 자막 생성 기능의 한국어 변환 수준이 떨어진다는 지적에 오류율이 20% 미만이라고 설명했다.

사블라 매니저는 "한국어 오류율은 20% 미만이며 이는 다른 언어에 비해 좋은 수치"라며 "한국어에 대한 데이터를 더 쌓아서 정확도를 높이기 위해 노력하고 있다"고 강조했다.

민혜정기자 hye555@inews24.com

관련기사


포토뉴스









아이뉴스24 TV