[구글I/O]실시간 자동 자막, 인터넷 없어도 된다

구음 장애인 위한 기술·서비스 개발도 노력


[아이뉴스24 민혜정 기자] 구글의 새로운 안드로이드 '안드로이드Q'가 지원하는 실시간 자막(라이브 캡션) 기능은 인터넷이 없는 환경에서도 구현된다. 머신러닝 덕분에 대용량 모델을 줄여서 자체 기기(On device)로 데이터 처리가 가능해졌기 때문이다.

브라이언 켐러 안드로이드 접근성 프로덕트 매니저는 8일(현지시간) 미국 마운틴뷰에서 열린 I/O 기자간담회에서 이같이 강조했다.

켐러 매니저는 "예전 모델의 경우 수백 기가바이트가 필요했는데 이 모델을 줄여 자체 디바이스로 처리할 수 있을만큼 발전했다"며 "모든 음성 데이터를 클라우드로 보내지 않기 때문에 인터넷이 연결돼 있지 않은 환경에서도 구현된다"고 강조했다.

라이브캡션은 안드로이드폰 사용자가 동영상이나 오디오를 재생할 경우 이 콘텐츠에 자막을 실시간으로 달아주는 기능이다.

줄리 카티오 구글 AI 프로덕트 매니저

유튜브나 인스타그램 등의 동영상 서비스 앱이나 스카이프 같은 화상 채팅 앱을 이용할 경우 화면 상단에 자막이 생성돼 귀가 어두워 듣기에 불편한 사람들도 영상 또는 오디오 내용을 정확하게 파악할 수 있다.

구글은 말하는 데 어려움을 겪는 구음장애인을 위한 기술, 서비스 개발에도 힘을 쏟고 있다. 말을 알아 듣는다는 AI 기기가 등장했다고 하지만 이들은 소외되는 경우가 많기 때문이다.

구글의 사회적 공익을 위한 AI 프로그램 내 유포니아(Euphonia) 프로젝트 팀은 이러한 문제를 해결하는 데 도움을 주기 위해 AI를 활용해 또렷하지 않은 말소리 등 다양한 말소리 형태를 컴퓨터가 더 잘 인식할 수 있도록 데이터를 모으고 기계 학습을 진행 중이다.

구글은 이를 위해 데이터를 늘려야 한다고 강조했다.

줄리 카티오 구글 AI 프로덕트 매니저는 "음성 샘플을 가지고 AI 알고리즘을 활용해 모델을 트레이닝한다"며 "하지만 아직 충분한 자료가 많이 없어서, 구음장애를 가진 사람들로 부터 데이터 음성 샘플을 모아서 거기에서 시작하고 있다"고 말했다.

마운틴뷰(미국)=민혜정기자 hye555@inews24.com

관련기사


포토뉴스








아이뉴스24 TV