번역 소프트웨어 업체로 잘 알려진 언어공학 연구소는 최근 1.5세대 인공
지능형 검색 엔진을 개발, 화제를 불러 일으키고 있다.
이 검색엔진은 언어공학연구소의 다국어 포털 사이트인 ‘월드맨
(www.worldman,com)에서 서비스 할 예정인데, 기존 검색어 처리 기능에 5W
2H 방식을 도입, 입력된 문장을 언제, 어디서, 누가, 무엇을, 왜, 얼마나 ,
어떻게의 형태로 분석해 준다.
이는 기존 자연어 검색 엔진이 이 단어 자체가 포함된 문장이나 텍스트를
검색해 준 것과는 달리 단어 자체가 아닌 단어의 의미를 분석해 준다는 차
별점이 있다.
예를들어, ‘임진 왜란이 일어난 연도는?’ 이라는 검색어로 검색을 시작하
면 기존 자연어 검색 처리 방식은 ‘임진왜란’, ‘연도’ ‘일어난’ 이라
는 단어가 들어 있는 사이트를 모두 찾아내는 AND OR 로 연결된 단위 조합
형태였다.
이에 비해 언어공학연구소의 자연어 검색의 경우 문장의 단어를 5W 2H 형태
로 연관시켜 핵심 단어의 인덱스 파일을 만들어 이를 비교, 검색하는 과정
을 거쳐 ‘임진왜란’과 관련있는 연도가 기록된 웹사이트만을 선별해서 찾
아낸다.
이렇게 핵심 단어를 인덱스 파일로 만들어 검색하기 때문에 기존 자연어 검
색 엔진보다 검색 속도가 빠를 뿐 아니라 필요없는 사이트는 알아서 제외하
므로 꼭 필요한 정보만을 볼 수 있다는 장점이 있다.
언어공학연구소는 현재 서비스중인 다국어 번역 서비스를 함께 제공하여 다
양한 검색이 가능하도록 할 예정이다.
올 하반기에는 사이트 전체를 번역해 주는 솔루션을 장착, 사용자들이 언어
에 제한없이 웹서핑을 할 수 있도록 서비스할 계획이다.
이밖에도 전문분야 검색 엔진 솔루션을 개발, 전기, 전자, 정보통신, 화
학, 생명공학, 의학, 교육, 무역, 군사 등 30개 분야를 한국어, 일본어, 영
어, 중국어, 대만어로 번역해 검색할 수 있도록 했다.
또 번역에 필수인 다국어 전자 사전 개발에 착수, 현재 영한, 일한, 중한
등 사전 데이터 베이스를 구축했다. 전자 사전 ‘사이버딕’은 영햔
20만, 일한 12만, 중한 6만 단어 등 총 2백 20만 단어가 수록돼 있다.
번역 속도는 초당 8백자까지 가능하며, 일한 번역의 경우 일반 문서는
80%, 비즈니스 문서는 95%까지 번역이 가능하다.
내년 상반기 개발 완료될 전문분야 검색 엔진 솔루션은 특히 B2B에 초점을
맞춰 중국, 일본 등 해외 시장을 적극적으로 공략할 계획이다.
이를 위해 이미 중국 북경에 한국 SW진흥원 산하 조직으로 설립될 중국 비
즈니스 지원 센터 입주 기업으로 선정되어 오는 6월중 중국의 실리콘밸리
라 불리는 북경 중관촌에 입성할 예정이다.
또 일본 현지에도 소프트웨어 유통 중심의 현지 법인 아시아로닷컴
(Asiro.com)을 설립, 해외 시장 진출을 위한 준비를 마친 상태다.
이밖에도 다국어, 자연어 검색 서비스를 CD와 번들의 형태로 만들어 온라
인, 오프라인을 망라한 확실한 수익 모델을 구축하겠다는 전략이다.
장충엽 사장은 “다국어 검색 사업을 통해 축적한 DB형태소 분석기와 지식
베이스 사전 기술을 활용해 인공지능형 자연어 검색 엔진을 개발했다”며
“웹스파이더를 통해 축적한 900만 페이지뷰 가량의 데이터도 지속적으로
늘려 나갈 계획” 이라고 말했다.
언어공학연구소의 자본금은 12억이며, 조만간 기관투자자, 벤처 캐피탈로부
터 자본을 유치할 계획이다. 또 이를 통해 올 하반기 주식 공모를 예정하
고 있다.
현재 언어공학연구소는 자연어 검색 서비스 오픈을 위해 막바지 데이터베이
스 확보에 주력하고 있으며, 6월 초 서비스를 본격 오픈할 예정이다.
/이유선기자 sunny@inews24.com
--comment--
첫 번째 댓글을 작성해 보세요.
댓글 바로가기