[IT사이트] 사진 속 문장→디지털 문서로…광학문자인식 OCR


차량 번호판 인식 등 실생활 적용 확대…네이버·한컴그룹 등 기술 보유

정보통신기술(ICT)이 급격하게 진화발전하면서 현안에 대한 복잡성도 더욱 증대되고 있다. 때문에, 디지털 정보에 뒤쳐진 이들의 소외감도 증가하고 있는 실정이다. 이에 다소 난해한 ICT 용어를 풀어 설명할 수 있는 ICT 리터러시 코너를 마련해봤다. 어려운 ICT를 보다 쉽게 접할 수 있는 기회가 되기를 바란다. [편집자주]

[아이뉴스24 최은정 기자] 명함에 적힌 정보를 손으로 일일이 타이핑하는 시대는 지났다. 스마트폰 카메라로 명함을 스캔하면 데이터가 자동으로 주소록에 저장되는 서비스들이 대거 등장해서다. 광학문자인식(OCR)으로 불리는 요소 기술이 있기에 가능했던 일이다.

OCR은 이미지, PDF 내 문자를 편집 가능한 텍스트 형식으로 바꿔주는 기능을 갖고 있다. 종이에 인쇄되거나 수기로 쓰인 문자, 기호 등에 빛을 비추고 여기서 나온 반사 광선을 이용한다. 이 광선을 전기 신호로 바꿔 PC에 입력하는 식이다.

AI 관련 이미지

주로 소형 하드웨어 기기나 전용 소프트웨어 등을 통해 활용할 수 있다. OCR이 유용하게 활용되는 산업군 중 하나는 금융 서비스 분야다. 사용자 인증 시 개인 신분증 인식, 고지서 세납을 위한 실제 금액 인식 등에 OCR이 쓰이는 것.

최근에는 무인 주차장에서 차량 번호판을 인식해 출차 시 요금을 정산하는 등의 실생활에도 활발히 적용되는 추세다.

OCR 기술 연구가 시작된 시점은 1920년대 후반으로 추정된다. 오스트리아 엔지니어인 구스타프 타우셰크 박사가 1928년 OCR 장치를 특허 등록한 이후 다양한 OCR 탑재 제품들이 개발됐다.

현재는 구글, 마이크로소프트(MS), 어도비 등 빅테크 기업부터 ABBYY 등 전문 기업들이 OCR 시장을 이끌고 있다. 국내의 경우 네이버, 한글과컴퓨터, 사이냅소프트 등이 주요 제공 업체로 꼽히며 다수 스타트업들도 OCR 연구에 참여하고 있다.

최근 2~3년 간 인공지능(AI) 딥러닝 기반 OCR로 고도화하면서 기업의 로봇프로세스자동화(RPA) 솔루션과 결합, 업무 효율성을 높이는 등 시너지를 내기도 한다. 문서에 포함된 민감정보를 골라내 마스킹(가림 처리)함에 따라 보안을 강화할 수도 있다.

한 업계 관계자는 "딥러닝 기반 OCR이 개발되면서 기존 문서뿐 아니라 사진, 간판, 표지판 등의 문자도 인식할 수 있게 됐다"면서 "또 문서 양식이 다른 이미지라도 동일한 카테고리만 뽑아내 수정 가능한 텍스트로 변환할 수 있도록 발전되고 있다"고 기술 동향을 설명했다.

OCR 시장은 매해 확대되고 있다. 시장조사 기관 그랜드뷰리서치에 따르면, 글로벌 OCR 시장 규모는 올해 89억2천만 달러(약 10조5천억원)에서 오는 2028년 263억1천만 달러(약 31조원)를 기록할 것으로 전망된다. 이 기간 연평균 성장률(CAGR)은 16.7%다.

/최은정 기자(ejc@inews24.com)







포토뉴스