실시간 뉴스



디지털플랫폼정부 핵심 '데이터레이크', 데이터댐과 다르다 [데이터링]


문재인 정부가 만든 '데이터댐'과 혼동多…데이터레이크, 범정부적 규모

[아이뉴스24 박진영 기자] 디지털플랫폼정부의 핵심 이슈로 흩어진 데이터를 한곳에 모은 '데이터 레이크' 구축이 떠오른 가운데 공공과 민간의 모든 데이터를 어떻게 효과적으로 연계·활용할 지에 대한 논의가 활발해지고 있다.

디지털플랫폼정부의 핵심 이슈로 흩어진 데이터를 한곳에 모은 '데이터 레이크' 구축이 떠오른 가운데 공공과 민간의 모든 데이터를 어떻게 효과적으로 연계·활용할 지에 대한 논의가 활발해지고 있다. [사진=픽사베이]
디지털플랫폼정부의 핵심 이슈로 흩어진 데이터를 한곳에 모은 '데이터 레이크' 구축이 떠오른 가운데 공공과 민간의 모든 데이터를 어떻게 효과적으로 연계·활용할 지에 대한 논의가 활발해지고 있다. [사진=픽사베이]

정부가 목표로 하는 모든 데이터가 연결되는 '디지털플랫폼'을 구현하려면 다양하고 많은 데이터가 필요하기에 데이터 가공없이 종류를 따지지 않고 저장해두는 '데이터레이크'의 필요성이 높아지고 있다.

데이터레이크는 데이터를 원래 형태로 축적해두고 나중에 그것을 필요에 따라 가공하는 구조로, 엄청난 양의 데이터를 일단 쌓아두고 이 데이터로 무엇을 할 지 나중에 판단하는 개념이라 볼 수 있다. 데이터레이크에는 구조화된 데이터는 물론, 반구조·비구조화된 데이터 모두 축적해 모아둔다.

특히, 데이터레이크는 사물인터넷(IoT) 도입이 활발해지면서 성장세가 가속화될 것으로 보인다. 가트너에 따르면, 데이터레이크 시장은 2020년부터 2024년까지 평균 20.6%의 연평균성장률(CAGR)을 기록할 것으로 보인다. 2024년에는 시장 규모가 200억 5천만달러(약 23조원)에 달할 것으로 전망했다.

또 시장조사업체 IDC는 데이터 레이크는 향후 10년 동안 기술 생애주기상 최고 정점을 유지할 것이라 내다봤다.

클라우드 전환이 확산되면서 클라우드·구축이 혼합된 '하이브리드 데이터레이크' 형태로 발전할 것으로 보인다. 이를 통해 다양한 종류의 대용량 데이터를 효율적으로 저장·관리할 뿐더러 데이터 실행환경을 동적으로 구성·제공할 수 있다.

한편, 데이터레이크와 관련해 데이터댐, 데이터 웨어하우스, 데이터패브릭 등 다양한 유사 개념들이 있다. 이 중 문재인 정부 당시 핵심 데이터 정책으로 추진됐던 '데이터댐'과 혼동되는 경우가 많다. 공공데이터를 활용하고, 정부 주도로 데이터 공급이 이루어진다는 공통점이 있기 때문.

데이터댐은 문재인 정부 시절 과학기술정보통신부가 주도한 데이터 구축 사업의 핵심으로, 전세계적으로 통용되는 용어가 아니라 문 정부 당시 만들어진 용어다. 이는 정부가 각종 공공 데이터나 인공지능 학습 등 다양한 분야에 필요한 가치있는 데이터를 공급하는 프로젝트로, 민간에서 필요로 하는 데이터를 정부가 만들어 민간에 제공하는 데 초점을 뒀다.

일반적으로 '데이터레이크'는 자연적으로 형성된 호수처럼 날 것 그대로의 데이터를 보관하는 형태라면, '데이터 댐'은 정부가 인공적으로 데이터셋을 구축해 공급한다는 측면이 강하다. 아울러 디지털플랫폼 정부에서 구상하고 있는 '데이터 레이크'는 공공분야가 가진 데이터를 하나의 시스템에 모두 모아놓고 통합·활용하도록 하겠다는 것이다.

지난 17일 '개인정보 미래포럼(2차)'에서 신민수 한양대 교수는 "현 정부의 데이터 레이크는 공공정보 개방의 의의도 있지만, 행정 혁신에 대한 의미가 더 크다고 본다"면서, "이를 통해 현재 공공 보안체계 하에서 나타날 수 있는 특정 조직 내에 머무르는 정보의 비중이 매우 높은 문제, 국민에게 공개되는 정보가 매우 낮은 문제 등을 개선할 수 있을 것이다"고 밝혔다.

이어 "데이터 댐은 민간투자 정책의 일환으로 과기부에서 추진한 프로젝트라면, 디지털 플랫폼 정부의 데이터 레이크는 보다 범정부적인 규모"라고 설명했다.

/박진영 기자(sunlight@inews24.com)






alert

댓글 쓰기 제목 디지털플랫폼정부 핵심 '데이터레이크', 데이터댐과 다르다 [데이터링]

댓글-

첫 번째 댓글을 작성해 보세요.

로딩중
포토뉴스