'국가 바이오 연구 허브'…전용 데이터센터 구축 완료

29일 국가생명연구자원정보센터(KOBIC) 준공식 개최


[아이뉴스24 최상국 기자] 국가 바이오 정보 인프라 역할을 맡고 있는 '국가생명연구자원정보센터'가 전용 데이터센터 구축을 완료, 폭증하고 있는 바이오 빅데이터 연구지원을 위한 준비를 갖췄다.

한국생명공학연구원(원장 김장성)은 ‘국가생명연구자원정보센터(KOBIC; Korean Bioinformation Center)’의 신규 인프라 시설 구축을 완료하고 29일 오후 준공식을 개최한다고 밝혔다.

생명硏 내의 약10만㎡ 부지에 연면적 6천205㎡의 3층 건물로 새로 지어진 국가생명연구자원정보센터는 현재 센터가 보유하고 있는 전산자원의 최대 12배까지 수용할 수 있는 공간을 확보했으며 데이터센터에 최적화된 시설을 갖추었다.

국가생명연구자원정보센터 전경 [생명연 제공]

생명연 관계자는 "독립된 데이터센터 건축이 완료됨에 따라, 그동안 연구소 내의 기존 건물에 입주한 전산 자원의 하중으로 인한 안전문제와, 데이터 폭증으로 인한 공간부족 문제를 해소할 수 있게 됐으며, 향후 20년간 필요할 것으로 예상되는 공간도 미리 확보함으로써 명실상부한 바이오 빅데이터 연구의 허브 역할을 할 수 있게 됐다"고 말했다.

센터는 현재 60테라플롭스(TF)의 이론성능을 갖춘 3천368코어 규모의 CPU 자원과 13.4페타바이트(PB) 규모의 스토리지 자원을 갖추고 있다. 이번에 완공된 건물의 데이터센터 공간은 3만코어, 200페타바이트까지 수용할 수 있도록 설계됐다.

센터 관계자는 "누구나 사용할 수 있는 공공 인프라인 만큼 컴퓨팅, 네트워킹, 스토리지, 보안 등의 모든 요소를 가상화해 안정성, 확장성, 효율성, 에너지 절감에 중점을 두고 구축했으며 재해나 장애 시에도 분석서비스 및 데이터를 안정적으로 보호하기 위해서 생명硏 오창분원에 백업된 데이터를 위한 별도의 재해복구시스템도 구축했다"고 설명했다.

바이오 데이터는 전세계적으로 폭증하고 있는 상태다. 특히, 차세대 염기서열 분석기술(Next Genome Sequencing, NGS)이 개발되면서 유전체 데이터의 양은 폭발적으로 증가하고 있으며, 이에 따라 방대한 데이터를 처리하기 위한 기술의 개발과 함께 이를 저장하고 분석할 수 있는 인프라 수요도 늘어나고 있다.

센터에 따르면 2019년 현재 전세계 최대 NGS 데이터 저장소인 SRA의 누적 데이터 양은 30EB(엑사바이트)이며, 2025년에는 1년에 생산되는 데이터가 약 20EB에 이를 것으로 예상된다.

센터 관계자는 "현재 이용자들의 평균 대기시간은 17시간 정도이며 스토리지는 증설을 해도 늘 97%수준에 이른다"고 전하고 "누리온 같은 슈퍼컴의 성능에 비길 바는 아니지만 바이오 연구에 특화된 소프트웨어를 갖추고 누구나 사용할 수 있도록 개방하고 있어 자원은 늘 부족한 편"이라고 말했다.

국가생명연구자원정보센터는 앞으로 ▲국민, 연구자, 산업계를 대상으로 대용량 바이오 데이터 분석 시스템 개방 운영 ▲국가생명연구자원의 통합정보시스템(KOBIS; Korean Bio-resource Information System) 및 범부처 생명연구자원 정보 연계를 통한 생명연구자원 및 유전체 정보의 활용체계 구축 ▲국내외 관련 기관과의 유기적 협력 네트워크 구축을 통한 전산 연구지원 인프라 활성화 체계 구축 등의 사업을 수행할 계획이다.

최상국기자 skchoi@inews24.com

관련기사


포토뉴스