실시간 뉴스



"AI 학습 데이터는 재사용 필요한데…"


이진규 네이버 이사 "이용 목적 달성 기간 특정 곤란"

[아이뉴스24 김국배 기자] 인공지능(AI)의 학습 데이터로 사용하는 개인정보는 이용 목적 달성 기간을 특정하기 어려우나 이를 특정하지 않고는 개인정보를 수집할 수 없어 상충한다는 지적이 제기됐다.

현장에서 AI 학습을 위한 데이터 확보에 애를 먹는 이유 중 하나로 꼽혔다.

이진규 네이버 이사는 지난 14일 오후 서울 중구 프레지던트 호텔에서 열린 '4차 산업혁명과 데이터 경제 콘퍼런스'에서 "AI 학습 데이터는 일회적으로 활용하기보다 AI 모델의 구성이 변경될 경우 반복적으로 재사용해야 하는 상황이 다수 존재한다"고 지적했다.

그러면서 "이에 따라 학습 데이터인 개인정보는 이용 목적이 달성되는 기간을 특정하기 곤란하나, 이를 특정하지 않고는 개인정보를 수집할 수 없다"고 부연했다.

그에 따르면 정보통신 서비스 제공자 등은 개인정보의 수집·이용 목적을 달성했다면 지체없이 해당 개인정보를 파기해야 한다. 동의를 받은 보유·이용 기간이 끝나도 마찬가지다. 다만 다른 법률에 따라 개인정보를 보존해야 하는 경우에만 예외다.

이 이사는 "한번 학습된 데이터는 이용 목적이 달성된 것으로 볼 것인지 아니면 다음 모델을 다시 학습하기 전까지 계속 보유해도 법률적 문제가 없는 것인지 불확실하다"고 설명했다.

또한 "개인정보 수집 목적을 불필요하게 길게 설정하면 행정기관의 제재를 받을 수 있기 때문에 적정 기간을 설정하는데 애를 먹게 된다"며 "결국 회원탈퇴 등 목적이 달성됐다고 여겨지면 데이터를 모두 파기하고 있는 실정"이라고 토로했다.

'개인정보 유효기간제' 역시 AI 학습에 필요한 데이터를 부족하게 만드는 원인으로 지목했다.

그는 "정보통신 사업자 등은 이용자가 1년 동안 서비스를 이용하지 않으면 개인정보를 파기하거나 별도 보관해야 하는데, 이 데이터는 접근할 수 없다"며 "안그래도 부족한 데이터의 활용을 법으로 막아놓은 것"이라고 말했다.

개인정보를 적법하게 처리할 수 있는 근거가 자체도 적다.

그는 "우리나라 정보통신망법은 결국 이용자 동의 없이는 개인정보를 수집해 이용할 수 없는 구조"라며 "이에 비해 유럽연합 개인정보보호법은 동의 외에도 개인정보를 처리할 수 있는 법률적 근거를 5가지나 더 제시한다"고 강조했다.

실제로 GDPR은 정보주체의 동의를 포함해 ▲정당한 이익 ▲계약 이행 ▲중대한 이익 ▲공익을 위한 처리 ▲법률 의무 준수 등 총 6개 처리 근거를 두고 있다.

아울러 그는 "미국은 '제3자 원칙(Third party doctrine)'을 확고히 정립하고 있어 공개된 정보를 활용하는 것은 보편적으로 인정된다"며 "예를 들어 페이스북 등에 공개적으로 쓴 글에 대해서는 프라이버시를 기대하기 어렵다. 그러다보니 가져가 활용할 수 있다"고 덧붙였다.

이 이사는 "문화, 법, 제도, 사회 분위기 등 다양한 부문마다 데이터 활용을 제한하는 요소가 포진돼 있다"며 "개별적 사안을 정밀하게 풀어나가는 작업을 해야 한다"고 했다.

김국배기자 vermeer@inews24.com







alert

댓글 쓰기 제목 "AI 학습 데이터는 재사용 필요한데…"

댓글-

첫 번째 댓글을 작성해 보세요.

로딩중
포토뉴스