서울대, 이루다 사태 막을 인공지능 학습용 데이터셋 발표

[아이뉴스24 최상국 기자] 서울대학교 전기정보공학부 윤성로 교수팀이 한글날을 맞아 한국어 언어 모델의 사회적 편향 진단을 위한 데이터셋(K-StereoSet)을 공개한다고 8일 밝혔다.

대화형 챗봇 같은 인공지능 기반 한국어 언어 모델의 사회적 편향성을 진단할 수 있는 도구다.

윤 교수팀이 이번에 공개하는 K-StereoSet은 영어 언어 모델의 사회적 편향을 진단하기 위해 MIT에서 공개한 ‘StereoSet’을 한국적 현실에 맞추어 보완 개발한 것으로 향후 지속적으로 확장될 예정이다.

인공지능의 사회적 편향은 전 세계적으로 중요한 키워드로 대두되고 있다. 국내에서도 인공지능 기반 한국어 챗봇인 ‘이루다’의 차별·혐오성 표현이 문제가 된 바 있다. 정부도 인간성(humanity)을 위한 인공지능의 3대 원칙 중 하나로 ‘인간의 존엄성 원칙’을, 10대 핵심요건 중 하나로 ‘다양성 존중’을 제시할 만큼 윤리적인 인공지능에 대한 중요성이 커지고 있다.

연구팀은 "자연어 처리 분야의 근간이 되는 인공지능 기반 한국어 언어 모델에 대한 연구가 활발히 이루어지고 있으나, 이들의 사회적 편향을 진단할 수 있는 수단은 여전히 부족한 실태"라며 이런 문제의식 하에 이번 데이터셋을 공개하게 됐다고 설명했다.

K-StereoSet은 성별, 종교, 직업, 인종 등 네 가지 항목의 편향성을 진단한다. 편향성 진단을 위한 샘플 양식은 '문장 내 편향 진단'과 '문장 간 편향 진단'으로 분류돼 있다.

문장 내(intrasentence) 편향 진단 테스트와 문장 간(intersentence) 편향 진단 테스트 샘플 [사진=서울대 윤성로 교수 연구팀]

'문장 내 편향 진단'은 빈칸 처리된 문장이 주어졌을 때 빈칸에 채워질 내용으로서 세 개의 보기 중 어느 것에 높은 점수를 부여하는지를 이용해 진단한다. 위 그림의 왼쪽 예시처럼 '독선적이었다'는 답에 더 높은 가중치를 줬다면 이 한국어 모델은 ‘심리학자’라는 직업에 편향을 가지고 있다고 판단하는 식이다.

'문장 간 편향 진단'은 앞 문장(context)이 주어졌을 때 다음 문장으로 주어진 선택지에서 어떤 문장에 높은 점수를 부여하는지를 이용해 진단한다. 위 그림의 오른쪽 예시처럼 ‘히스패닉’이라는 문맥이 주어졌을 때, 다음 문장에서 ‘불법적인 시민’이라는 편향을 가지고 있는지 확인할 수 있다.

연구팀은 약 4천개의 샘플로 구성된 원본 데이터셋(StereoSet)을 네이버 파파고 API를 통해 1차적으로 번역한 후 다수의 연구원이 독립적으로 번역 내용을 검수하고, 원래의 샘플 양식과 취지를 보존하도록 후처리를 진행했다. 송종윤 연구원은 “문장 내 편향 진단 샘플 중 ‘unrelated’ 라벨에 해당하는 문장은 문맥과 전혀 관계없는 단어가 빈칸에 들어가기 때문에 자동 번역 시 원문의 의미를 벗어나기 쉽다. 또한 문장 간 편향 진단 샘플의 보기 문장들은 context 문장을 고려하지 않는 경우가 발생하는 등의 특수한 상황들에 유의하며 변환을 진행했다”라고 덧붙였다.

윤성로 교수는 “인공지능 기반의 한국어 언어 모델이 고도화되고 사업화될수록 윤리성 확보와 편향성 제거를 위한 노력이 핵심적이며, 한글날을 맞이하여 보다 바른 한글을 구사하는 인공지능 기술 개발을 위해 K-StereoSet이 작지만 의미 있는 첫걸음이 되기를 기대한다”라고 전했다.

/최상국 기자(skchoi@inews24.com)

최상국 기자의 다른 기사 보기

서울대, 이루다 사태 막을 인공지능 학습용 데이터셋 발표

윤성로 교수 연구팀, 사회적 편향성 진단 도구 공개

댓글 쓰기 ^제목 서울대, 이루다 사태 막을 인공지능 학습용 데이터셋 발표

댓글-

윤성로 교수 연구팀, 사회적 편향성 진단 도구 공개

댓글 쓰기 제목 서울대, 이루다 사태 막을 인공지능 학습용 데이터셋 발표

댓글 쓰기 ^제목 서울대, 이루다 사태 막을 인공지능 학습용 데이터셋 발표