AI 개발 ‘공개 데이터’ 이용 가이드라인 첫 발표…“목적 정당성 있어야”
법적 회색지대로 지적돼 온 인공지능(AI) 개발에 따른 ‘공개 데이터 활용’에 대해 정부가 첫 가이드라인을 내놨다. AI 학습·서비스 개발에 활용되는 공개 데이터에는 주소, 고유식별번호, 신용카드번호 등 여러 개인정보 등이 포함될 수 있는데 현행 개인정보보호법에는 명확한 처리 기준이 없었다. 17일 개인정보보호위원회가 공개한 ‘인공지능(AI) 개발·서비스를 위한 공개된 개인정보 처리 안내서’에 따르면 개인정보위는 ‘정당한 이익’이 있을 경우 동의 없는 정보 수집과 이용을 허용하는 현행 개인정보보호법에 따라 공개 데이터를 AI 개발에 이용할 수 있다고 판단했다.
다만 이를 이용하기 위해서는 목적의 정당성, 처리의 필요성, 구체적 이익형량 등 세 가지 요건을 충족해야 한다고 명시했다. 공개된 개인정보 처리를 통해 개발하려는 AI 목적과 용도를 구체화해 정당한 이익을 명확히 해야 하고, 공개 데이터 수집·이용의 필요성과 합리성 등이 인정돼야 한다는 것이다.
공개 데이터는 누구나 인터넷으로 접근할 수 있는 위키백과, 웹사이트, 블로그, 소셜미디어(SNS)상의 정보를 말한다. 그간 AI 서비스 기업들은 웹 스크래핑 방식으로 이를 수집해 AI 학습과 서비스 개발에 활용