-AI 학습에 무단으로 이용되는 창작물
-현행 저작권법에 의하면 대부분 위반
-기술 활용과 발전 위한 사회적 논의 필요
-전문가들 "규제 풀되 수익 공정 배분해야"
최근 유튜브 등 영상매체에서는 세계적 가수 브루노 마스가 부르는 뉴진스의 ‘Hype Boy’나, 프레디 머큐리가 부르는 윤종신의 ‘오르막길’ 등이 화제다. 모두 사람의 목소리 정보를 학습한 AI의 ‘가짜 영상’인데 실제 가수가 부른 것 같은 목소리에 사람들은 신기함을 금치 못한다.
이 같은 AI 학습 기술의 비약적인 발전은 동시에 기존 저작권 자료들의 대량 수집을 의미한다. 기존 저작권 자료를 대량으로 수집하여 학습한 AI만이 창작물을 내놓을 수 있기 때문이다. 이를 두고 AI가 학습을 위해 수집하는 저작권을 보호해야 한다는 의견과 AI 기술의 발전이 우선이라는 의견이 갈린다.
■AI의 저작권 자료 이용, 위법인가?
AI 업계는 AI 학습 과정에서의 저작물 이용이 대체로 연구 및 기술 발전과 연계된 ‘공정 이용’이라고 주장한다. 우리나라를 비롯한 대부분의 국가에선 저작권법상 저작물의 사용이 공정 이용에 해당할 경우 저작권법에 위배되지 않는 것으로 규정하고 있다. 다만 무분별한 AI의 정보 활용에도 공정 이용의 구체적인 범주에 대한 해석이 명확하지 않아 세계적으로 AI의 저작물 활용에 대한 논쟁이 오가는 것이다.
전문가들은 AI로 만들어진 창작물이 그 자료로 이용된 저작물의 경제적 가치를 떨어트릴 가능성이 높다면 공정 이용으로 볼 수 없다고 말한다. 우리 대학 강명수(법학전문대학원) 교수는 “AI의 상업적 이용 가능성이 남아있고, AI로 만든 창작물들이 기존 저작물의 시장 가치를 침해할 여지가 있다면 저작권 침해로 보아야 한다”고 말했다. 우리나라는 타인의 음성을 이용해 노래나 영상을 만드는 경우 부정경쟁방지법에도 저촉된다. 지난 3월 해당 법의 개정으로 ‘국내에 널리 인식되고 경제적 가치를 가지는 타인의 음성을 이용해 타인의 경제적 이익을 침해하는 경우’를 부정경쟁 행위로 본다는 조항이 추가되며 영상에 이용된 음성의 주인이 손해배상을 청구할 수 있게 됐다.
그러나 나날이 커지는 AI 시장을 규제하는 것은 현재 세계적인 난제다. 챗GPT 등 대형 언어 모델의 구축에 활용되는 방대한 양의 데이터셋은 개발사 측에서 공개하지 않는 이상 파악하기도 어렵다. 이에 미국과 유럽 연합(EU) 등에선 AI 활동 감시를 위한 법률을 준비하고 있다. 특히 EU는 지난 5월 AI 학습에 이용되는 데이터셋의 저작권 표시를 의무화하는 ‘AI 법’ 조항을 신설해 초안을 의회에서 통과시켰다. 우리나라도 AI 발전에 대응하는 법안 마련을 위해 노력을 이어가고 있으나 마땅한 결과는 없는 실정이다. 제21대 국회에선 인공지능과 관련한 13개 법안이 발의됐지만 여전히 소관 심의위에 머물러 있다.
■언론계도 반발
AI의 정보 대량 학습 문제는 전 세계 언론계에서도 화두다. 웹에 저장되는 뉴스 자료를 비롯한 언론의 각종 데이터들이 AI의 학습에 주로 이용되고 있기 때문이다. 지난 9월 6일 세계신문협회(WAN)는 AI 개발자에게 지적재산권과 기존 콘텐츠에 대한 존중을 촉구하고 AI 시스템의 투명화를 촉구하는 ‘글로벌 AI 원칙’을 발표했다. 한국신문협회도 지난 8월 24일 네이버가 출시한 생성형 AI인 ‘하이퍼클로바X’에 대해 반발했다. 이전 모델인 ‘하이퍼클로바’ 학습에서 뉴스 데이터가 활용됐기 때문이다.
지난 8월 22일 한국신문협회는 하이퍼클로바X의 출시를 앞두고 ‘생성형 AI의 뉴스 저작권 침해 방지를 위한 5대 요구사항’을 생성형 AI를 개발 중인 국내외의 대형 IT 기업에 전달했다. 여기에는 △AI 활용 이전 뉴스 저작권자와 이용 기준 협의 △세계신문협회의 글로벌 AI 원칙 준용 △AI 학습 데이터의 출처와 내용, 경로 등 공개 △AI 학습에 뉴스 콘텐츠 이용 시, 이용 방식 등을 구체적으로 명시 △뉴스 저작물에 대한 적정한 대가 지급 및 보상 체계 마련 등의 내용이 담겼다.
언론사는 하나둘 저작권 보호를 위한 ‘크롤링 방지’ 약관을 도입 중이다. AI가 학습을 위해 웹에 올라온 데이터를 긁어오는 행위인 크롤링(Crawling)을 막는 것이다. 지난 9월 6일 한국신문협회보를 보면 지난 8월부터 한국일보를 시작으로 조선일보, 중앙일보 등 국내 주요 일간지들은 오픈AI사에서 개발한 크롤링 도구인 ‘GPT봇’의 접근을 차단하고 ‘AI 및 대량 크롤링 방지약관’을 만들며 콘텐츠 보호에 나섰다. 영국의 △가디언 미국의 △뉴욕타임스 △시카고 트리뷴 등 다수의 해외 언론 매체들도 이 같은 약관을 통해 신문 자료들이 AI 학습에 이용되는 것에 대응하고 있다.
■“기술 발전과 권리 보호 조화 필요”
전문가들은 AI가 급속도로 성장하는 현재, AI의 발전과 저작권 보호에 대한 적절한 조화가 필요하다고 말한다. AI 시장이 가지는 높은 가치를 고려했을 때 너무 많은 규제는 오히려 사회 발전에 독이 될 수도 있단 것이다. 실제로 지난 6월 미국 금융정보 네트워크 기업인 블룸버그 소속 연구소 ‘블룸버그 인텔리전스(Bloomberg Intelligence)’의 발표에 따르면 생성형 AI 시장의 크기는 2022년 398억 달러에서 2032년 1조 3천억 달러로 약 30배 가까이 성장할 것으로 예측된다. 세계 각국이 AI 학습 데이터 저작권 보호와 AI 산업의 육성 양 측면을 함께 고려하는 이유다.
두 요소의 균형을 위해서는 AI로 발생한 수익을 적절히 배분하는 것이 중요하게 꼽힌다. 생성형 인공지능으로 생긴 수익을 AI 개발 기술자나 AI를 활용해 새로운 창작물을 만드는 자뿐만 아니라 AI 학습에 이용되는 데이터의 저작권자까지 고려해 공정하게 배분해야 한다는 것이다. 강 교수는 “AI 개발사에서 데이터를 우선 이용하고 그로 인해 발생하는 수익을 저작권자에게도 배분해 주는 방식으로 법이 바뀌어야 하지 않겠냐”며 “기술 발전을 위해 저작물 이용을 더 허용하되 권리자의 지위를 함께 보호해 줄 방안이 무엇인지 고민해야 한다”고 전했다.
모두가 이용할 수 있는 오픈 소스 데이터 개발도 계속돼야 한다는 것이 세계적 기조다. 인류가 쌓아온 수많은 정보를 특정 기업이 이용해 부를 독점하는 것이 아니라, 정보를 공유하며 기술 개발을 고민해야 한다는 것이다. 한국 저작권위원회는 지난 4월부터 △카카오 △삼성전자 △LG전자와 함께 검증된 오픈 소스 소프트웨어 데이터베이스 마련을 위한 ‘오소리 프로젝트’를 진행 중이다. 우리 대학 인공지능 연구실 권혁철(정보컴퓨터공학) 교수는 “인류가 남긴 수많은 자료에서 학습한 시스템으로 특정 업체나 개인이 부를 독점해선 안 된다”며 “기업은 AI 학습에 이용한 데이터셋을 투명하게 공개하고 그중 소유권이 없는 것은 모두와 공유해 방대한 자료들이 인류 공동의 자산임을 서로 인정해야 한다”고 말했다.
