
생성형 AI(인공지능) 시대, 챗GPT가 하루의 종합뉴스를 무작위로 정리해 주면 독자는 출처를 무시한 채 복제된 콘텐츠를 제공받게 된다. 뉴스 콘텐츠라는 창작물을 제공하는 창작자는 저작권과 권리자의 권익 보호를 주장하게 되고, 나아가 급작스럽게 다가온 인공지능의 침투에 언론 생태계의 존폐마저 고민하기에 이른다.
산업계에서 AI 기술이 인간의 일자리를 조금씩 빼앗아 가는 가운데, 창작 영역으로 바라봤던 뉴스 콘텐츠 부문에도 AI는 위협적인 존재가 됐다.
이에 한국방송협회와 조국혁신당 이해민 의원이 공동주최한 ‘생성형 AI 뉴스 콘텐츠 저작권 보호와 활용 방안’ 주제 간담회가 28일 국회의원회관에서 열렸다. 이 자리에서 조국혁신당 이해민 의원은 “저작권 문제가 해결된 정제된 학습데이터는 AI 발전을 앞당길 수 있는 핵심 자원”이라며 “규제 없는 진흥이 불가능하듯, 저작권 보호와 AI 활용이 함께 가능한 균형 있는 제도 설계를 서두르지 않으면 생성형 AI의 지속가능성도 담보할 수 없다”고 말하며 취지를 설명했다.
●생성형 AI 학습용 데이터 사용과 저작권...국내외 차이점
발제를 맡은 최승재 세종대 법학과 교수는 ‘생성형 AI 학습과 저작권 문제’의 쟁점과 국내외 주요 사례를 소개했다. 특히 ▲지브리풍 AI 사진 불법 여부 ▲특정 작가 스타일 결과물의 저작권 침해 ▲뉴욕타임스와 오픈AI의 학습용 데이터 소송 ▲TDM(Text, Data Mining·데이터 분석을 통한 정보 추출) 면책권 논쟁 ▲저작물 학습용 데이터 사용 및 보상문제 등을 핵심 이슈를 다뤘다.
지난 3월 말 챗GPT 개발사 오픈AI의 샘 올트먼 최고경영자(CEO)는 자신의 X(엑스·옛 트위터) 프로필 사진을 ‘지브리 화풍’으로 올려 주목을 받으면서 전세계 이용자가 순식간에 5억명 이상 증가했다. 국내에서도 ‘지브리 밈’이 흥행하면서 보름 만에 신규 앱 설치가 143만6000여건 이상 늘어났고, 오픈AI 챗GPT의 국내 앱 월 이용자 수(MAU) 500만명을 돌파했다.
하지만 콘텐츠 화풍으로 인한 저작권 침해 문제와 혐오 표현을 담은 콘텐츠 생성에 대한 우려도 제기됐다. 특히 창작물에 대한 저작권 침해가 불거지면서 사진, 영상, 소리까지 콘텐츠 전반으로 문제가 확장됐다.
한국에는 ‘부정경쟁 방지법’이 있어 타인의 성과를 베끼면 처벌받거나 손해배상을 해야 한다. 또 오픈AI가 할리우드 배우 스칼릿 요한슨의 목소리를 학습한 의혹처럼, AI 이미지와 보이스를 통한 활용은 ‘퍼블리시티권’ 문제로 불거질 수가 있다.

최승재 교수는 “지브리풍 AI 사진은 한국에서는 불법이 될 수 있다”며 “특정 결과물의 스타일을 아이디어 영역으로 볼 수 있는 지는, 저작권 보호 측면에서 성과를 모용해서 무임 승차하는 ‘부정경쟁방지법’을 적용땐 문제 제기가 가능하다”고 말했다.
뉴욕타임즈의 오픈AI 소송의 경우, AI 학습용 데이터 80%가 뉴스 기사로 쓰여 ‘오픈AI의 상업적 성공에 있어 저작권 침해 됐다’라는 뉴욕타임스의 소송 제기는 국내 언론사에 큰 반향을 일으켰다. 뉴욕타임즈의 소송 이유는 1851년 설립된 전문성을 갖춘 보도의 독창적 뉴스를 제공하는데 있어 5,800명의 정규직 인력들이 많은 시간과 비용을 지불하면서 콘텐츠를 만들어 냈기 때문이라고 주장했다.
이어 ‘AI 무단학습은 자유인가’라는 면책권 논쟁에 대해 영국과 일본은 기술 발전을 앞당기기 위해 데이터·콘텐츠를 허용하고 저작권법 침해도 적용하지 않고 있지만, 국내에서는 면책권 법 추진에 언론사·예술가 단체의 반발을 소개했다.
AI 학습데이터와 관련해 저작권 문제의 주요 쟁점은 '공정이용 여부'와 '보상체계 마련'이다. 저작권법상 저작물을 저작권자의 허가 없이 제한적으로 이용할 수 있도록 허용하는 ‘공정이용’ 원칙을 두고 있다. 최근 미국에서 저작권 침해와 관련해 공정이용을 전면에 다룬 판결이 나왔다. 지난해 미국 대법원은 마릴린 먼로, 앨비스 프레슬리 등 여러 유명인 사진을 회화 작품으로 제작하는 팝 아트 작가 ‘앤디 워홀’의 저작물 중 일부가 공정이용 요건에 부합하지 않아 저작권 침해 대상이 된다고 판결했다.
저작물을 학습용 데이터로 사용하는 문제에 있어 보상 문제도 화두다. 사진 저작물이 학습용 데이터로 사용되는 경우, 복제권·전송권 등이 저작권 침해에 해당될 수 있다. 최 교수는 “면책은 돈을 지불하지 않고 사용하겠다는 것인데 합리적인 보상체계를 만들어 나갈 필요가 있다”며 “결국 새로운 데이터가 사라지면 퀄리티 저하로 인한 AI 결과물도 영향을 받게 된다”고 꼬집었다.
그러면서 그는 “향후 인공지능간의 경쟁의 핵심은 방송사의 경우 IP가 업계의 미래 자산이 될 텐데, 합리적인 로얄티를 지불하는 타협을 통해, 중장기적으로 AI 산업체와 언론이 공생하는 방법을 강구해야 한다”며 “경쟁을 누군가의 희생을 통해 하면 안 되고 정당한 보상을 하는 게 맞다. 정부는 AI기본법에 세제 혜택이나 보조금 지원을 통해 해결해야 한다”고 강조했다.
●AI 대표기업 네이버와 뉴스콘텐츠 제공사의 갈등...저작권 소송, 공정위 신고까지
이날 간담회 좌장은 홍원식 동덕여대 교수가 맡았다. 패널로는 ▲최근영 KBS 지식재산권부장 ▲최진훈 MBC 법무팀장 ▲안재형 SBS 법무팀장 ▲이주연 한양대 법학전문대학원 교수 ▲노창희 디지털산업정책연구소장 ▲신한수 한국신문협회 디지털협의회장 ▲김수정 과학기술정보통신부 데이터진흥과장 ▲김혜창 한국저작권위원회 정책연구본부장 ▲백지연 국회 입법조사처 입법조사관이 참여해 해결책 모색과 발전 방향을 제시했다.
패널 토론에서는 뉴스 콘텐츠에 대한 저작권 침해 문제를 둘러싼 AI 기업과 언론사의 갈등과 저작권 보상 체계 마련을 서둘러야 한다는 목소리가 핵심 이슈로 논의됐다.

한국신문협회는 지난달 24일 네이버를 독점규제 및 공정거래에 관한 법률(공정거래법) 위반 혐의로 공정거래위원회에 신고했다. 신문협회는 신고서에서 네이버가 자사 대규모 언어 모델(LLM)인 ‘하이퍼클로바’, ‘하이퍼클로바X’ 개발 및 운영 과정에서 언론사의 핵심 자산인 뉴스 콘텐츠를 무단 학습한 점과 관련 학습데이터 내역 공개를 거부한 점 등을 주요 불공정 행위로 지적했다.
신한수 한국신문협회 디지털협의회장은 “AI 학습용 데이터 사용량의 투명한 공개를 원칙으로 해야 한다”며 “국내는 아직도 저작권 보호가 미흡하기 때문에, 법적·사회적 합의를 통한 체계 구축과 콘텐츠에 대한 합당한 대가를 지불하는 구조를 만들어야 한다”고 강조했다. 그러면서 오픈AI의 경우는 2024년 월스트리트저널(WSJ) 등을 소유한 뉴스코퍼레이션과 콘텐츠 공급 계약을 체결한 예를 들었다.
이에 앞서 KBS, MBC, SBS 등 지상파 방송 3사는 지난 1월 네이버가 생성형 AI 학습에 뉴스데이터를 마음대로 활용했다며 저작권 소송을 제기하기도 했다. 최근영 KBS 지식재산권부장 “AI 학습용 데이터가 무작위로 사용된다면 방송대상을 받은 ‘GPS와 리어카’가 다시 나올 수 있겠느냐, 독창적이고 깊이 있는 결과물을 만드는 데 큰 지장을 줄 것이다”고 말했고, 최진훈 MBC 법무팀장은 “AI에 열광하다가 우리가 사라질 수 있다. 발명가·제작자의 권리를 보호해야 지속적인 발전이 가능하다”고 덧붙였다.
나아가 안재형 SBS 법무팀장은 “역설적으로 AI가 만든 영상, 사진, 음악 등이 우선적으로 보호받는 시대가 올지도 모른다”며 “국내 AI 기업의 발전을 위해서라도 뉴스콘텐츠에 대한 보상 방안을 마련해야 한다”고 강조했다.
이에 대해 네이버 관계자는 “AI 학습용 뉴스데이터가 사회적 이슈화가 된 이후 뉴스데이터에 대해서는 국내 언론사와의 합의 없이는 정보를 제공하고 있지 않다”고 잘라 말했다.
학계 전문가과 정부 관계자는 이 문제에 대해 서로가 ‘윈-윈’하는 슬기로운 대처와 방안을 주문했다.
이주연 한양대 법학전문대학원 교수 “뉴스미디어에 대한 AI 저작권은 미국의 조항과 비슷하지만 미국 저작권협회의 내용을 공정위원회는 받아들이기 힘들 것이다”며 “국제적 추세를 무시하기 힘들지만, 보상 문제는 시장에 맡길 부분은 시장에 맡기고 미국처럼 라이선스 형태로 콘텐츠 생태계 보호를 만들어 가는 게 중요하다”고 주장했다.
김수정 과학기술정보통신부 데이터진흥과장은 한국이 잘하는 콘텐츠 분야의 데이터 확장을 통한 지원책을 언급했다. 김 데이터진흥과장은 “음원 저작권이 자리 잡는데 10년이 넘게 걸렸다”며 “국내 AI 기업 측도 데이터 자체 모니터링을 통해 투명성 강화에 대한 노력과 TDM의 면책을 족쇄화 할 필요는 없다”고 말했다.
김혜창 한국저작권위원회 정책연구본부장은 “뉴스 저작물의 중요성이 커지면서 AI 저작권 사업에 큰 비중을 둘 수밖에 없다”며 “사업자와 창작자가 보는 시각차, 학습 데이터 산출, 라이선스 문제 등 당사자 간의 논의를 통해 콘텐츠 선별 작업에도 많은 시간을 투자해야 할 것이다”고 설명했다.
노창희 디지털산업정책연구소장 레거시 미디어에 대한 정부 지원 필요성을 제안했다. 노 소장은 “아직까지 AI는 창작자의 보조 수단이다. 정부는 콘텐츠 보호를 위해 정부 차원에서 정보 구매 등의 창작자 보호를 위한 예산을 늘리는 방안도 필요하다”고 밝혔다.

국회에서는 AI 학습데이터 공개를 통한 저작권 이용 허락 계약 체결의 기반 마련, 데이터 구매 및 가공 후 공개 등이 문제 해결 방안으로 거론되고 있다. 비상업적 또는 공익적 목적의 정보분석을 위해 저작물을 복제·전송할 수 있도록 허용해야 한다는 것이다.
국회입법조사처는 ‘생성형 AI의 학습데이터 공개 관련 논의와 입법 과제’ 연구 보고서에서 “학습데이터의 공개를 통해 이용된 저작물이 확인되면 이는 저작권 이용 허락 계약 체결의 기반이 될 수 있다”며 학습데이터 공개 의무 규정의 단계별 입법 필요성을 제시하기도 했다.
백지연 국회 입법조사처 입법조사관은 “AI가 학습을 했느냐를 두고 업체 측에서는 ‘영업비밀이다’라고 말할 수 있다. 하지만 저작권자의 요청이 있을 때는 전체공개하는 등의 협상이 진행돼야 할 것이다”며, “음악 저작권의 경우 신탁을 통해 체계를 확립하는 데 10년이 걸렸다. AI 저작권과 관련해 작년에 정부가 저작권 관련 예산을 25억으로 측정했는데, 앞으로 공공 데이터 확대 측면에서 예산을 늘려나가야 한다”고 강조했다.