[지식자산⑤] 인도 AI 학습 데이터 로열티, 권리 배분 경쟁
DPIIT 워킹페이퍼, TDM 예외·의무적 라이선스·CRCAT 구상 제시…K콘텐츠 보상 체계도 영향권
[KtN 전성진기자]인도에서 생성형 인공지능(GenAI)의 학습 데이터와 저작권 보상 논의가 디지털 지식자산 정책의 중심으로 이동하고 있다. 생성형 AI 모델이 음악, 영상, 이미지, 텍스트를 대규모로 학습하는 과정에서 저작권 있는 자료가 무단 활용될 수 있다는 우려가 커졌고, 인도 산업 및 내수 무역 진흥부(DPIIT)는 2025년 ‘생성형 AI와 저작권’ 워킹페이퍼를 통해 학습 데이터 접근과 권리자 보상 체계를 함께 다루기 시작했다. K팝 음원, 뮤직비디오, 드라마, 웹시리즈, 포스터, 캐릭터 이미지가 인도 디지털 플랫폼에서 유통되는 상황에서 AI 학습과 생성물의 권리 귀속은 한국 콘텐츠 기업에도 직접적인 계약 변수로 떠오르고 있다.
DPIIT 워킹페이퍼는 생성형 AI 모델의 급속한 확산이 학습 과정에서 저작권 있는 자료가 무단 활용되는 문제와 관련해 새로운 법적 논의를 촉발했다고 정리한다. 기존 지식재산권 체계를 AI 학습 데이터와 생성형 콘텐츠 환경에 어떻게 적용할지가 주요 쟁점으로 부상했고, 검토된 규제 모델은 텍스트·데이터 마이닝(TDM) 예외 규정, 자발적 라이선싱 제도, 의무적 포괄 라이선스 방식으로 나뉜다. 워킹페이퍼는 AI 개발자의 합법적 훈련 데이터 접근을 보장하면서 법정 보상권을 결합하는 방향을 권고안으로 제시했다.
인도 논의에서 가장 눈에 띄는 대목은 중앙 집중식 징수 기관 구상이다. 워킹페이퍼는 ‘AI 훈련을 위한 저작권 로열티 공동체(CRCAT)’ 설립을 통해 수익 기반 로열티를 원저작권자에게 분배하는 방안을 제시했다. 권리자와 AI 기업이 개별적으로 학습 데이터 이용 계약을 맺는 방식은 거래 비용이 높고, 대규모 데이터셋 안에 포함된 저작물을 일일이 식별하기 어렵다. CRCAT 구상은 방대한 학습 데이터 사용을 집단적으로 관리하고, AI 서비스에서 발생하는 수익을 권리자 보상으로 연결하려는 시도다.
AI 학습 데이터의 저작권 보호는 아직 명확한 결론에 도달하지 않았다. 현행 저작권법이 AI 학습 행위를 복제로 볼 것인지가 불명확하고, 해결 방안으로 TDM 예외 조항 신설 또는 의무적 라이선스 도입이 논의되고 있다. TDM 예외는 AI 개발자의 데이터 접근을 넓힐 수 있지만, 권리자 보상을 약화시킬 수 있다. 의무적 라이선스는 권리자 보상을 제도 안에 넣을 수 있지만, 요율 산정과 분배 기준을 둘러싼 갈등이 커질 수 있다. 인도는 두 방향 사이에서 AI 산업 육성과 창작자 보상을 동시에 담는 중간 지대를 찾고 있다.
K콘텐츠 기업에는 학습 데이터 허용 범위를 계약서에 쓰는 일이 중요해진다. 음원 공급 계약, OTT 배급 계약, 현지 프로모션 계약, 팬 플랫폼 운영 계약에 AI 학습 목적 이용을 허용할지, 허용한다면 어떤 데이터와 기간, 지역, 수익 배분 기준을 적용할지 명확히 둬야 한다. 뮤직비디오와 드라마 본편뿐 아니라 스틸 이미지, 자막 파일, 대본, 포스터, 메이킹 영상, 안무 영상, 음성 파일도 학습 데이터로 쓰일 수 있다. 콘텐츠 유통권을 넘긴 계약이 AI 학습 데이터 제공권까지 포함하는지 불분명하면, 사후 분쟁이 생길 여지가 커진다.
AI 생성 콘텐츠의 저작권 귀속도 별도 쟁점으로 남아 있다. 워킹페이퍼가 정리한 쟁점표는 인간 저작자가 없는 AI 생성물의 보호 여부가 불명확하다고 본다. 논의 중인 방향은 특별 보호 제도를 신설하거나 공유 영역으로 처리하는 방식이다. K콘텐츠 산업에서는 AI가 만든 노래, 가상 아티스트 이미지, 드라마식 예고편, 배우 목소리를 흉내 낸 더빙, 캐릭터를 변형한 이미지가 상업적으로 쓰일 수 있다. 사람의 창작적 기여가 어느 정도 들어갔는지, 기존 저작물과 실질적으로 유사한지, 결과물의 권리를 플랫폼·AI 개발사·콘텐츠 기업 중 누가 갖는지가 계약과 분쟁의 중심에 놓인다.
딥페이크와 합성 미디어는 저작권만으로 정리하기 어렵다. 기존 저작권·초상권 법제가 합성 미디어에 충분히 대응하기 어렵다는 한계가 제기됐고, 인도는 IT 규칙 2026년 개정을 통해 표시 의무와 메타데이터 추적 등 일부 대응 수단을 마련했다. 아티스트 얼굴을 합성한 광고, 배우 음성을 흉내 낸 홍보 영상, 드라마 장면을 조작한 가짜 예고편, 공식 로고를 붙인 비공식 AI 이미지가 유통되면 저작권, 상표권, 인격적 권리, 허위 정보 규제가 동시에 맞물린다. 권리자는 침해 신고 단계에서 단순 삭제 요청을 넘어 어떤 권리의 침해인지, AI 합성 여부를 어떻게 입증할지, 원본 메타데이터를 어떻게 보존할지까지 준비해야 한다.
로열티 징수와 분배는 AI 저작권 논의의 실무 난제다. 권리자와 AI 기업 간 개별 협상은 저작물 수가 많을수록 비용이 커지고, 중소 창작자나 해외 권리자는 협상 테이블에 접근하기 어렵다. CRCAT 같은 중앙 집중식 분배 구조가 도입되면 대형 저작권자와 소규모 창작자가 같은 제도 안에서 보상을 청구할 가능성이 열린다. 다만 분배 기준이 조회수, 학습량, 데이터셋 포함 여부, AI 서비스 매출, 지역별 이용량 중 무엇을 중심으로 설계될지는 아직 정리되지 않았다. 한국 콘텐츠 기업도 인도에서 권리자 등록, 데이터 식별 정보, 원본 파일 메타데이터, 사용 로그 보존 체계를 갖춰야 향후 보상 청구에서 밀리지 않는다.
인도 AI 전략은 이미 지식재산권 논의와 맞물려 있다. 니티 아요그(Niti Aayog)의 ‘국가 AI 전략(#AIforAll, 2018)’ 이후 AI 분야 지식재산권 보호 논의가 본격화됐고, 후속 정책 입안이 진행 중이다. 기존 특허법과 지식재산권 제도는 데이터 기반 AI 알고리즘의 특성을 충분히 반영하기 어렵다는 평가가 나온다. 혁신 주체와 데이터 보유자 사이의 권리 보호 범위를 조정하는 문제도 함께 제기됐다. AI 개발자와 실무자를 지원하기 위한 전문 IP 지원센터, 관련 규제 체계를 지속적으로 검토·개선할 범부처 합동 태스크포스 구성 필요성도 논의되고 있다.
디지털 개인정보보호법(DPDP Act, 2023)과 지식재산권 법제의 교차 영역도 인도 규제의 중요한 축으로 떠오르고 있다. AI 학습 데이터에는 저작물뿐 아니라 얼굴, 목소리, 이름, 위치, 이용자 반응, 시청 이력 같은 개인정보성 데이터가 섞일 수 있다. K콘텐츠 플랫폼이 인도 이용자 데이터를 활용해 추천 알고리즘, 자막 품질 개선, 더빙 모델, 팬덤 분석 도구를 운영할 경우 개인정보 보호와 저작권 관리가 동시에 걸린다. 데이터 활용 동의를 받았다고 해서 저작권 이용 허락까지 확보되는 것은 아니며, 저작권 이용 허락이 있다고 해서 개인정보 처리 기준을 자동으로 충족하는 것도 아니다.
K팝과 드라마의 인도 유통 계약에는 AI 관련 조항을 별도로 두는 방식이 필요하다. 음원과 영상의 단순 스트리밍 권리, 홍보용 클립 제작 권리, 자막·더빙 제작 권리, AI 학습 데이터 제공 권리, 합성 음성·이미지 제작 권리, 생성물의 상업적 이용 권리는 서로 다르게 관리해야 한다. 현지 파트너가 AI 번역, AI 더빙, 자동 클립 생성, 팬덤 분석 서비스를 쓰는 경우에도 원권리자의 사전 승인 범위와 결과물의 소유권, 삭제 요청 권한, 로열티 정산 방식을 계약서에 넣어야 한다. “디지털 이용”이라는 포괄적 표현만으로는 생성형 AI 시대의 권리 범위를 충분히 가르기 어렵다.
AI 학습 데이터 논의는 권리 방어만이 아니라 새로운 수익 배분 통로를 만들 수 있다. 한국 콘텐츠 기업이 인도에서 공식 음원, 영상, 자막, 이미지 데이터를 정식 라이선스로 제공하고, AI 서비스의 매출과 연결된 로열티를 받을 수 있다면 기존 플랫폼 유통과 다른 수익 구조가 생긴다. 반대로 데이터 사용을 관리하지 못하면 콘텐츠가 AI 모델 학습에 흡수된 뒤에도 권리자가 이용 사실을 확인하거나 보상을 청구하기 어렵다. 인도 시장에서 AI 로열티 논의가 제도화될수록 콘텐츠 기업의 데이터 관리 능력이 라이선스 협상력으로 바뀔 수 있다.
인도는 생성형 AI 워킹페이퍼의 정책 전환, CRCAT 설립 여부, 의무적 포괄 라이선스 도입 가능성, AI 합성 콘텐츠 표시 의무와 메타데이터 추적 기준, AI 국가 전략 관련 특허법·저작권법 개정 논의를 후속 모니터링 대상으로 제시하고 있다. K콘텐츠 기업에는 같은 항목이 현지 사업의 점검표가 된다. 음원과 영상이 어느 플랫폼에 유통되는지, 데이터가 AI 학습에 쓰일 수 있는지, 생성물이 원작과 어떤 관계를 갖는지, 로열티를 어느 기준으로 청구할 수 있는지에 따라 인도 시장의 수익 구조가 달라진다.
생성형 AI 시대의 인도 지식자산 시장은 콘텐츠 공개와 권리 등록만으로 닫히지 않는다. 원본 데이터의 식별, 학습 허용 범위, 합성 콘텐츠 표시, 생성물 권리 귀속, 로열티 분배 기준까지 이어지는 긴 사슬이 만들어지고 있다. K콘텐츠가 인도에서 더 넓게 소비될수록 음악, 영상, 이미지, 텍스트 데이터의 가치는 플랫폼 유통을 넘어 AI 학습과 생성물 시장으로 확장된다. DPIIT 워킹페이퍼가 실제 제도로 이어지는 속도와 CRCAT 구상의 구체화 여부가 향후 인도 내 콘텐츠 권리 배분의 방향을 가를 변수로 남아 있다.