전체기사 최신뉴스 GAM
KYD 디데이
경제 과학기술

속보

더보기

[기고] AI 시대의 새로운 도전 : 데이터 고갈과 저작권의 딜레마

기사입력 : 2024년11월19일 15:10

최종수정 : 2024년11월19일 15:10

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

AI 학습 데이터의 공정 이용 논의 활발
한국의 고품질 콘텐츠 활용 기회 예상
AI 기본법 통과 후 한국형모델 마련 필요

인공지능(AI) 기술이 급속도로 발전하면서 예상치 못한 새로운 위기가 찾아왔다. 바로 AI를 학습시킬 양질의 데이터가 고갈되고 있다는 것이다.

챗GPT와 같은 거대 언어모델이 등장한 이후, 전 세계 AI 기업들은 더 나은 성능을 위해 양질의 데이터를 찾아 헤매고 있다. 그러나 이미 인터넷상의 고품질 데이터는 대부분 소진된 상태다.

이러한 데이터 고갈 현상의 핵심에는 저작권 문제가 있다. 양질의 텍스트 데이터는 대부분 책, 논문, 전문 기사 등 저작권으로 보호받는 콘텐츠다. 유럽연합(EU)과 미국에서는 AI 학습을 위한 데이터 사용이 공정 이용(fair use)에 해당하는지에 대한 법적 논의가 활발히 진행되고 있다.

김현철 한국인공지능협회장 [사진=한국인공지능협회] 2024.10.23 biggerthanseoul@newspim.com

한국어와 같은 비영어권 언어의 경우 상황은 더욱 심각하다. 영어는 그나마 공개된 데이터의 양이 방대하지만, 한국어의 경우 양질의 데이터를 확보하기가 매우 어렵다.

이에 대응해 일부 AI 기업들은 데이터 제공자들과 라이선스 계약을 맺기 시작했으며, 블록체인 기술을 활용한 저작권 보호 및 보상 시스템도 제안되고 있다.

각국은 이 문제 해결을 위해 다양한 시도를 하고 있다. EU는 AI Act를 통해 AI 학습 데이터의 투명성을 요구하고 있다.  미국에서는 AI 학습을 위한 데이터 활용을 공정 사용의 범주로 포함시키려는 논의가 진행 중이다. 일부 AI 기업들은 데이터 제공자들과의 직접적인 계약을 통해 문제를 해결한다.

주목할 만한 것은 합성 데이터(Synthetic Data) 활용이다. 그러나 이 역시 법적 문제를 완전히 해결하지는 못하는 한계가 있다. 결국 근본적인 해결책은 데이터 제공자와 AI 기업 간의 새로운 협력 모델을 만드는 것이다.

한국 정부도 이 문제의 심각성을 인식하고 있다. 문화체육관광부와 한국저작권위원회는 AI저작권에 대한 가이드라인을 발표했으며, 정부는 민간 주도의 클라우드 산업 확대를 통해 AI 경쟁력을 강화하려는 계획을 추진중이다.

더욱 주목할 점은 한국이 가진 특별한 기회다. 우리나라는 세계적 수준의 고품질 콘텐츠를 보유한 문화 강국이다. K-문학, K-드라마부터 전문적인 학술, 의료, 법률 자료까지, 질적으로 우수한 한국어 데이터가 풍부하다. 이러한 자산들을 AI 학습에 활용할 수 있는 체계를 구축한다면, 글로벌 AI 시장에서 독보적인 경쟁력을 확보할 수 있다.

이러한 가능성을 실현하기 위해서는 제22대 국회의 인공지능 기본법이 조속히 통과돼야 한다. 인공지능 기본법이 시행되면 저작권과 AI 발전이 공존할 수 있는 체계를 마련하는 토대가 될 수 있으며, 데이터 중개 플랫폼과 데이터 활용 동의 시스템도 법적 근거 하에 구축될 수 있다. 이 법안은 AI 산업의 미래를 위한 핵심적인 첫걸음이 될 것이다.

이 문제를 해결하기 위해서는 저작권 제도와 AI 발전이 상생할 수 있는 새로운 모델이 필요하다. 가장 현실적인 방안은 저작권 등록 시스템에 'AI 학습 동의' 옵션을 도입하는 것이다. 저작권자가 자신의 콘텐츠를 AI 학습에 활용하는 것을 사전에 동의하고, 이에 따른 적절한 보상을 받을 수 있는 체계를 만드는 것이다.

이를 위해서는 저작권 데이터의 등록과 거래, 수익 분배를 전문적으로 관리할 수 있는 중개 플랫폼이 필요하다. 이러한 플랫폼은 저작권자의 권리를 보호하면서도 AI 기업들이 필요한 데이터를 효율적으로 확보할 수 있게 해주는 중요한 역할을 할 수 있다. 

챗GPT가 그린 데이터센터의 모습 [사진=챗GPT]

이러한 체계가 성공적으로 구축된다면, 한국은 데이터 경제의 새로운 장을 열 수 있다. 단순히 AI 기술의 발전을 넘어, 저작권자의 권리 보호와 수익 창출, AI 기업의 기술 혁신이 선순환하는 새로운 경제 생태계를 만들 수 있는 것이다.

더 나아가 이러한 한국형 모델은 글로벌 표준이 돼야 한다. 저작권 보호와 AI 발전의 조화, 공정한 데이터 거래와 수익 분배 등 이 모든 것을 아우르는 혁신적인 모델을 한국이 먼저 제시해야 한다.

AI 시대에서 데이터는 새로운 원유라고 불린다. 그러나 무분별한 데이터 수집과 활용은 저작권 침해와 같은 심각한 문제를 야기할 수 있다. 동시에 지나친 저작권 보호는 AI 발전을 저해할 수 있다.

우리에게 필요한 것은 이 두 가치가 조화를 이루는 새로운 체계다. 저작권 등록 시스템의 혁신과 데이터 중개 플랫폼의 구축은 그 첫걸음이 될 수 있다. 각국의 사례와 시도들은 이미 이러한 변화의 필요성을 보여준다. 이제 한국이 이 분야에서 선도적인 모델을 제시할 때다.

◇ 김현철 한국인공지능협회장은 1984년 서울 출신으로, 머신러닝 기반 추천 알고리즘 개발회사 대표를 역임했다. 2017년 (사)한국인공지능협회 사무총장을 맡으면서 협회를 설립, 국내 최초 250개 인공지능 기술기업 클러스터를 구축하고, 전자정부 사업 '혁신성장첨단기술전' 공동주관, 국제인공지능대전 개최, 인공지능 경진대회, KOREA AI Startups 편찬 등을 추진하며 협회 발전에 기여했다. 2019년부터 현재까지 협회장을 맡고 있다.

[뉴스핌 베스트 기사]

사진
해커에 행정망 뚫렸다...국정원 "피해사실 확인" [서울=뉴스핌] 이영종 통일전문기자 = 해커집단으로 추정되는 세력이 온나라시스템을 비롯한 정부 행정망에 침투해 자료를 열람한 것으로 파악됐다. 국가정보원은 17일 보도자료를 통해 공공부문 및 민간업체의 해킹피해 상황을 전하면서 "지난 7월 온나라시스템 등 공공ㆍ민간분야 해킹 첩보를 사전에 입수, 행안부 등 유관기관과 합동으로 정밀 분석을 실시해 해킹 사실을 확인하고 추가피해 방지를 위한 대응에 적극 나섰다"고 밝혔다. [서울=뉴스핌] 이영종 통일전문기자 = 국정원이 17일 정부행정망 온나라시스템에 대한 해킹 피해 사실을 공개하면서 설명을 위해 제공한 해커들의 침투 개요도. [사진=국정원] 2025.10.17 yjlee@newspim.com 국정원은 "해커는 먼저 다양한 경로로 공무원들의 행정업무용 인증서(GPKI)ㆍ패스워드 등을 확보한 것으로 보이며, 인증체계를 면밀히 분석한 뒤 합법적 사용자로 위장해 행정망에 접근한 것으로 밝혀졌다"며 "이후 인증서(6개) 및 국내외 IP(6개)를 이용해 2022년 9월부터 올해 7월까지 행안부가 재택근무를 위해 사용하는 원격접속시스템(G-VPN)을 통과, 온나라시스템에 접속해 자료를 열람했다"고 밝혔다. 점검 결과, 정부 원격접속시스템에 본인확인 등 인증체계가 미흡하고 온나라시스템의 인증 로직이 노출되면서 복수기관에 접속이 가능하였고 각 부처 전용 서버에 대한 접근통제가 미비한 것이 사고원인으로 드러났다. 이에따라 국정원은 해커가 악용한 6개 IP주소를 全 국가ㆍ공공기관에 전파ㆍ차단하는 등 해커의 접근을 막는 긴급 보안조치를 단행했다. 또 △정부 원격접속시스템 접속시 ARS 등 2차 인증 적용 △온나라시스템 접속 인증 로직 변경 △해킹에 악용된 행정업무용 인증서 폐기 △피싱사이트 접속 추정 공직자 이메일 비밀번호 변경 △각 부처 서버 접근통제 강화 △소스코드 취약점 수정 등의 조치를 통해 추가 해킹 가능성을 차단했다고 국정원은 설명했다. 다른 부처에도 해킹 정황은 드러났다. 국정원은 "A 부처 행정메일 서버 소스코드 노출이 확인되었는데 해킹에 악용될 우려가 있어 개발업체와 함께 소스코드를 분석해 보안이 취약한 것으로 판단되는 부분을 수정했다"며 "또 일부 패스워드가 노출된 B 부처 행정업무용 인증서(GPKI)의 패스워드를 변경했다"고 밝혔다. 서울 내곡동 국가정보원 본부 청사와 원훈석 [뉴스핌 자료사진] 해커가 구축한 피싱사이트에 접속한 것으로 보이는 180여개의 공직자 이메일 계정에 대해서도 해킹 가능성에 대비해 전체 비밀번호를 변경했으며 현재까지 이로 인한 별다른 피해는 확인되지 않았다고 국정원은 전했다. 또 민간의 경우 서버인증서 노출, 원격관리시스템(VPN) 접속 페이지 노출 등의 피해가 있어 해당업체에 위험성을 통보, 보안조치를 요청했으며 통신업체에 대해서는 과기정통부가 피해여부를 별도로 확인 중"이라고 덧붙였다. 이번 사태의 배후와 관련 국정원은 "미국 해커 잡지인 '프랙'은 이번 해킹을 자행한 배후로 북한 '김수키' 조직을 지목했다"고 설명했다. 하지만 "금번 해킹에서 확인된 해커 악용 IP주소 6종의 과거 사고 이력, GPKI 인증서 절취 사례 및 공격방식ㆍ대상의 유사성 등을 종합적으로 분석중이지만 현재까지 해킹소행 주체를 단정할만한 기술적 증거는 부족한 상황"이라고 강조했다. 또 "해커가 한글을 중국어로 번역한 기록, 대만 해킹을 시도한 정황 등이 확인 되었지만 국정원은 모든 가능성을 열어 두고 해외 정보협력기관 및 국내외 유수 보안업체와 협력해 공격 배후를 추적하고 있다"고 밝혔다. 김창섭 국정원 3차장은 "온나라시스템 등 정부 행정망은 국민의 생활과 행정 서비스의 근간인 만큼, 진행중인 조사를 조속히 마무리하고 재발방지를 위한 범정부 후속대책을 마련해 이행할 계획"이라고 보도자료를 통해 밝혔다.  yjlee@newspim.com 2025-10-17 13:31
사진
전 프로야구 선수 조용훈, 생방송 중 추락사 [서울=뉴스핌] 양태훈 기자 = 국가대표 출신 전직 프로야구 선수 조용훈(37)씨가 경기 부천시의 한 아파트 옥상에서 추락해 숨졌다. 17일 경기 부천 원미경찰서에 따르면 이날 오후 6시 24분께 부천시 원미구 소재 아파트 옥상에서 조씨가 추락했다는 신고가 112에 접수됐다. 신고를 받고 출동한 소방당국은 현장에서 이미 숨진 조씨를 발견해 경찰에 인계했다. 119 구급차. 사진은 기사와 무관. [사진=뉴스핌 DB] 조씨는 사고 당시 유튜브 라이브 방송을 진행하던 중이었던 것으로 알려졌다. 방송 중 옥상에서 이상 행동을 보이자 이를 지켜보던 시청자들이 즉각 경찰에 신고한 것으로 전해졌다. 조씨는 2006년 투수로 현대 유니콘스에 입단해 넥센 히어로즈 등에서 활약했으며, 2014년 은퇴했다. 은퇴 후에는 유튜버로 활동해왔다. 경찰은 범죄 관련성은 없는 것으로 판단하고, 정확한 사망 경위를 조사 중이다. dconnect@newspim.com 2025-10-17 22:07
기사 번역
결과물 출력을 준비하고 있어요.
기사제목
기사가 번역된 내용입니다.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동