전체기사 최신뉴스 GAM
KYD 디데이
영상 금융

속보

더보기

[영상] ② MS, 인공지능을 지배하는 자가 세계를 지배한다

기사입력 :

최종수정 :

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

알파고 이후 조용했던 인공지능의 급부상
인공지능 개발에 필요한 건 자금과 데이터 2개뿐…
인공지능 스피커 싸움, 아마존, 구글, 애플… 웬 MS
MS가 인공지능 전쟁 최후의 승리자?

[서울=뉴스핌] 한태봉 전문기자 = 인공지능 알파고가 불세출의 바둑 천재 이세돌을 이겼던 2016년 이후 한동안 온 세상이 인공지능에 대한 관심으로 떠들썩했다. 하지만 이런 뜨거운 관심은 빠르게 수그러들었다. 알파고가 인간에게 승리한 이후 한참동안은 세상을 뒤집을 만한 또 다른 변화가 없었기 때문이다. 그렇게 인공지능은 사람들의 관심사에서 사라졌다.

대신 인류의 관심은 비트코인 같은 암호화폐, NFT, 메타버스, VR, AR 등의 신기술로 빠르게 옮겨갔다. 그렇게 시간이 흘러갔지만 인공지능에 대한 빅테크들의 개발 노력은 계속됐다. 그리고 2023년이 되면서 마침내 과거에 없던 새로운 형태의 인공지능 챗봇이 혜성같이 등장했다. 이름하여 챗 GPT. 이 낯선 이름의 주인공이 출시되자마자 전 세계는 난리가 났다.

챗 GPT는 생성형 인공지능의 한 종류다. 즉 언어모델을 통해 자연어를 학습하고 이를 바탕으로 니즈가 다양한 수많은 사용자들의 질문에 척척 답변을 생성해낸다. 챗 GPT가 뜨겁게 주목받는 이유는 답변이 기대 이상이기 때문이다. 또 자연어 답변이라 인간들에게 더 친근하다는 점도 강점이다.

챗 GPT를 만들어낸 회사는 오픈AI다. 하지만 마이크로소프트가 약 16조원(130억달러)이라는 막대한 금액을 투자한 사실이 알려지면서 현재는 마이크로소프트가 인공지능 시장 이슈를 완벽히 선점하고 있다. 재미있는 건 마이크로소프트는 그 동안 인공지능 기술력과 관련해 높은 평가를 받지 못해 왔다는 사실이다.

사람들은 지금의 챗 GPT 열풍이 1990년대 후반의 인터넷의 출현, 2007년의 아이폰 출현에 이어 세상을 확 뒤집을 게 분명한 3번째 혁신임을 단숨에 깨 달았다. 과거와 비교할 수 없이 빠른 현대 사회에서 챗 GPT가 전 세계로 퍼지는 데는 2개월이면 충분했다. 1억명 이상이 이미 챗 GPT를 몸소 체험했다. 말 그대로 열풍이다. 수많은 사용자들이 과거에는 상상할 수 없었던 챗 GPT의 놀라운 답변에 감탄하며 다양한 사용자 경험들을 인터넷에 쏟아내고 있다.

 

◆ 인공지능 개발에 필요한 건 자금과 데이터 2개뿐…

인공지능 개발에는 기본적으로 무지막지한 자금력이 필수적이다. 이제 미국 시가총액 상위 4개 기업의 영업이익을 살펴보자. 애플은 143조원, 마이크로소프트는 100조원, 알파벳(구글)은 90조원, 아마존은 15조원이다. 아마존의 영업이익이 상대적으로 부진하지만 어쨌든 이 정도의 자금력과 수익력을 갖춘 기업이라야 인공지능 분야에 도전할 수 있는 게 현실이다.

이 거대한 플랫폼 기업들은 이미 자신들의 탁월한 서비스를 통해 세계를 지배하고 있다. 이들은 더 먼 미래에도 계속해서 세계를 지배하기 위해 인공지능 기술력을 필요로 한다. 따라서 미국 빅테크 기업들은 오래 전부터 인공지능 개발에 총력을 다해 몰두해 왔다.

초거대 인공지능 개발은 자금력이 막강한 빅테크 기업들만 도전 가능하다. 하지만 자금력이 막강하다고 모두가 경쟁에서 승리할 수는 없다. 신기술이 등장했을 때 빨리 대응하지 못해 순식간에 경쟁에서 도태됐던 기업들의 슬픈 역사는 무수히 많다. 아무리 빅테크 기업이라 해도 인공지능 발전을 빠르게 쫓아가지 못할 경우 과거의 영광을 누리지 못하고 규모가 쪼그라들 가능성이 크다.

인공지능의 개발에는 자금력 외에도 중요한 게 있다. 바로 데이터다. 구글, 아마존, 애플, 페이스북 모두 데이터를 취득하기에 유리한 위치에 있다. 하지만 이들 기업 중에서도 최상의 데이터 취득에 가장 유리한 기업은 역시 구글이다. 구글이 가진 장점은 이미 사용자별 데이터를 전 세계에서 가장 많이 확보하고 있다는 점이다.

글로벌 거대 플랫폼 기업들의 핵심 경쟁력은 사용자수다. 구글의 유튜브는 21억명, 애플의 IOS 사용자수는 10억명, 페이스북 사용자수는 22억명, 마이크로소프트 윈도우 사용자수는 14억명으로 알려져 있다. 이런 엄청난 사용자수를 바탕으로 각 빅테크 기업들이 확보한 데이터는 탄탄하다. 또 사용자수는 상대적으로 부족하지만 오래전부터 인공지능을 준비해 왔던 아마존도 있다.

세계인들 중 상당수는 일상 자체를 구글 서비스와 함께 하고 있어 구글은 압도적인 데이터확보가 가능하다. 사람들은 구글에 자신의 모든 데이터를 아낌없이 제공하기 때문이다. 내가 요즘 무엇에 관심이 있는 지, 어디를 갔다 왔는지, 어떤 걸 먹었는지 구글은 다 알고 있다. 구글이 '구글 신'이라 불리는 이유기도 하다.

아마존은 물건 구매자들의 모든 데이터를 가지고 있다. 애플은 IOS앱을 사용하는 고객들의 다양한 데이터를 가지고 있다. 메타(구 페이스북)는 전 세계에서 가장 많은 사용자수를 가지고 있는 페이스북과 인스타그램으로 데이터를 확보해 왔다. 마이크로소프트는 14억명이 넘는 윈도우 사용자수를 기반으로 많은 데이터를 가지고 있다.

물론 지금 화제가 되고 있는 챗 GPT는 자체 데이터 대신 크롤링(인터넷상 정보를 자동으로 수집하는 작업)을 통해 사전 학습을 해 왔다. 하지만 만약 허용하지 않은 데이터를 갖다 썼을 경우 향후 저작권적으로 여러가지 문제가 발생할 수 있다. 따라서 시간이 경과할수록 각 빅테크들이 보유하고 있는 합법적인 데이터들이 위력을 발휘할 가능성이 높다. 향후 돈과 데이터를 모두 가지고 있는 빅테크 기업들이 인공지능 개발 경쟁에서 유리할 수밖에 없다.

◆ 인공지능이란?

'인공지능(AI)'을 어떻게 정의할 수 있을까? '지능을 가지고 있는 컴퓨터시스템'이라고 설명할 수 있다. 인간의 지능을 기계 등에 인공적으로 구현한 것이라고 표현하기도 한다. 최근 인공지능 기술이 예상보다 급격히 발전하면서 과거에는 기계가 인간의 근육을 대체했지만 앞으로는 기계(인공지능)가 인간의 두뇌를 대체할 것이라는 전망이 현실성 있게 다가오고 있다.

인공지능은 그 외에도 여러가지로 분류할 수 있는 데 캘리포니아대학교 컴퓨터과학 교수인 '스튜어트 러셀'의 4가지 분류가 가장 직관적이다. (1) 인간처럼 행동하는 인공지능, (2) 인간처럼 생각하는 인공지능, (3) 합리적으로 생각하는 인공지능, (4) 합리적으로 행동하는 인공지능으로 구별해 볼 수 있다.

인공지능을 발전단계에 따라 3단계로 구분한 접근법도 있다. 1단계인 '약인공지능'은 유용한 도구로써 설계된 인공지능으로 특정 분야에서만 활용 가능하다. 2단계인 '강인공지능'은 인간을 완벽하게 모방한 인공지능으로 다양한 분야에서 활용 가능하다. 3단계인 '초인공지능'은 인간들이 가장 두려워하는 형태로 자아를 가진 미래의 인공지능을 말한다.

 

◆ 인공지능의 발달과정

영국의 심리학자이자 수학자인 앨런 튜링은 현대 AI 연구의 근간이라 할 수 있는 컴퓨터 과학의 아버지로 불린다. 2차대전 당시 독일 나치의 암호를 해독해 연합국의 승리에 기여했다. 영화 이미테이션 게임의 실제 인물이기도 하다.

그는 'AI는 사고할 수 있는가' 라는 주제의 연구를 했다. 그가 발표한 '튜링 테스트'는 컴퓨터와 인간이 대화해 컴퓨터의 반응을 인간의 반응과 구분할 수 없다면 컴퓨터가 스스로 사고할 수 있다고 간주해야 한다는 개념이다. 컴퓨터와 인간이 대화해 30% 이상을 속이면 튜링 테스트를 통과하는 것으로 간주한다. 인간과 같은 사고능력, 지적 능력을 지녔다고 인정할 수 있다는 것이다. 챗 GPT는 아직 튜링 테스트를 통과하지 못했다. 하지만 조만간 통과할 수 있을 것이라는 전망이 지배적이다.

인공지능 연구는 언제부터 활발하게 이루어졌을까? 1950년대부터 컴퓨터 발달이 본격화되면서 연구가 활기를 띄게 됐다. 사람 대신 컴퓨터로 두뇌를 만들어 사람의 일을 대신해주는 개념은 근사하다. 자연어처리나 복잡한 수학문제 풀이 등 인간만이 할 수 있는 영역에 있던 문제들도 해결하고자 했던 혁신적인 연구였다. 당연히 인공지능 개발은 쉽지 않았다. 곧 수많은 난제에 부딪쳤다.

이에 따라 인공지능 연구는 2번의 '인공지능 겨울'을 맞이했다. 1차겨울은 1970년대로 단일 계층 신경망의 한계에 부딪쳤다. 1980년대에 다시 신경망 이론에 대한 연구가 재개됐지만 역시 한계를 보이며 2차 겨울을 맞이했다. 이렇게 한계에 부딪히면서도 인공지능에 대한 연구는 계속돼 왔다.

인공지능이 사람의 의사결정 방식을 흉내내기 위해서 필요한 건 뭘까? 크게 4 가지로 정리해볼 수 있다. 첫번째는 다양한 형태의 서로 다른 데이터를 인지하는 것, 두번째는 인지한 데이터를 바탕으로 추론하는 것, 세번째는 추론한 결과를 출력하는 과정, 네번째는 출력한 결과에 대한 피드백이다. 이후에 이 4가지 방식을 계속해서 반복하는 게 인공지능 학습이라고 정리할 수 있다.

인공지능 연구 때 가장 많이 등장하는 기술용어 3가지는 기계학습(머신러닝), 인공신경망, 딥러닝이다. '기계학습(머신러닝)'이란 많은 데이터를 넣어주면 프로그램이 스스로 학습하는 것을 말한다. 알고리즘을 통해 데이터를 분석하고 분석 결과와 패턴을 컴퓨터가 스스로 인식해 특정 프로그래밍이 부재한 상황에서도 컴퓨터가 지속적으로 학습과 분석을 반복하는 것을 총칭한다.

 '인공신경망'이란 인간의 뉴런 구조를 본 떠 만든 기계학습(머신러닝) 모델이다. '딥 러닝'이란 기계학습(머신러닝)에 활용되는 알고리즘 중 '인공신경망'을 기반으로 한 분석방법을 포괄적으로 지칭한다. 딥러닝을 다르게 설명하면 입력과 출력 사이에 있는 인공 뉴런들을 여러 개 층층이 쌓고 연결한 인공신경망 기법을 다루는 연구다. 수십 개의 층으로 이루어진 인간의 신경망을 흉내 낸 '심층 신경망(DNN)'을 기반으로 한다. 딥러닝은 인공지능 기술의 핵심이다.

인공지능 발전이 급격히 가속화된 계기는 제프리 힌턴 박사에 의해 2006년에 딥러닝 논문이 발표되면서 부터다. 그 이전까지는 불가능하다고 여겨지던 비지도 학습(unsupervised learning)에 대한 실마리가 풀리면서 인공지능 연구가 가속화됐다.

인공지능(AI) 모델의 핵심은 사람보다 빠르게 결과물을 출력해 내는 게 핵심이다. 사람보다 빨리 결과물을 내놓으려면 먼저 데이터로부터 학습을 해야 한다. '지도학습'은 말 그대로 정답이 있는 데이터를 활용해 데이터를 학습시킨다.

반면 '비지도 학습'에서는 정답 라벨이 없는 데이터를 비슷한 특징끼리 군집화하여 새로운 데이터에 대한 결과를 예측하는 방식이다. 당연히 '지도학습'보다 난이도가 더 높다. 인공지능을 어린아이라고 가정해 보자. '지도 학습'은 단어, 숫자, 색깔과 같이 인간이 이미 알고 있는 지식을 아이에게 가르치는 것과 같다. '비지도 학습'은 아이가 스스로 문제를 풀고 추론할 수 있도록 내버려두는 방식이다.

이런 방식으로 인공지능은 먹지도 않고 자지도 않고 24시간 내내 스스로 학습하며 계속 능력이 진화해 왔다. 사람의 기억력은 한계가 있지만 컴퓨터의 기억력은 무한대다. 인간세계에서 수 천 년간 쌓인 데이터를 인공지능은 모두 기억한다. 그리고 사람과는 비교도 안 되게 빠른 속도로 분석하고 결론을 내릴 수 있게 됐다. 

 

 

◆ AI스피커 싸움, 아마존, 구글, 애플… 난데없는 MS

사실 마이크로소프트가 챗 GPT를 활용해 다양한 서비스를 내 놓기 훨씬 전부터 빅테크들은 인공지능 기술을 가지고 치열한 경쟁을 치렀다. "인공지능을 지배하는 자가 세계를 지배한다"라는 말이 있다. 따라서 오랜 전부터 빅테크 기업들은 인공지능 개발에 사활을 걸고 매달려 왔다. 그 전초전이 바로 인공지능 스피커 시장이었다.

아마존, 구글, 애플은 인공지능 시장을 선점하기 위해 인공지능 스피커 시장을 공략해 왔다. 미국의 인공지능 스피커 시장점유율을 살펴보면 아마존의 '에코'는 47%, 구글의 '구글홈'은 42%, 애플의 '홈팟'은 11%를 차지하고 있다. 재미있는 건 이 전쟁에서 마이크로소프트는 순위에 없다.

인공지능 스피커 외에도 인공지능 비서 역할을 하는 아마존의 알렉사, 구글 어시스턴트, 애플의 시리 간 경쟁도 치열했다. 역시 마이크로소프트에도 '코타나'라는 인공지능 비서가 있었지만 존재감은 거의 없었다. 가장 꼴찌였던 마이크로소프트가 갑자기 생성형 AI 분야에서 높은 기술력을 갖춘 '오픈AI'에 막대한 투자를 감행하며 기습적으로 인공지능 시장에 선두로 올라선 셈이다. 지금은 마이크로소프트가 인공지능 시장 이슈를 완벽히 선점하고 있으니 경쟁사들은 말 그대로 모두 난리가 난 상황이다.

이제 MS의 경쟁사인 구글, 애플, 아마존은 마음이 급해졌다. 이번 변화에 제대로 대응하지 못하면 도태된다. 인터넷 시대에 적응하지 못한 수많은 기업들과 아이폰 시절에 적응하지 못해 몰락했던 노키아 사례를 떠올려 보면 쉽게 짐작된다.

심지어 천하의 마이크로소프트 마저도 스마트폰 시대의 대응에 실패해 위기를 맞았었다. 그 결과 PC 운용체제하에서 독점적인 권력을 휘두르던 마이크로소프트가 스마트폰 운영체제는 애플의 IOS와 구글의 안드로이드에 모두 뺏겨 버리는 결말을 맞이하게 됐다.

어쨌든 아마존, 구글, 애플과 달리 인공지능 스피커 시장에서 존재감이 없었던 마이크로소프트가 의외로 인공지능 분야에서 승기를 잡았다는 사실은 아이러니하다. 특히 경쟁사 중에서도 구글의 충격이 제일 크다. 지금 시장에서 화제가 되고 있는 오픈AI 기술의 원천은 바로 구글이기 때문이다. 2017년에 구글이 발표한 논문에서 'GPT(Generative Pre-trained Transformer)'의 기반이 되는 트랜스포머 모델을 제시한 바 있다. GPT의 'T'도 트랜스포머를 의미한다.

트랜스포머는 문장 내 단어 사이의 관계를 추적해 맥락과 의미를 파악하는 데 초점을 맞춰 왔다. 따라서 자연어로 명령어(프롬프트)를 입력하면 이를 분석해 자연어로 답을 내 놓는 지금의 생성형 AI 구조는 모두 구글의 트랜스포머 논문이 그 출발이라고 볼 수 있다. 

 

◆ MS가 인공지능 전쟁 최후의 승리자?

오픈 AI가 2022년 11월에 챗 GPT를 선 보인 후 불과 2개월만에 월간 활성 이용자수가 1억명을 돌파했다. 과거 페이스북이 이용자수 1억명을 돌파하는 데 걸린 시간은 4.5년이다. 이보다 훨씬 속도가 빨랐던 틱톡도 9개월이 걸렸다. 챗 GPT의 확산 속도가 얼마나 경이적인 지 알 수 있다.

흥미로운 건 챗 GPT를 만든 오픈AI는 비영리 기관이라는 점이다. 오픈AI는 '인류에 기여하겠다'는 사명으로 수익성 대신 공공성을 추구해 왔다. 그런데 비영리를 추구하던 오픈AI가 왜 MS에게 독점적으로 챗 GPT 등의 초거대 언어모델(LLM)을 사용할 수 있는 권리를 주면서까지 무리하게 막대한 투자를 받았을까? 이런 초거대 언어모델(LLM)을 지속적으로 유지하고 개발하려면 천문학적인 자금이 필요하기 때문이다.

좋은 일을 하려 해도 돈이 있어야 한다. 신생 회사였던 오픈 AI에게는 늘 자금이 부족했다. 반대로 MS는 인공지능 기술력이 부족한 것으로 평가받아왔다. 두 회사간에 이해관계가 일치한 셈이다. 이런 필요에 의해 MS는 오픈AI에 2019년에 10억달러, 2021년에 20억달러, 2023년에는 무려 100억달러를 투자하는 승부수를 던졌다. 누적 투자금액이 무려 130억달러(16조원)에 달한다.

전 세계에서 이 정도의 거금을 투자할 수 있는 기업은 MS, 애플, 구글, 아마존 등 소수의 빅테크 기업들에 불과하다. 상대적으로 AI 기술력이 낮은 것으로 평가받던 MS의 과감한 승부수라고 결론 내릴 수 있다. 이번 마이크로소프트의 화끈한 베팅은 17년 전인 2006년도에 유튜브를 무려 2조원(16억5천만달러)에 인수한 구글의 결단력에 버금가는 빅딜이다. 지금 관점에서는 소액일지 몰라도 그 당시로 돌아가보면 구글의 유튜브 인수금액은 상상을 초월하는 거액이었다.

구글이 유튜브를 인수했던 2006년 당시에는 인터넷 속도가 기어가는 수준이었다. 지금처럼 동영상을 세계 곳곳에서 편안하게 플레이할 수 있는 인터넷 환경이 언제쯤 에나 구축될 수 있을지 아무도 장담 못했던 불확실한 시대였다. 그런 열악한 인터넷 환경 속에서도 미래의 언젠가에는 인터넷 인프라가 개선될 거라는 확신을 가지고 유튜브를 인수한 구글의 선견지명이 놀라울 뿐이다. 지금 생각해보면 유튜브를 고작 2조원에 인수하다니 구글은 무지막지하게 남는 장사를 한 셈이다.

이제 유튜브가 없는 구글은 상상도 할 수 없다. 유튜브와 구글 두 사이트의 계정이 연동되고 검색 알고리즘이 서로 밀접하게 작동하면서 전 세계에서 가장 인기있는 동영상 사이트와 가장 강력한 검색엔진이 서로 연결됐다. 이게 지금의 구글을 있게 한 강력한 2개의 킬러 서비스다. 지금으로부터 10년 뒤에는 MS와 오픈AI와의 관계도 비슷하게 흘러갈까?

사람들은 미래에 인공지능이 인류를 지배할 까봐 두려워한다. 하지만 현실적으로 보면 미래에는 이 거대한 인공지능 기술을 보유한 기업들에게 종속될 가능성이 훨씬 더 크다. 마이크로소프트, 애플, 구글, 아마존, 메타, 테슬라까지 모두 회사의 명운을 걸고 인공지능 전쟁에 뛰어드는 이유이기도 한다. 빅테크 기업들 간의 인공지능 경쟁은 이제 시작일 뿐이다. 아직 인공지능 전쟁의 최종 승리자를 지레짐작하는 건 섣부르다. 인공지능을 지배하는 기업이 세계를 지배한다.

 

③편에서 계속… ③MS, '빙'으로 구글 검색 붕괴시킬까?

 

자세한 내용은 해당 영상을 통해 확인해 보자.

뉴스핌 (촬영·편집 : 조현아)

 

longinus@newspim.com

 

[뉴스핌 베스트 기사]

사진
[시댄스 2.0 쇼크] 나도 영화 감독 [서울=뉴스핌] 배상희 기자 = "시댄스(Seedance) 2.0의 등장은 가히 공포스럽다", "이건 영상을 만드는 것이 아니라, 영상을 인쇄하는 것이다", "AI 영상이 수공예 공정 단계에서 산업화 생산 시대로 진입했다" 중국 최대 숏폼(짧은 동영상 콘텐츠) 서비스 플랫폼 더우인(抖音, 틱톡의 중국 버전)의 모회사인 바이트댄스(ByteDance∙字節跳動) 산하의 클라우드∙AI 서비스 플랫폼 볼크엔진(火山引擎∙volcengine)이 개발한 AI 영상 생성 모델 '시댄스 2.0'에 대한 시장의 평가다. 시댄스 2.0은 전세계 AI 업계를 넘어 영화와 광고 업계의 지형도를 흔들 거대한 변수로 떠올랐다. 일론 머스크(Elon Musk)는 SNS를 통해 "너무 빠르게 일어나고 있다(It's happening fast)"는 평을 남겼고, 중국 영화감독 자장커(賈樟柯)는 자신의 웨이보에 "정말 대단하다. 시댄스 2.0으로 단편을 하나 만들어볼 생각"이라는 글을 게재했다. 미국의 영화 감독 찰스 커런은 "시댄스 2.0이 할리우드를 뒤흔들지도 모른다"고 평했다. 약 4개월 전 미국 오픈AI(OpenAI)가 공개한 소라(Sora) 모델이 놀라운 물리 세계 시뮬레이션 능력으로 전 세계를 충격에 빠뜨린 가운데, 시댄스 2.0은 AI 영상 기술 산업이 오랫동안 벗어나지 못했던 낮은 활용도와 높은 비용이라는 핵심 병목을 어느 정도 해소해주며 AI 영상 생성을 다시 한 번 여론의 중심으로 끌어올리고 있다. [AI 이미지 = 배상희 기자] ◆ 가성비 甲, 7만원에 2분짜리 영화 한편 뚝딱  "가죽 재킷을 입고 오토바이를 탄 한 남자가 골목 사이를 지나 빠르게 질주하는 모습을 카메라가 따라간다. 뒤에는 여러 대의 자동차들이 그를 쫓고 있고 카메라는 남성의 긴박한 표정을 담는다. 남자가 노상 테이블을 들이 받으며 질주를 이어가고, 아수라장이 된 주변 배경을 원거리 장면으로 담는다" 이러한 내용의 프롬프트(명령어)를 입력했더니 한 남성을 쫓는 긴박한 추격전의 영화급 장면이 만들어졌다. 한 이용자는 "99%의 현실감. 이게 AI라고 말해주지 않았다면 배우가 누군지 찾아봤을 정도"라는 글을 남겼다. 시댄스 2.0이 공개된 지 일주일 만에 국내외 사용자를 중심으로 이같은 체험기가 쉴새 없이 올라오고 있다. 사용자가 짧은 프롬프트나 참고할 사진 또는 사운드를 입력하면, AI가 이를 완벽하게 이해해 완전한 오리지널 사운드 트랙과 다중 카메라 구도를 갖춘 영화급의 고퀄리티 영상을 만들어낸다. 블룸버그는 시댄스 2.0이 "생성된 클립의 품질로 관찰자들을 놀라게 했다"고 평했다. 스위스에 기반을 둔 컨설팅 업체 CTOL은 시댄스 2.0을 "현재 이용 가능한 가장 진보된 AI 영상 생성 모델"이라면서 실제 테스트에서 "오픈AI의 Sora 2와 구글의 Veo 3.1을 능가한다"고 평가했다.   특히, 시댄스 2.0이 주목 받는 이유는 매우 높은 '가성비'다. 유명 시각효과 감독 야오치(姚騏)는 시댄스 2.0을 활용해 2분 분량의 SF 단편 영화 '귀로(歸途∙귀도)'를 제작했는데, 소요된 비용은 단 330.6위안(약 7만원)에 불과했다. 이는 전통적인 제작 환경에서는 상상하기 어려운 수치다. 업계 관계자들의 추산에 따르면 시댄스 2.0을 통해 5초 분량의 영상을 생성하는데 드는 비용은 4.5~9위안까지 낮아질 것으로 예상된다. 제작 기간도 단축돼 애니메이션 제작 기간은 기존 1주 이상에서 3일 이내로, 인건비는 약 90% 줄어들 수 있다는 분석이 나온다. 현재까지 소개된 보도 내용을 바탕으로 종합해보면, 시댄스 2.0을 활용해 1분짜리 영상을 만드는 데는 보통 3~5분 정도의 시간이면 충분한 것으로 보인다. 중국 게임 개발사 게임사이언스(遊戲科學∙Game Science)의 펑지(馮驥) 최고경영자(CEO)는 시댄스 2.0의 등장을 기점으로 향후 일반 영상 제작 비용이 더 이상 기존 영화·드라마 산업의 논리를 따르지 않고 점차 연산력의 한계 비용 수준에 수렴하게 될 것으로 내다봤다.  펑 CEO는 "콘텐츠 영역은 전례 없는 차원의 인플레이션을 맞게 될 것이며, 기존의 조직 구조와 제작 프로세스는 완전히 재구성될 것"이라고 전했다. [서울=뉴스핌] 배상희 기자 2026.02.19 pxx17@newspim.com ◆ 시댄스 2.0, 무엇이 다른가? '4대 핵심 기술' 그 동안 AI 영상 생성 모델들은 △촬영·카메라 움직임을 매우 정확하게 설명해야 하는 어려움을 비롯해 △멀티모달 소재 융합 능력이 좋지 않아 음향과 화면이 맞지 않고 △캐릭터·장면의 일관성이 약하며 △낮은 제어 가능성에 따른 저조한 생성 성공률 등의 난제를 겪어왔다. 이러한 이유로 그간 상당수 AI 영상 생성형 모델들은 단편적인 엔터테인먼트 활용 수준에 머물러 있었다. 하지만 시댄스 2.0 출시는 바로 이러한 업계의 기술적 난제에서 겨냥해 의미 있는 성과를 냈다는 평가를 받고 있다. 기존의 AI 모델이 정지된 이미지를 움직이게 하는 1세대 수준에 그쳤다면, 시댄스 2.0은 카메라 무빙(카메라를 움직여 촬영하는 기법) 설계, 샷을 넘나드는 캐릭터 일관성 그리고 원천 단계에서의 음향·영상 동기화 능력을 구현해낼 수 있는 수준으로 진화했다. 구체적으로 시댄스 2.0이 갖고 있는 핵심 역량은 △자동 샷 분할, 자동 카메라 무빙 △영상∙음성(오디오)∙이미지∙텍스트 등 전방위 멀티모달 지원 △'이중 병렬 확산 트랜스포머(Dual-Branch Diffusion Transformer, 영상∙음성 동시 처리) 아키텍처' △멀티샷 스토리텔링 등 4가지로 압축된다. 이를 통해 AI 영상의 '가챠식(랜덤 결과 반복) 생성'에서 '감독급 창작'으로 질적인 도약을 이뤘다는 평가를 받고 있다. 1. 자동 샷 분할, 자동 카메라 무빙 쉽게 말해 AI가 알아서 샷을 나누고 카메라를 움직여 주는 기능이다. 사용자가 렌즈 이동 모션을 세부적으로 정교하게 묘사할 필요 없이 AI 모델이 스토리 텔링에 따라 자동으로 샷 분할과 카메라 무빙 방식을 설계하고, 심지어 창작자가 생각지도 못한 장면까지 자동으로 채워넣는다. 이는 시댄스 2.0이 감독의 의도를 이해할 수 있다는 것으로, 간단한 프롬프트 한 줄로도 전문 감독급의 카메라 연출 효과를 만들어내는 것이 가능해진 것이다. 2. 전방위 멀티모달 지원 이는 시댄스 2.0의 최대 강점이다. 최대 9장의 이미지, 3개의 영상, 3개의 오디오를 동시에 입력할 수 있어, 동작·특수효과·스타일·인물 외형·사운드 효과 등을 정밀하게 지정할 수 있는 풍부한 '감독 도구 상자'를 제공한다.   3. 이중 병렬 확산 트랜스포머 해당 기능은 영상 생성과 동시에 전용 음향효과와 배경음악을 매칭할 수 있을 뿐 아니라, 입 모양과 대사의 정밀한 싱크를 구현하고, 표정∙동작과 감정의 높은 일치를 실현해낸다. 4. 멀티샷 스토리텔링 여러 샷이 전환되는 가운데서도 캐릭터와 장면의 일관성을 계속 유지할 수 있어, AI 영상을 단일 샷 클립에서 다중 샷의 완결된 내러티브(스토리텔링)로 업그레이드하고, 본격적인 영화 창작의 기초 역량을 갖추게 했다. 이러한 핵심 역량은 효율과 품질 모두에서 도약을 이뤄냈고, 이를 통해 가챠 문제도 상당 부분 해소했다. 기존 모델들은 같은 프롬프트를 반복 입력해 여러 결과를 보고 그 중 하나를 선택해야 했는데, 시댄스 2.0은 단 한두 번의 시도만으로도 90%의 만족도를 보여준다. 이미 일부 전문 영상 크리에이터와 감독들은 이 모델을 활용해 영화급 콘텐츠를 제작하고 있다. 이는 AI 영상이 단순 소재 생성에서 영화 창작으로 도약했음을 의미한다 콰이쓰만샹(快思慢想)연구원 톈펑(田豐) 원장은 "실험 결과 시댄스 2.0은 참조 영상의 카메라 워크, 리듬, 이펙트를 정확히 재현하며, 완벽한 통제 수준의 결과물을 낸다"면서 "음성 파일을 업로드하면, 생성된 영상 속 인물이 그 음성과 동일한 목소리로 대사를 말한다. 더 이상 후시 녹음을 할 필요가 없다"고 평했다. 이러한 역량은 낮은 자본으로 누구나 고퀄리티의 영상을 제작할 수 있는 길을 열어준 것이다. 정확한 입 모양, 배경음악, 특수효과가 모두 포함된 짧은 영상의 생성이 원클릭으로 가능해지면서, AI 영상이 오랫동안 벗어나지 못했던 낮은 활용도와 높은 비용이라는 영상 제작의 핵심 병목을 어느 정도 해소했다는 평가가 나온다. ◆ 중국 시댄스2.0 vs 미국 SORA 2  시댄스 2.0 열풍 속에 미∙중 AI 격차에 대한 논쟁도 이어지고 있다.  오픈AI의 AI 영상 생성 최신 모델 '소라(Sora) 2'와 '시댄스 2.0'을 통해 미중 양국의 기술적 강점과 한계점을 진단해 보면 다음과 같다.    1. 기술 철학 ① 소라 2 : 세계 시뮬레이터목표: 현실과 똑같이 움직이는 물리 세계를 만드는 것.강점: 중력·반동·마찰 같은 물리 법칙이 잘 살아 있는 영상, 특수효과·리얼한 장면.성격: 물리적으로 공감할 수 있는 화면 구성은 강하나, 스토리 구성은 추가 작업이 필요. ② 시댄스 2.0 : 감독 시뮬레이터목표: 사람들이 보고 싶어 하는 이야기·감정을 바로 영상으로 뽑아내는 것.강점: 분할 샷, 카메라 무빙, 음악·리듬까지 포함된 완결된 '클립'을 한 번에 생성.성격: 물리 정밀도보다 재미있게 잘 넘어가는 장면 구성에 우선순위를 둠. 2. 기술 구현 ① 소라 2강점 : 얼음 위 도약, 물 튀김, 공 튀기기 등 복잡한 동작의 물리적 사실감.약점 : 장편·복잡한 서사는 감독이 따로 컷 구성. 편집, 음악 등을 손봐야 함. ② 시댄스 2.0강점 : 프롬프트 한 줄로 '도입–전개–클라이맥스'가 있는 전개가 가능.약점 : SF·다큐멘터리처럼 물리 정확성이 중요한 장르에서는 세밀함이 부족할 수 있음. 3. 시장·비즈니스 포지션 ① 소라 2대상 : 할리우드, 고급 광고, 대형 스튜디오 등 고품질 특수효과·리얼리티가 중요한 분야.모델 : 강한 기반 모델 + API를 열어주는 '프로용 엔진'. ② 시댄스 2.0대상 : 틱톡 크리에이터, 전자상거래 셀러, 중소기업 마케팅 등 대중 창작자·콘텐츠 플랫폼.모델 : 앱 안에 녹아든 '원클릭 영상 감독', 누구나 바로 써서 올릴 수 있는 툴. 결론적으로 소라 2는 현실과 똑같이 보이게 만드는 힘(물리적 리얼리티)에서 강하고, 시댄스 2.0은 바로 활용할 수 있는 이야기·클립(서사·효율)에서 강점을 드러낸다.  AI 영상의 미래는 둘 중 하나가 다른 하나를 완전히 이긴다기보다 각자 역할을 나눠 가져가는 공존·혼합 쪽에 가까울 가능성이 크다. 고급 영화·시각특수효과(VFX)·정밀 시뮬레이션은 소라 2가, 숏폼·광고·웹드라마·사용자 제작 콘텐츠(UGC)는 시댄스 2.0이 적합하다고 결론 내릴 수 있다.  pxx17@newspim.com 2026-02-19 11:57
사진
법제화 앞둔 격동의 가상자산거래소 [서울=뉴스핌] 정광연 기자 = 디지털자산기본법 제정을 앞둔 가상자산 업계가 '빗썸 유령코인' 사태라는 대형 악재를 맞았다. 금융당국의 고강도 검사와 함께 거래소 대주주 지분 제한 도입 논의가 급물살을 타면서 업계 전반이 격랑에 휩싸였다. 1위 사업자 업비트를 운영하는 두나무의 네이버파이낸셜과의 합병 역시 규제 변수에 따라 향방이 갈릴 전망이다. 19일 금융권에 따르면 금융감독원은 빗썸의 60조원 규모 비트코인 오지급 사고에 대한 검사 기간을 이달 말까지 연장했다. 사고 직후 현장점검에 착수한 데 이어 '검사'로 전환한 만큼, 단순 실수 여부를 넘어 내부통제 전반을 들여다보겠다는 의지로 풀이된다.   [서울=뉴스핌] 윤창빈 기자 = 이재원 빗썸 대표가 11일 오전 서울 여의도 국회 정무위원회에서 열린 빗썸 비트코인 오지급 사고와 관련한 긴급 현안질의에 출석하고 있다. 2026.02.11 pangbin@newspim.com 검사 연장에 따라 추가적인 내부통제 미흡 사례가 드러날 가능성도 제기된다. 빗썸은 국회 정무위원회 현안질의에서 과거에도 유사한 오지급이 두 차례 있었으나 모두 회수했다고 밝힌 바 있다. 금융당국 차원의 제재는 불가피하다는 관측이 우세하다. 영업정지, 과태료는 물론 경영진 제재 가능성까지 거론된다. 진행 중인 기업공개(IPO) 역시 차질을 피하기 어려워 보인다. 다만 점유율 30%에 달하는 2위 사업자라는 점에서 인허가 취소 등 초강경 조치는 현실성이 낮다는 시각도 있다. 최종 제재 수위는 위법성 판단 수준에 따라 결정될 전망이다. 이번 사태는 업계 1위 두나무에도 불똥이 튀었다. 거래소 안전성 문제가 부각되면서 대주주 지분 제한(15~20%) 도입이 유력해졌기 때문이다. 현재 두나무 최대주주인 송치형 회장 지분은 25.5%다. 네이버파이낸셜과 1대3 비율로 합병할 경우 송 회장 19.5%, 네이버 17% 구조가 예상된다. 시장 점유율이 70%에 육박하는 두나무는 독과점 사업자라는 점에서 가장 강력한 규제가 예상된다. 그나마 지분제한이 20%로 결정되면 합병에는 영향이 없지만, 만약 15%로 적용될 경우 송 회장과 네이버 모두 지분을 강제 매각해야 하는 상황에 직면한다. 양사는 오는 5월말 각각 주주총회를 열고 합병안을 의결한다. 주식매수청구권 접수는 6월 11일, 주식교환 효력 발생일은 6월 30일이다. 대주주 지분제한 규제 수준에 따라 합병 여부도 결정될 전망이다. [서울=뉴스핌] 정광연 기자 = 2025.11.26 peterbreak22@newspim.com 4위 사업자 코빗은 규제 변수 속에서도 미래에셋그룹이 매각을 확정하며 새로운 최대주주를 맞이했다. 미래에셋이 비금융 계열사인 미래에셋컨설팅을 통해 인수한 코빗 지분은 92%, 매각대금은 1334억7988억원이다. 미래에셋이 인수한 지분은 기존 최대주주인 NXC(60.5%)와 SK플래닛(31.5%) 보유분이다. NXC가 2017년 65.3%를 913억원, SK플래닛(당시 SK스퀘어)이 2021년 33.2%를 873억원에 매입했다는 점을 감안하면 비교적 낮은 가격이라는 평가다. 다만 코빗의 시장 점유율이 0.5% 수준으로 1%에도 미치지 못한다는 점에서 거래소 사업 자체로는 큰 실익을 기대하기 어렵다는 관측이 우세하다. 미래에셋 역시 그룹 차원의 "가상자산 기반 미래 성장동력 확보"라는 차원의 투자라고 설명했다. 일각에서는 코빗 점유율이 너무 미미하다는 점에서 거래소 최대주주 지분제한 적용 대상에서 제외해야 한다는 지적도 나온다. 다만 금융당국과 정치권 모두 모든 사업자에 대한 동일 규제 방침을 유지하고 있어 추후 그룹 차원의 지분 재분배 가능성도 언급된다. 시장 점유율 2% 중반대인 3위 사업자 코인원도 매각설에 휩싸인 상태다. 다만 개인 보유 지분 19.14%와 개인 법인 지분 34.30%를 포함해 총 53.44%를 보유한 창업자인 차명훈 이사회 의장은 매각보다는 다수 사업자간의 협업을 모색중인 것으로 알려졌다. 이처럼 법제화를 앞둔 가상자산거래소들은 여전히 고객 자산 상황 사태를 해결하지 못한 고팍스를 제외하고는 대대적인 변화에 직면한 상태다. 빗썸 유령코인 사태로 인한 각종 규제 도입이 가장 큰 변수지만 법제화 이후 은행 등 외부 사업자와의 경쟁도 경쟁력에 영향을 미칠 주요한 요인으로 꼽힌다. 업권에서는 정부와 국회가 추진중인 디지털자산기본법에 관심을 집중하고 있다. 일정 수준의 규제가 불가피하다면 그 이상의 시장 활성화 방안도 함께 마련해야 한다는 지적이다. 거래소 관계자는 "일단 빗썸을 받은 징계 수위가 가장 중요하다. 이에 따라 후속 규제 수준도 결정될 확률이 높기 때문"이라며 "은행 등 안정적인 사업자가 시장에 참여해야 한다는 정부 방침이 가장 큰 변수라고 판단된다. 상반기에는 어느 정도 교통정리가 필요하다"고 밝혔다.   peterbreak22@newspim.com 2026-02-19 11:02
기사 번역
결과물 출력을 준비하고 있어요.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동