전체기사 최신뉴스 GAM 라씨로
KYD 디데이
산업 ICT

속보

더보기

감정까지 학습하는 KT의 마이AI보이스...지금 내 감정은 뭐게?

기사입력 : 2023년06월11일 09:00

최종수정 : 2023년06월11일 09:00

사용자의 톤과 말투 학습해 합성하는 마이AI보이스
한국어로 녹음해도 5개 국어로 변환 가능

[서울=뉴스핌] 조수빈 기자 = 금요일 퇴근을 앞두고 힘이 빠진 목소리를 인공지능(AI)에 학습시켰더니 실제로 평소보다 차분한 기자의 목소리가 컴퓨터에서 흘러나왔다.

직접 녹음을 하고 음성을 확인하며 비슷한 분위기의 목소리를 학습시킨다. KT의 AI보이스 스튜디오 화면 갈무리. [서울=뉴스핌] 조수빈 기자 2023.06.09 beans@newspim.com

KT의 인공지능(AI)보이스의 차별점인 '감정 더빙'이다. 톤과 목소리 크기 등을 통해 사용자의 감정을 분석해 목소리를 합성해낸다. AI보이스 제작은 간단하다. 원하는 스크립트를 선택하고 주어진 30개의 문장을 읽고 난 후 친절함, 다정함, 귀여움 등 분위기를 선택하면 AI가 녹음된 감정에 맞는 목소리를 합성해 출력하는 방식이다.

30여개의 문장을 다 읽는데 걸린 시간은 10여분. 보이스를 올려놓고 하루가 지나니 'AI 조수빈'이 읽는 스크립트를 체험할 수 있었다. 감정 구현뿐 아니라 외국어 지원도 된다. 한국어만 녹음해도 영어, 중국어, 일본어, 스페인어로 말하는 내 목소리를 들을 수 있다. 직접 써보니 전혀 할 줄 모르는 스페인어는 제법 수준급으로 들린다.

30문장은 최소 단위로, 더 많은 문장을 녹음할수록 더 자연스러운 문장 합성이 가능해진다. 한층 더 정확한 평가를 위해 밀리의 서재에 공개된 '돈과 나의 일' 오디오북을 통해 김대훈 MBC 아나운서의 AI보이스를 들어봤다. AI보이스는 평소 아나운서가 구사하는 톤, 발음, 음역대와 매우 유사해 이질감이 없었다. 

최근 공개된 밀리의 서재의 아나운서 AI보이스 오디오북에도 KT의 기술이 들어갔다. 김대호 MBC 아나운서의 묵직하고 진중한 음성으로 '돈과 나의 일'을 들으니 신뢰도가 더 높아지는 기분이 들었다.

실제로 KT는 정보, 에세이, 자기계발 면에서 아나운서의 목소리에 대한 선호도가 높다고 설명했다. KT의 AI보이스는 이렇게 사용자들이 친숙한 일명 셀럽들의 보이스를 활용해 인공지능에 대한 사용자의 거부감을 낮추고 있다.

AI보이스는 현재 오디오북, 도슨트, 유튜브 시장을 중심으로 진출 중이다. 가장 큰 이유는 '효율성'이다. 시간과 비용 측면 모두 AI보이스가 월등하다.

오디오북 하나 당 재생시간은 보통 4시간을 초과한다. 성우가 이 완독본을 직접 녹음하기 위해서는 최소 일주일의 시간이 걸린다. 성우는 30문장 정도의 녹음으로 자신의 AI보이스를 제작할 수 있고, 이후 작업은 텍스트를 입력하여 AI 음성 합성으로 작업한다.

또한 사람이 직접 녹음하게 되면 실수, 오류 등으로 피로도가 누적돼 동일한 질의 작업에 한계가 생긴다는 점도 극복한다. 일주일에는 4권 정도의 책을 제작할 수 있을 정도로 시간과 비용이 단축됐다. 성우나 제작 페이지에 따라 차이는 있겠지만 3분의 1에서 5분의 1 정도로 시간과 비용이 단축되는 추세다.

녹음을 끝내고 나면 언어와 성별, 분위기를 지정해 학습을 고도화한다. KT의 AI보이스 스튜디오 화면 갈무리. [서울=뉴스핌] 조수빈 기자 2023.06.09 beans@newspim.com

◆유튜버도 주목하는 시장...더빙까지 넘본다

AI보이스의 활용 가능성은 무궁무진하다. 지금까지는 해외에 파견된 장병의 가족을 위해 장병들의 AI 목소리로 자녀들에게 동화책을 읽어주는 서비스, 2022 카타르 월드컵 공식 응원가 '더 뜨겁게, 한국'의 고(故) 유상철 감독 목소리 복원 등이 눈길을 끌었다.

권진조 KT AI보이스 기획 운영 PM은 "최근에는 해외 진출을 준비하는 유튜버의 문의가 늘었다. 내 목소리로 직접 다국어 서비스를 제공한다는 측면에서 경쟁력이 있다고 보는 듯 하다"고 설명했다. 방송인이자 유튜버인 파비앙 역시 KT '마이AI보이스'를 사용해 보는 콘텐츠 영상을 올리기도 했다.

자막보다 더빙이 활성화된 해외 콘텐츠 시장도 노려볼 만하다. 노진우 KT AI플랫폼사업 팀장은 "기존에는 배우와 비슷한 톤과 목소리의 성우를 섭외해야 한다는 어려움이 있었지만 AI보이스를 활용하면 배우의 목소리를 학습한 AI가 더빙을 대신할 수 있다"고 설명헀다.

한편 목소리라는 고유한 데이터를 사용하기 때문에 악용될 수 있다는 우려도 있다. KT는 타인의 음성을 마음대로 가져다 쓸 수 있다는 부작용을 막기 위해서 주어진 스크립트를 '실시간'으로 읽는 방식을 선택했다. 용도별로 다양화된 스크립트를 고객이 실시간으로 읽어야 하며, 타인의 녹음 파일을 확보해서 학습시킬 순 없다. 이용약관, 운영정책에도 사용자 본인의 목소리만 사용할 것을 명시했다.

노 팀장은 "AI가 더 이상 인간을 따라하는 불쾌하거나 딱딱한 서비스가 아니라 다양한 곳에서 활용될 수 있는 가능성이라고 본다"며 "시장이 성장하면서 KT의 보이스스튜디오가 대한민국을 대표하는 오디오 콘텐츠 플랫폼으로 자리잡을 수 있게 하겠다"고 말했다.

beans@newspim.com

[뉴스핌 베스트 기사]

사진
한덕수, 대선 출마 여부에 "노코멘트" [서울=뉴스핌] 이나영 기자=  한덕수 대통령 권한대행 국무총리는 미국의 관세 부과 조치에 대해 "맞대응하지 않을 것"이라는 입장을 밝혔다. 한 대행은 20일(현지시간) 영국 일간 파이낸셜타임스(FT)와의 인터뷰에서 "양측이 모두 윈-윈(win-win)할 수 있는 방법을 찾기 위해 노력할 것"이라고 전했다. 그는 "한국을 지금의 모습으로 만드는 데는 미국의 역할이 매우 컸다"며 "한국전쟁 이후 미국은 원조, 기술이전, 투자, 안전 보장을 제공했다. 이는 한국을 외국인에게 매우 편안한 투자 환경으로 만드는 데 도움이 됐다"고 강조했다. 이어 한 대행은 미국과의 통상 협상에서 한국의 대미 무역 흑자 축소 방안을 논의할 수 있다고 밝혔다. [서울=뉴스핌] 이길동 기자 = 한덕수 대통령 권한대행 겸 국무총리. 2025.03.24.gdlee@newspim.com 한 대행은 "협상에서 미국산 액화천연가스(LNG)와 상업용 항공기 구매 등을 포함해 대미 무역 흑자를 줄이기 위한 방안을 논의할 수 있다"며 "조선업 협력 증진도 미국이 동맹을 강화하는 데 도움이 될 것"이라고 밝혔다. 또한 FT는 "비관세 장벽을 낮추는 방안도 논의될 수 있다"고 한 대행이 언급했다고 전했다. 한 대행은 협상 과정에서 "일부 산업이 어려움을 겪을 수 있다"면서도, 양국 간 무역의 자유가 확대되면 "한국인의 이익도 증가할 것"이라고 밝혔다. FT는 방위비 분담금 재협상 여부에 대해서는 사안에 따라 재협상에 나설 수 있음을 시사했다고 전했다. 한편, 한 대행은 6·3 대통령선거 출마 여부에 대해 "아직 결정을 내리지 않았다"며 "노코멘트"라고 답했다. nylee54@newspim.com 2025-04-20 13:43
사진
호미들 중국 한한령 어떻게 뚫었나 [베이징=뉴스핌] 조용성 특파원 = 중국의 '한한령'(限韓令, 중국의 한류 제한령)이 해제되지 않은 상황에서 우리나라 가수가 중국에서 공연을 한 사실이 알려지며 그 배경에 관심이 모이고 있다. 18일 베이징 현지 업계에 따르면 우리나라 3인조 래퍼 '호미들'이 지난 12일 중국 후베이(湖北)성 우한(武漢)시에서 공연을 펼쳤다. 반응은 상당히 뜨거웠다. 중국인 관객들은 공연장에서 호미들의 노래를 따라 부르기도 하고, 음악에 맞춰 분위기를 만끽했다. 공연장 영상은 중국의 SNS에서도 퍼져나가며 관심을 받고 있다. 우리나라 국적 가수의 공연은 중국에서 8년 동안 성사되지 못했다. 세계적인 성공을 거둔 BTS도 중국 무대에 서지 못했다. 때문에 호미들의 공연이 중국 한한령 해제의 신호탄이 아니냐는 분석도 나오고 있다. 호미들 공연이 성사된 데 대해 중국 베이징 현지 문화콘텐츠 업계 관계자들은 공연이 소규모였다는 점과 공연이 성사된 도시가 우한이었다는 두 가지 요인을 지목했다. 호미들이 공연한 우한의 우한칸젠잔옌중신(武漢看見展演中心)은 소규모 공연장이다. 호미들의 공연에도 약 600여 명의 관객이 입장한 것으로 전해진다. 중국에서 800명 이하 공연장에서의 공연은 정식 문화공연 허가를 받지 않아도 된다. 중국에서는 공연 규모와 파급력에 따라 성(省) 지방정부 혹은 시정부가 공연을 허가한다. 지방정부가 허가 여부를 판단하지 못할 경우 중앙정부에 허가 판단을 요청한다. 한한령 상황에서 우리나라 가수의 문화공연은 사실상 금지된 상황이었다. 호미들의 공연은 '마니하숴러(馬尼哈梭樂)'라는 이름의 중국 공연기획사가 준비했다. 이 기획사는 공연허가가 아닌 청년교류 허가를 받아서 공연을 성사시킨 것으로 전해지고 있다. 이와 함께 우한시의 개방적인 분위기도 공연 성사에 큰 역할을 한 것으로 평가되고 있다. 우한에는 대학이 밀집해 있으며 청년 인구 비중이 높다. 때문에 우한에는 다양한 문화 콘텐츠에 대한 수요가 높다. 게다가 젊은 층이 많은 만큼 우한에서는 실험적인 정책이 시행되어 왔다. 우한시는 중국에서는 최초로 시 전역에서 무인택시를 운영하게끔 허가하기도 했다. 리스크를 감수하면서 파격적인 정책이 발표되는 우한인 만큼, 한한령 상황임에도 호미들의 공연이 성사됐을 것이라는 평가가 나온다. 베이징의 한 문화업체 관계자는 "우한시가 개방적이라는 점에도 불구하고, 호미들의 공연은 소극적인 홍보 활동만이 펼쳐지는 한계를 보였다"며 "공연기획사 역시 한한령 상황을 의식하지 않을 수 없었을 것"이라고 설명했다. 또 다른 현지 문화콘텐츠 업체 관계자는 "현재로서는 한국의 최정상급 가수가 대규모 콘서트를 개최하는 것은 사실상 불가능하다"며 "어서 빨리 한한령이 해제되기를 기대하고 있지만, 한한령이 해제될 것이라는 시그널은 아직 중국 내에서 감지되고 있지 않다"고 언급했다. 호미들의 중국 우한 공연 모습 [사진=더우인 캡처] ys1744@newspim.com 2025-04-18 13:10
안다쇼핑
Top으로 이동