[서울=뉴스핌] 양태훈 기자 = 오픈AI가 사람의 음성을 학습해 이를 모방하는 AI 도구 '보이스 엔진(Voice Engine)'을 공개했다. 보이스 엔진은 15초 분량의 음성 샘플만으로 원래 화자의 목소리와 거의 구분하기 어려울 정도로 유사한 음성을 생성할 수 있는 기술이다.
오픈AI는 지난 29일 홈페이지를 통해 "회사는 지난 2022년 말 보이스 엔진을 처음 개발한 이후, 이를 대화형 AI 챗GPT의 음성 인식 및 읽기 기능과 TTS(Text to Speech) 변환 API 등에 활용해왔다"고 전했다.
보이스 엔진은 어린이 교육용 음성 콘텐츠 제작을 비롯해 개인 맞춤형 음성 응답 생성, 다국어 번역 음성 콘텐츠 제작 등에 활용될 수 있다. 의료 분야에서는 언어 장애 환자를 위한 치료 도구나 장애인 소통 보조 기기 등에 사용할 수 있다.
[사진=오픈AI 홈페이지] |
다만, 오픈AI는 보이스 엔진이 미디어, 엔터테인먼트 등 다양한 분야에 활용될 수 있지만, 악용될 경우 심각한 부작용을 초래할 수 있다는 점에서 다양한 이해관계자들의 의견을 수렴해 안전장치를 마련한다는 계획이다. 실제로 올해 1월 미국에서는 민주당 대선 후보를 뽑는 프라이머리(예비경선)를 하루 앞두고, 조 바이든 미국 대통령을 사칭한 가짜 전화가 유권자들에게 걸려와 투표 거부를 독려하는 음성 조작 사건이 일어난 바 있다.
오픈AI 측은 "보이스 엔진을 테스트하는 파트너들은 당사자의 동의나 법적 권리 없이 개인이나 단체를 사칭하는 것을 금지하는 사용 정책에 동의했다"며, "파트너는 자신이 듣고 있는 음성이 AI에서 생성된 것임을 명확하게 공개해야 한다"고 밝혔다.
dconnect@newspim.com