전체기사 최신뉴스 GAM
KYD 디데이
오피니언 외부칼럼

속보

더보기

[기고] 짚고 또 짚어야 할 AI 안전성

기사입력 : 2024년06월24일 08:33

최종수정 : 2024년06월25일 07:09

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

하민회 이미지21대표(코가로보틱스 마케팅자문)

AI, 과연 안전할까?

오픈AI가 'GPT-4o'를 공개하는 날 '오픈 AI의 영혼'이 회사를 떠났다. 오픈 AI의 공동창업자이자 수석과학자 그리고 5일 천하로 끝난 '올트만 축출 사태'의 주역이었던 일리아 수츠케버다.

챗GPT 개발에 핵심적인 역할을 한 일리아 수츠케버는 샘 올트만과 일론 머스크로부터 '오픈 AI의 영혼'으로 불렸다. 그러나 기술 신중론자인 수츠케버는 AI 개발 속도와 안전성 문제를 두고 올트만CEO와 이견을 보였고, 지난해 11월 올트만 해임에 앞장섰다가 이사회에서 물러났다. 수츠케버가 이끌었던 오픈AI의 안전 윤리담당부서 '수퍼얼라인먼트(Super Alignment)'팀은 'GPT-4o' 출시 전에 해체됐다. 

수츠케버는 최근 "안전한 초지능 구축"을 목적으로 하는 AI 스타트업 SSI(Safe Superintelligence)를 설립했다. 그는 "기본적으로 인류에게 대규모 피해를 주지 않는 안전한 초지능(SSI) 구축이야 말로 우리 시대의 가장 중요한 기술적 문제"임을 강조했다.

하민회 이미지21 대표.

AI기술의 안전성을 우려하는 업계 전문가와 석학들이 늘고 있다.

AI 안전성은 AI 시스템이 예측 가능한 방식으로 작동하고, 인간에게 해가 되지 않는 것을 의미한다. AI가 잘못된 결정을 내리거나 의도하지 않은 결과를 초래하지 않아야 한다.

최근 들어 이렇게 AI 안전성이 강조되는 건 크게 두 가지 이유 때문이다. AI 기술 발전 속도가 예상 범주를 넘어설 만큼 빨라지고 의료, 자율자동차, 금융 등 확산분야가 늘고 있다는 점 그리고 텍스트·이미지·오디오·비디오 등 다양한 형태의 데이터 정보를 동시에 이해해 사용자의 감정, 행동의 맥락, 주변 환경 등에 정확하게 반응하는 '멀티모달(Multi-modal)'기술이 일반화되면서 사용자와 AI의 상호작용의 접점이 현저하게 늘어났기 때문이다.

멀티모달의 안전성은 단순히 '세종대왕 맥북 사건'이나 '1일 1돌 섭취' 같은 엉뚱한 대답으로 웃어넘길 수 있는 차원의 문제가 아니다. 의료 분야의 AI가 잘못된 데이터를 학습하거나 알고리즘 오류로 잘못된 진단을 내릴 경우 환자의 생명이 위태로워질 수 있고 자율주행차가 교통 환경을 잘못 인식하거나 예기치 못한 상황에서 부적절하게 반응하면 치명적인 사고를 유발할 수도 있다. 그 만큼 정확성과 신뢰도가 확보되어야 부작용 없이 사용할 수 있다.

멀티모달 AI가 적용된 '스마트렌즈' 서비스. [자료=네이버]

AI 기술의 위험성을 경고하는 AI두머(doomer)의 대표주자인 'AI의 대부' 제프리 힌튼 교수는 최근 BBC와의 인터뷰를 통해 "AI의 안전에 대한 충분한 고려가 이뤄지지 않고 있다"고 지적했고 <사피엔스>의 저자 유발 하라리, 노벨경제학상 수상자 대니얼 카너먼 교수 등 세계적인 석학 25명도 최근 사이언스에 '급격한 진보 속 AI의 극단적 위험 관리'라는 글을 공동으로 기고해 AI 안전성에 대한 우려를 전했다.

오픈AI와 구글 전·현직 직원 13명이 '최첨단 AI에 대한 경고 권리'라는 성명을 통해 "AI가 인류에 전례 없는 혜택을 제공할 수 있는 잠재력을 갖고 있지만, 동시에 AI 기술로 야기되는 심각한 위험을 우리는 알고 있다"며, "이런 위험은 사회 불평등 심화부터 조작·가짜뉴스 등을 통환 사회 전복, 나아가 인류의 멸종을 초래하는 자율적인 AI 시스템의 통제 상실로 까지 이어질 것"이라고 지적했다. 또 "AI 글로벌 빅테크들이 AI의 위험성을 인지하고 있음에도 불구하고 이윤 추구 목표 때문에 적절한 조치나 제대로 된 감독을 하지 않고, 그 위험성을 원활하게 공유하지도 않는다"고 주장했다.

빅테크의 안전 불감증은 심각한 상태다. '안전'보다 '성능'에 초점을 맞추고 '시장 선점'에 매진한다. '선점' 한 자가 '독식'하는 AI 기술 속성 탓 이다.

오픈AI의 폭주가 대표적이다. 멀티모달 GPT-4o 출시 일정을 맞추기 위해 안전 윤리담당팀을 해체한 오픈AI는 GPT-4o 공개 직후 '스칼렛 요한슨 목소리 도용' 논란에 휩싸였다. 데이터 관리에 문제가 있음을 보여주는 사례였다.

오픈AI와 챗GPT 로고 [사진=뉴스핌DB]

해커가 GPT-4o를 탈옥시켜 끔찍한 답을 얻어내는 일도 발생했다. 탈옥(Jail breaking)은 정보기술(IT) 업계에서 AI 모델의 제한된 기능을 우회하여 AI가 본래 금지된 작업을 수행하게 만드는 행위로 주로 AI 시스템이 제공하지 않도록 설정된 정보나 서비스를 접근하거나, 비윤리적이고 위험한 행동을 하도록 유도하는 것을 의미한다. AI 모델의 윤리적 안전장치를 깨뜨리는 행위인 셈이다.

최근 해커 플리니 프롬프터(Pliny the Prompter)는 GPT-4o 모델을 탈옥시켜, 폭탄 제조 방법과 메스암페타민(필로폰) 제조 방법을 단계적으로 설명하게 하고, 자동차 탈취 방법, 욕설 등을 생성해 충격을 안겼다. GPT-4o가 안전장치가 취약한 상태로 세상에 나왔음을 보였기 때문이다.

AI 안전성을 높이려면 AI기업들의 진지하고 성실한 노력이 필요하다. 안전 윤리기준을 확립하고 몇 가지 사항에 대해선 지속적으로 업데이트 해 나가야 한다.

▲무엇보다 데이터 관리가 잘 되어야 한다. 편향되거나 잘못된 정보가 포함되지 않은, 다양하면서도 신뢰할 수 있는 데이터를 합법적으로 확보하고 사용해야 한다. ▲ AI 가 어떻게 결정을 내리는지 설명할 수 있는 알고리즘의 투명성도 확보되어야 한다. ▲ AI 시스템 도입 전 다양한 상황에서 테스트하고 검증함으로써 예기치 않은 오류나 위험을 최소화하는 노력도 기울어야 한다.

▲ 회사의 역량 중 많은 부분을 보안, 모니터링, 안전 등에 집중해야 한다. ▲ 아울러 AI 기업 직원들이 목소리를 낼 수 있도록 내부고발자에 대한 보호 조치가 마련돼야 한다. AI의 위험과 관련된 비판을 막는 계약 금지, 회사와 관계없는 독립 기관에 AI의 위험 관련 우려사항을 제기할 수 있는 익명 절차 마련, 내부고발자에 대한 보복 금지 등이 해당된다.

21일(현지시간) 마이크로소프트(MS) 연례 개발자 회의 '빌드'(Build)에서 연설하는 사티아 나델라 MS CEO. [사진=로이터 뉴스핌]

AI 안전성 확보는 마치 위험 물질을 다루듯 조심스럽고 신중하게 재차 확인하며 개발해가는 '정성과품이 드는 과정'이다.

이제 AI는 주어진 명령을 수행하는 데 그치지 않고 중간에 필요한 업무를 스스로 찾아내 결과물을 도출하는 'AI에이전트'로 진화하고 있다. 업계에선 AI의 여기서 한 단계 더 발전한 것을 '인공일반지능(AGI)'으로 보고 있다. AGI는 주어진 모든 상황에서 인간처럼 추론, 학습하고 문제를 해결하는 능력을 갖춘 AI로 굳이 인간의 명령이나 지시가 없이도 스스로 판단하고 일할 수 있다.

인구감소와 고령화로 인해 필연적으로 다가오는 축소사회는 어차피 AI와 로봇과 더불어 살아가게 될 것이다. 빅테크에게만 AI 안전성을 강제하긴 무리가 따른다. 국가적 규제가 시급하다. 여전히 안개속에 있는 'AI기본법' 제정부터 속도를 내야 한다.

인간보다 똑똑한 지적 존재를 만드는 일은 분명 위험한 일이다. 미래로 가는 AI라는 돌다리가 안전한지 백번 두드려 확인해도 모자람이 없지 않을까?

◇하민회 이미지21대표(코가로보틱스 마케팅자문) =△경영 컨설턴트, AI전략전문가△ ㈜이미지21대표, 코가로보틱스 마케팅자문△경영학 박사 (HRD)△서울과학종합대학원 인공지능전략 석사△핀란드 ALTO 대학 MBA △상명대예술경영대학원 비주얼 저널리즘 석사 △한국외대 및 교육대학원 졸업 △경제지 및 전문지 칼럼니스트 △SERI CEO 이미지리더십 패널 △KBS, TBS, OBS, CBS 등 방송 패널 △YouTube <책사이> 진행 중 △저서: 쏘셜력 날개를 달다 (2016), 위미니지먼트로 경쟁하라(2008), 이미지리더십(2005), 포토에세이 바라나시 (2007) 등

[뉴스핌 베스트 기사]

사진
해커에 행정망 뚫렸다...국정원 "피해사실 확인" [서울=뉴스핌] 이영종 통일전문기자 = 해커집단으로 추정되는 세력이 온나라시스템을 비롯한 정부 행정망에 침투해 자료를 열람한 것으로 파악됐다. 국가정보원은 17일 보도자료를 통해 공공부문 및 민간업체의 해킹피해 상황을 전하면서 "지난 7월 온나라시스템 등 공공ㆍ민간분야 해킹 첩보를 사전에 입수, 행안부 등 유관기관과 합동으로 정밀 분석을 실시해 해킹 사실을 확인하고 추가피해 방지를 위한 대응에 적극 나섰다"고 밝혔다. [서울=뉴스핌] 이영종 통일전문기자 = 국정원이 17일 정부행정망 온나라시스템에 대한 해킹 피해 사실을 공개하면서 설명을 위해 제공한 해커들의 침투 개요도. [사진=국정원] 2025.10.17 yjlee@newspim.com 국정원은 "해커는 먼저 다양한 경로로 공무원들의 행정업무용 인증서(GPKI)ㆍ패스워드 등을 확보한 것으로 보이며, 인증체계를 면밀히 분석한 뒤 합법적 사용자로 위장해 행정망에 접근한 것으로 밝혀졌다"며 "이후 인증서(6개) 및 국내외 IP(6개)를 이용해 2022년 9월부터 올해 7월까지 행안부가 재택근무를 위해 사용하는 원격접속시스템(G-VPN)을 통과, 온나라시스템에 접속해 자료를 열람했다"고 밝혔다. 점검 결과, 정부 원격접속시스템에 본인확인 등 인증체계가 미흡하고 온나라시스템의 인증 로직이 노출되면서 복수기관에 접속이 가능하였고 각 부처 전용 서버에 대한 접근통제가 미비한 것이 사고원인으로 드러났다. 이에따라 국정원은 해커가 악용한 6개 IP주소를 全 국가ㆍ공공기관에 전파ㆍ차단하는 등 해커의 접근을 막는 긴급 보안조치를 단행했다. 또 △정부 원격접속시스템 접속시 ARS 등 2차 인증 적용 △온나라시스템 접속 인증 로직 변경 △해킹에 악용된 행정업무용 인증서 폐기 △피싱사이트 접속 추정 공직자 이메일 비밀번호 변경 △각 부처 서버 접근통제 강화 △소스코드 취약점 수정 등의 조치를 통해 추가 해킹 가능성을 차단했다고 국정원은 설명했다. 다른 부처에도 해킹 정황은 드러났다. 국정원은 "A 부처 행정메일 서버 소스코드 노출이 확인되었는데 해킹에 악용될 우려가 있어 개발업체와 함께 소스코드를 분석해 보안이 취약한 것으로 판단되는 부분을 수정했다"며 "또 일부 패스워드가 노출된 B 부처 행정업무용 인증서(GPKI)의 패스워드를 변경했다"고 밝혔다. 서울 내곡동 국가정보원 본부 청사와 원훈석 [뉴스핌 자료사진] 해커가 구축한 피싱사이트에 접속한 것으로 보이는 180여개의 공직자 이메일 계정에 대해서도 해킹 가능성에 대비해 전체 비밀번호를 변경했으며 현재까지 이로 인한 별다른 피해는 확인되지 않았다고 국정원은 전했다. 또 민간의 경우 서버인증서 노출, 원격관리시스템(VPN) 접속 페이지 노출 등의 피해가 있어 해당업체에 위험성을 통보, 보안조치를 요청했으며 통신업체에 대해서는 과기정통부가 피해여부를 별도로 확인 중"이라고 덧붙였다. 이번 사태의 배후와 관련 국정원은 "미국 해커 잡지인 '프랙'은 이번 해킹을 자행한 배후로 북한 '김수키' 조직을 지목했다"고 설명했다. 하지만 "금번 해킹에서 확인된 해커 악용 IP주소 6종의 과거 사고 이력, GPKI 인증서 절취 사례 및 공격방식ㆍ대상의 유사성 등을 종합적으로 분석중이지만 현재까지 해킹소행 주체를 단정할만한 기술적 증거는 부족한 상황"이라고 강조했다. 또 "해커가 한글을 중국어로 번역한 기록, 대만 해킹을 시도한 정황 등이 확인 되었지만 국정원은 모든 가능성을 열어 두고 해외 정보협력기관 및 국내외 유수 보안업체와 협력해 공격 배후를 추적하고 있다"고 밝혔다. 김창섭 국정원 3차장은 "온나라시스템 등 정부 행정망은 국민의 생활과 행정 서비스의 근간인 만큼, 진행중인 조사를 조속히 마무리하고 재발방지를 위한 범정부 후속대책을 마련해 이행할 계획"이라고 보도자료를 통해 밝혔다.  yjlee@newspim.com 2025-10-17 13:31
사진
전 프로야구 선수 조용훈, 생방송 중 추락사 [서울=뉴스핌] 양태훈 기자 = 국가대표 출신 전직 프로야구 선수 조용훈(37)씨가 경기 부천시의 한 아파트 옥상에서 추락해 숨졌다. 17일 경기 부천 원미경찰서에 따르면 이날 오후 6시 24분께 부천시 원미구 소재 아파트 옥상에서 조씨가 추락했다는 신고가 112에 접수됐다. 신고를 받고 출동한 소방당국은 현장에서 이미 숨진 조씨를 발견해 경찰에 인계했다. 119 구급차. 사진은 기사와 무관. [사진=뉴스핌 DB] 조씨는 사고 당시 유튜브 라이브 방송을 진행하던 중이었던 것으로 알려졌다. 방송 중 옥상에서 이상 행동을 보이자 이를 지켜보던 시청자들이 즉각 경찰에 신고한 것으로 전해졌다. 조씨는 2006년 투수로 현대 유니콘스에 입단해 넥센 히어로즈 등에서 활약했으며, 2014년 은퇴했다. 은퇴 후에는 유튜버로 활동해왔다. 경찰은 범죄 관련성은 없는 것으로 판단하고, 정확한 사망 경위를 조사 중이다. dconnect@newspim.com 2025-10-17 22:07
기사 번역
결과물 출력을 준비하고 있어요.
기사제목
기사가 번역된 내용입니다.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동