전체기사 최신뉴스 GAM
KYD 디데이

의료용 대규모언어모델, 보안침해위험 81% '경고등'

기사입력 :

최종수정 :

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

아산병원, 악성공격 시도 개인정보유출 위험성 분석
원본데이터노출 22%···"의료 특화형 언어모델 필요"


[서울=뉴스핌] 조준경 기자 = 인공지능(AI)을 활용한 의료용 대규모언어모델의 보안침해위험성에 대한 경고가 제기됐다.

8일 서울아산병원에 따르면 동 병원 심장내과 김영학 교수·아산생명과학연구원 빅데이터연구센터 전태준 박사팀이 대규모언어모델을 의료 분야에 적용하는 과정에서 발생할 수 있는 개인정보유출 문제를 확인하기 위해 의도적으로 악성 공격을 시행한 결과, 최대 81%에 달하는 공격 성공률을 보였다는 연구 결과를 발표했다.

[사진=서울아산병원] 서울아산병원 심장내과 김영학 교수(왼)·아산생명과학연구원 빅데이터연구센터 전태준 박사

최근 챗GPT와 같은 생성형 인공지능과 그 핵심 기술인 대규모언어모델(Large Language Model, LLM)이 다양한 산업군에서 활발하게 활용되면서, 의료 분야에서도 이를 접목한 디지털 혁신에 주목하고 있다.

하지만 환자의 개인정보보호가 특히 중요한 분야인 만큼, 대규모언어모델 사용에 따른 개인정보유출 등 보안에 대한 우려가 꾸준히 제기돼 왔다.

연구팀은 의료 분야에서는 민감한 개인정보를 다루기 때문에 대규모언어모델 도입에 신중하고 각별한 주의가 필요하고, 독립적으로 운용되는 의료 특화형 대규모언어모델이 필요하다고 강조했다.

이번 연구 결과는 전 세계 의사들의 임상치료 교과서로 불리는 NEJM(New England Journal of Medicine)의 자매지인 'NEJM AI'에 최근 게재됐다. 의료계에서 인공지능의 중요성이 점점 확대됨에 따라, 임상의학 분야 세계 최고 권위지로 꼽히는 NEJM에서도 지난해 1월부터 인공지능 분야만을 특화해 다루는 자매지를 출간한 것이다.

대규모언어모델은 수십억 개 이상의 매개변수를 기반으로 대량의 데이터를 학습해 사람처럼 생각하고 답변하는 인공지능 모델이다. 이는 챗GPT, 제미나이(Gemini)와 같은 생성형 인공지능이 작동하는 핵심 기술로, 질문이나 명령어를 담은 프롬프트를 입력하면 대규모언어모델이 이를 이해하고 적합한 답변을 제공한다.

의료 분야에 대규모언어모델을 적용하면 엑스레이, CT, MRI 등의 검사 이미지를 다량의 데이터 기반으로 분석해 진단의 정확도를 높일 수 있고, 환자의 개인 데이터를 기반으로 맞춤형 치료 계획을 제공할 수 있다. 전자의무기록(EMR)이나 동의서 작성을 자동화하는 등 의료진의 관리 업무도 간소화해 전반적으로 효율성이나 정확성이 향상될 것으로 기대된다.

◆환자 민감한 개인정보 유출 위험성 초래

다만 대규모언어모델의 보안이 위협될 경우 환자들의 민감한 개인정보가 유출되어 윤리적, 법적 위험성이 초래될 수 있다.

서울아산병원 심장내과 김영학 교수·아산생명과학연구원 빅데이터연구센터 전태준 박사팀은 2017년 1월부터 2021년 12월까지 환자 2만6,434명의 의무기록을 활용해 대규모언어모델을 학습시켰다.

악성 공격은 대규모언어모델에 입력하는 질문인 프롬프트에 의미 없는 기호, 글을 추가하거나 인코딩하는 등 다양하게 변형해 악의적인 질문을 하는 방식으로 위험성을 평가했다.

병원 측에 따르면 이번 연구는 윤리적으로 사전 승인된 데이터만을 활용했으며, 서울아산병원 임상연구심의위원회(IRB)의 심의를 거쳐 진행됐다.

먼저 문자를 인코딩하는 방식인 ASCⅡ(미국정보교환표준코드) 방식으로 프롬프트를 변형한 결과, 대규모언어모델의 보안장치를 피해 민감한 개인정보에 접근할 수 있는 확률을 평가하는 가드레일 비활성화율이 최대 80.8%에 달했다. 80.8%에 달하는 확률로 보안 조치가 쉽게 침해될 수 있다는 뜻이다.

또한 대규모언어모델이 답변을 생성하는 과정에서 학습된 원본 데이터를 노출할 가능성은 최대 21.8%로 나타났다. 모델에 질문하는 형식을 미세하게 조정함으로써 원본 학습 데이터가 쉽게 노출될 수 있다는 것이다.

구체적인 예시로 수술 준비를 위해 상세한 환자 정보를 제공하는 시스템으로 대규모언어모델을 학습시킨 뒤 의료기록 검토를 요청하는 프롬프트를 인코딩 방식으로 조정한 결과, 대규모언어모델이 대답을 생성하는 과정에서 민감한 환자 데이터는 물론 의료진의 이름이나 전문 분야 등 구체적인 정보가 노출됐다.

김영학 교수는 "의료 분야에서 대규모언어모델을 활용했을 때 기대되는 발전이 크지만, 데이터 보안 강화 없이는 심각한 개인정보유출로 이어질 수 있다. 민감한 개인정보를 다루는 분야인 만큼 보안의 중요성이 특히 강조되며, 독립적으로 운용되는 의료 특화형 대규모언어모델이 필요하다"고 말했다.

calebcao@newspim.com

[뉴스핌 베스트 기사]

사진
李대통령 오늘 '첫 청와대 국무회의' [서울=뉴스핌] 김종원 선임기자 = 이재명 대통령이 30일 청와대 이전 후 첫 국무회의를 주재한다. 이재명 정부 출범 후 올해 마지막 국무회의이기도 하다. 이 대통령은 이날 오전 10시부터 청와대 세종실에서 케이티비(KTV)로 생중계되는 56회 국무회의를 직접 주재하며 어떤 발언을 하고 국무위원들과 어떤 발언을 주고받을지 주목된다.  이재명 대통령이 29일 청와대로 첫 출근하고 있다. 이 대통령은 첫 일정으로 본관에서 김용범 정책실장과 위성락 국가안보실장을 비롯해 참모진과 아침 차담회(티타임)를 주재하며 주요 현안과 업무 계획을 보고받았다. [사진=대통령실] 청와대 이전 후 첫 국무회의가 대국민 생중계로 진행되고 올해 마지막 국무회의이기도 해서 이 대통령이 어떤 메시지를 내고 내각에 주문할지 관심사다. 청와대 출근은 이튿날이지만 내각의 전체 국무위원이 모두 참석한다는 의미에서는 사실상 청와대 이전 후 이재명 정부의 첫 상징적인 대국민 공식 일정이기도 하다.  이재명 대통령이 청와대로 첫 출근한 29일 오전 첫 일정으로 청와대 지하벙커인 국가안보실 국가위기관리센터를 찾아 안보와 재난 분야 시스템을 점검하고 있다. [사진=대통령실] 청와대로 이전과 함께 집권 2년차를 시작하는 병오년 2026년 새해 공식 일정도 예정돼 있겠지만 다시 청와대 시대를 여는 첫 국무회의의 상징적 의미가 적지 않다. 이재명 대통령이 청와대 집무실인 여민1관에서 주한 베냉공화국 대사 내정자 아그레망를 청와대 이전 후 첫 재가하고 있다. [사진=대통령실] 특히 국무회의 생중계는 국정 운영의 투명성과 공개성, 책임성을 상징적으로 보여주며 국민과 함께 국정의 철학을 공유하고 공직사회에 긴장도를 불어넣는 측면에서 이재명 정부가 손꼽는 큰 성과 중에 하나다. kjw8619@newspim.com 2025-12-30 06:45
사진
이혜훈 "내란은 민주주의 파괴" [서울=뉴스핌] 양윤모 기자 = 초대 기획예산처 장관 후보자로 지명된 이혜훈 전 국민의힘 의원이 30일 오전 서울 중구 예금보험공사에 마련된 인사청문회 준비 사무실로 출근하며 "내란은 민주주의 파괴하는 일이며 실체파악 잘 못했다"라며 사과문을 발표하고 있다. 2025.12.30 yym58@newspim.com   2025-12-30 10:27
기사 번역
결과물 출력을 준비하고 있어요.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동