전체기사 최신뉴스 GAM 라씨로
KYD 디데이

"이제는 데이터"...AI시장, 데이터 신뢰성 확보 각축전

기사입력 : 2023년03월21일 17:21

최종수정 : 2023년03월21일 17:21

신뢰성 높아진 GPT-4로 데이터 시장 중요성 더 커져
유럽선 데이터 기준 엄격..."평가기술 표준화" 목소리

[서울·대전=뉴스핌] 김수진 기자 = '인공지능(AI)은 학습한 데이터만큼만 똑똑하다'

AI 편향성을 없애기 위한 연구가 활발하다. AI 편향성 문제는 상용화를 가로막는 큰 장벽이기 때문이다. 과거 AI가 흑인을 고릴라로 착각하거나, 성차별적인 발언을 하는 등 사회적 문제를 일으키면서 오히려 관련 산업발전이 잠시 후퇴하는 부작용을 일으킨 뼈 아픈 과거가 있다. 실제로 우리나라에서는 성차별적 발언한 '이루다'를 개발한 스캐터랩이 1억300만원의 과징금·과태료를 부과받으며 사회적으로 큰 비난받기도 했다.

하지만 지난해 연말 등장한 챗GPT가 전 세계적으로 큰 반향을 일으키면서 AI에 대중의 시선이 쏠렸다. 때문에 또 다시 불어온 AI에 대한 시장의 관심을 놓치지 않기 위해 시장에서는 편향성 제거에 열을 올리고 있다.

[사진 = 셔터스톡]

윤리성 '더' 확보한 GPT-4

미국 현지시각 지난 14일 오픈AI가 챗GPT를 넘어서는 GPT-4를 출시하면 뜨거운 관심을 받고 있다. GPT-4는 챗GPT(GPT-3.5)와 비교해 인식 및 추론능력이 향상됐으며 이미지 입력 인식 능력, 대화 메모리 향상 등의 기능을 탑재했다. 기존 GPT-3.5와 비교해 요구한 질의에 대한 문제를 보다 창의적이고 정확하게 작성하며 작문 능력이 크게 향상됐다.

오픈AI는 특히 GPT-4가 기존보다 신뢰성을 확보했다고 주장했다. 사용자의 악의적인 질의에 대한 대응훈련을 통해 기존보다 윤리적인 측면의 답변을 할 수 있도록 진화했다는 것이다. 오픈AI 샘 알트먼 CEO는 "GPT-4가 기존 대비 82% 더 윤리적으로 안전하고 40% 더 정확하다"며 설명했다.

소프트웨어정책연구소도 얼마 전 발간한 AI 브리프 특집호에서 "현재 챗봇은 사용자의 악의적인 이용에 의해 쉽게 오염되는데 GPT-4는 기존 대비 면역력이 강화됐다"며 "기존 제품에 비해 윤리성을 확보했다"고 평가했다.

뉴스핌 DB. 2022.08.24 nn0416@newspim.com

세계는 데이터 신뢰성 전쟁 중...한국은?

산업계에서는 GPT-4의 윤리성 확보가 이슈됨에 따라 데이터 시장 중요성이 더욱 커질 것으로 내다봤다. 미국 통신사 블룸버그는 현재 경기 전망리포트 콘텐츠 30%를 AI에 의존하고 있는데 26년에는 90%이상 늘어날 것으로 전망했다.

국내 한 AI기업 관련 연구원은 "그간 AI 데이터 중요성은 관련 업계 내에서나 이슈돼 왔는데 챗GPT가 전세계적으로 히트치면서 대중들까지도 질 좋은 데이터가 필요하다는 걸 알게 됐다"며 "지금이 데이터 관련 산업을 일으키기에 적기"라고 강조했다.

하지만 막상 국내 데이터 시장을 살펴보면 초라한 상황이다. 과학기술정보통신부가 발표한 현재 우리나라 데이터산업 시장 규모는 2021년 기준 20조 24억원 규모로, 미국의 7.0%, 유럽연합의 16.4%에 불과하다. 지난 문재인 정부 시절 데이터댐' 사업에 수 조원을 투입했지만 아쉬운 성적표다. 구축한 데이터도 대부분이 행정·공공데이터에 치우쳐 있고 제품 품질도 보장할 수 있는 수준이 아니라는 지적도 일고 있다.

AI를 현장에서 활용 중인 산업계에서 데이터 신뢰성 확보는 시급한 문제다. 충북 청주에서 드론 관련 벤처기업을 운영 중인 한영운(31) 대표는 "사실상 현재 정부가 축적한 데이터를 그대로 AI에 적용하기에는 아무래도 위험부담이 있다"며 "이제라도 AI 편향·오류를 최소화하는 표준 기술이나 제도 마련이 있어야 시장이 빠르게 성장할 것"이라고 말했다. 

의료계에서도 AI 데이터 품질 확보가 필수라고 입을 모은다. 지난달 16일 열린 빅데이터임상활용연구회 세미나에서 윤덕용 연세대 의과대학 의생명시스템정보학교실 교수는 "의료 AI 모델 성패는 양질의 데이터에 달렸다"며 "의료 AI모델이 특정 편향된 데이터만 학습할 경우 의료 불평등까지 야기할 수 있다"고 지적하기도 했다. 그는 "양질의 데이터 축적이 중요하다"며 "국민을 대표하는 양질의 표준화된 데이터 확보가 중요하다"고 강조했다.

이미 선진국에서는 AI 데이터 품질 확보에 발빠르게 나선 상태다. 현재 유럽의회가 2025년 제정 목표로 인공지능법 도입을 검토 중인데, 데이터 편향·오류 방지를 의무화하는 내용을 세세하게 규정하고 있다. 관련 법을 어기거나 금지된 분야에 AI기술을 접목할 경우 최대 3000만 유로, 또는 세계 매출액의 6%에 달하는 벌금을 물도록하고 있다.

하지만 국내 도입 준비 중인 AI 관련 법안은 데이터 품질이나 편향 방지에 대해 '언급만' 한 상태로 봐도 무방하다는 지적이다.

미국 워싱턴주 리치먼드의 마이크로소프트(MS) 본사에서 인공지능(AI) 챗봇이 탑재된 검색엔진 빙(Bing)을 체험해보는 시민. 2023.02.07 [사진=블룸버그]

"AI데이터 평가 기술 표준화 필요"

때문에 AI 편향을 막기 위해 AI학습 데이터 개발 및 활용에 정부가 적절히 나서야 한다는 주장이 힘을 얻고 있다. 시장이 폭발적으로 성장함에 따라 AI 기업과 개발자 '양심'에만 맡겨놓을 수 없다는 지적이다.

정부도 관련 산업 활성화를 위해 나서야 한다는데 공감하고 있다. 과기정통부는 AI 부작용 등 제도적 보완을 마련하는 내용으로 2024년부터 5년간 AI 연구에 3000억원을 투입한다는 계획이다. 엄열 과기정통부 인공지능기반정책관은 지난 7일 열린 2023 대한민국 AI토크 콘서트에서 "AI의 편향된 정보나 환각이 위험할 수 있다"며 "오류가 있는 언어 모델 한계를 뛰어넘는 AI 기술 발전을 위해 지원을 늘리겠다"고 말했다.

장진철 소프트웨어정책연구소 디지털통계센터 선임연구원도 "최근 AI는 모델 성능보다 데이터 역할을 강조하는 경향이 커졌다"며 "때문에 데이터관리 체계에 대한 지원이 중요하다"고 밝혔다. 장 선임연구원은 "AI에 활용되는 데이터 최적화와 관리 역량이 AI 시장 확산의 필수요건으로 대두되고 있다"며 "관련 인력 양성 방안이 정부-산업-교육계 협력을 통해 논의돼야 한다"고 강조했다.

산업계에서는 AI데이터 평가 기술 표준화가 필요하다는 목소리가 커지고 있다. AI 데이터를 평가할 기준을 바로 세워달라는 요구가 거세다. 소프트웨어 공학 전문기업 씽크포비엘 박지환 대표는 "객관적인 검증법 없이 단지 담당자의 경험이나 주관에 의존한 검사방법이 문제"라고 지적하며 "NIA가 자체 발간한 가이드가 있지만 '다양하게 수집한다'는 모호한 기준으로 현실적이지 못했다. 데이터의 질적 수준을 검증할 현실적이고 올바른 방법이 없는 상황"이라고 꼬집었다.

그러면서 박지환 대표는 "공공데이터 등 가치를 판단하고 개선점을 찾기 위한 AI 데이터 평가 기술 표준화가 필요하다"며 "지금같은 산업 전환기에 AI 데이터 신뢰성 기준을 빠르게 정립해 AI 시장에서 뒤처지지 않도록 정부와 산업, 학계 모두 힘을 합쳐야 할 시점"이라고 강조했다.

nn0416@newspim.com

[뉴스핌 베스트 기사]

사진
LH, 올 매입·전세임대 9만가구 공급 [서울=뉴스핌] 최현민 기자 = 한국토지주택공사(LH)가 올해 총 19만가구 이상의 공공주택과 2만8000가구 규모 공공택지 공급에 나선다. 또 건설경기 회복을 위해 21조6000억원의 투자를 집행하고 재원조달 방식 등을 다양화해 재무여건 체질을 개선한다. 한국토지주택공사(LH)가 올해 21만 8000+α가구 규모의 주택 공급에 나선다. 사진은 이한준 한국토지주택공사(LH) 사장이 5일 서울 종로구 국립현대미술관에서 열린 서계동 복합문화단지 조성사업 업무협약식에서 인사말을 하고 있는 모습 [사진=뉴스핌DB] 23일 한국토지주택공사(LH)는 이같은 내용을 담은 '2025년도 업무계획'을 발표했다.  우선 핵심 업무인 주택 공급에 집중한다. 10만가구 사업승인과 매입·전세임대 9만가구 등 총 19만가구 이상의 공공주택을 공급한다. 동시에 민간 주택건설 활성화를 위해 2만8000가구 규모의 공공택지를 조성한다. 주택 착공물량은 지난해(5만가구) 대비 20% 증가한 6만가구를 추진하고 지난해 8·8 주택공급 활성화 방안에 포함된 서울서리풀 등 5만가구 규모의 사업지구 역시 인허가 일정을 최대한 단축해 안정적 공급 기반을 마련할 계획이다. 도심 내 신속한 주택공급과 비아파트 시장 정상화를 위해 신축매입임대 5만가구 이상을 공급하고 전세사기 피해자 회복 지원을 위해 피해 주택 7500가구를 매입한다. 올해 주택 승인물량의 37%를 청년·신혼·고령자에게 공급하고 출산가구 우선공급(통합공임)과 실버스테이 등 새로운 유형의 시니어 주택을 통해 가속화되는 저출산·고령화 문제에도 적극 대응할 계획이다. 아울러 쪽방·고시원·반지하 거주자의 주거 상향 지원을 지속하고 예술인 등 다양한 수요층에 부응한 특화형 매입임대도 확대한다. 공공주택은 합리적 가격의 고품질을 보장한다. 무엇보다 최근 급등한 주택 분양가격을 낮춰 국민들의 내 집 마련을 돕는다. 이를 위해 사업지구별 목표 원가를 설정해 관리와 검증을 강화하고 가처분면적 확대와 사업일정 단축으로 조성원가를 인하해 합리적인 가격에 공급한다는 계획이다. 공공주도의 기술개발을 통해 민간기업을 선도할 수 있도록 모듈러주택 표준평면 개발 등 OSC 공법을 올해부터 단계적으로 고도화하고 LH가 개발한 층간소음 1등급 설계기준과 국내 최대규모의 층간소음 시험시설(데시벨35랩)을 활용해 주택 품질 혁신을 추진한다. 관련 예산은 조기 집행한다. 전체 공공기관 투자계획(66조원)의 33% 수준인 21조6000억원을 차질 없이 집행할 계획이다. 특히 상반기 역대 최대 규모인 57% 이상의 투자를 집행한다. 지역 건설경기 회복을 위해 지방 준공 후 미분양 아파트 3000가구를 매입하고 1기 신도시 특별정비계획 수립, 용인 반도체 국가산단 조성 등도 차질없이 추진한다. 손실 최소화 등 재무여건을 안정적으로 관리하기 위해 재원조달 방식도 개선한다. 광명시흥 등 대규모 사업지구에 LH와 기금이 함께 출자하는 신도시 리츠를 설립해 사업에 따른 재무부담을 완화한다. 또 토지 패키지형 공모 등 지구별 특성과 시장 여건에 맞춘 다양한 매각 방식을 도입해 판매여건 개선과 대금 회수를 촉진할 예정이다. 이와 함께 임금 직접지급 관리를 강화하고 설게 등 공모에 참여하는 외부 심사위원의 정성평가 비중을 축소해 업체 선정의 공정성을 제고한다. 이한준 LH 사장은 "국민의 삶과 국가 경제가 어려운 만큼, 올해도 신속한 주택공급과 투자집행 등 LH가 맡은 역할을 충실히 이행할 것"이라며 "선도적인 공적 역할을 통해 확실한 정책성과를 창출하여 국민 주거안정을 지원하고 국가 경제회복의 마중물 역할을 다하겠다"고 말했다. min72@newspim.com 2025-02-23 20:07
사진
헌법재판관들 "공정" 49.3% "불공정" 44.9% [서울=뉴스핌] 이바름 기자 = 윤석열 대통령의 탄핵 심판을 맡은 헌법재판관들의 공정성을 묻는 질문에 '공정하다' 49.3%, '공정하지 않다' 44.9%로 팽팽했다. 종합뉴스통신사 뉴스핌이 미디어리서치에 의뢰해 지난 18~19일 전국 만 18세 이상 남녀 1000명을 대상으로 진행해 20일 발표한 ARS(자동응답 시스템) 조사에서 윤 대통령 탄핵 심판 헌법재판관들의 공정성을 묻는 질문에 49.3%가 '공정하다'고 응답했다. '불공정하다'는 답변은 44.9%로 오차범위 내였다. 5.8%는 '잘모름'이었다. 연령별로 보면 30·40·50대는 '공정'이 우세했고, 만18세~29세·60대·70대 이상은 '불공정' 응답이 많았다. 만18세~29세는 공정하다 44.7%, 불공정하다 47.8%, 잘모름은 7.5%였다. 30대는 공정하다 52.2%, 불공정하다 40.4%, 잘모름 7.3%였다. 40대는 공정하다 61.3%, 불공정하다 34.8%, 잘모름 3.9%였다. 50대는 공정하다 61.3%, 불공정하다 35.2%, 잘모름 3.6%였다. 60대는 공정하다 40.7%, 불공정하다 53.8%, 잘모름 5.5%였다. 70대 이상은 공정하다 31.6%, 불공정하다 60.4%, 잘모름은 8.0%였다. 지역별로는 서울과 경기·인천, 광주·전남·전북은 '공정'으로 기울었다. 대전·충청·세종과 강원·제주, 부산·울산·경남, 대구·경북은 '불공정'하다고 봤다. 서울은 공정하다 52.9%, 불공정하다 41.5%, 잘모름 5.6%였다. 경기·인천은 공정하다 50.8%, 불공정하다 44.0%, 잘모름 5.1%였다. 대전·충청·세종은 공정하다 41.8%, 불공정하다 50.7%, 잘모름은 7.4%였다. 강원·제주는 공정하다 44.6%, 불공정하다 48.6%, 잘모름 6.8%였다. 부산·울산·경남은 공정하다 43.8%, 불공정하다 49.3%, 잘모름 6.9%였다. 대구·경북은 공정하다 37.7%, 불공정하다 56.4%, 잘모름은 5.9%였다. 광주·전남·전북은 공정하다 28.2%, 불공정하다 67.6%, 잘모름 4.2%였다. 지지정당별로는 더불어민주당 지지자들은 88.7%가 공정하다고 답했다. 반면 국민의힘 지지자들은 90.0%가 불공정하다고 응답했다. 조국혁신당 지지자들은 84.4%가 공정하다고 봤다. 개혁신당 지지자들은 공정하다 48.0%, 불공정하다 46.9%로 팽팽했다. 진보당 지지자들은 59.5%가 공정하다, 잘모름 27.0%, 불공정하다는 13.5%였다. 무당층은 51.8%가 공정하다, 32.9%는 불공정하다. 잘모름은 15.3%였다. 성별로는 남성 53.6%는 공정하다, 42.1%는 불공정하다였다. 여성은 45.1%가 공정하다, 47.7%는 불공정하다고 답했다. 박상병 정치평론가는 "우리사회의 마지막 성역이었던 헌법재판관의 양심까지도 공격하는 시대"라며 "대통령 탄핵 인용 또는 기각 이후 다음 정권에도 이러한 갈등은 더 심해질 것으로 예상한다"고 전했다. 김대은 미디어리서치 대표는 "지지층에 따라 서로 상반된 입장이 나오고 있어 향후 헌재에서 대통령 탄핵 기각과 인용중 어떠한 판결을 내리더라도 상당한 혼란이 있을 것으로 보인다"고 말했다. 이번 여론조사는 무선 RDD(무작위 전화 걸기)를 활용한 ARS를 통해 진행됐다. 신뢰 수준은 95%, 표본 오차는 ±3.1%p. 응답률은 7.2%다. 자세한 조사 개요 및 내용은 미디어리서치 홈페이지와 중앙선거여론조사심의위원회 홈페이지를 참조하면 된다. right@newspim.com 2025-02-20 11:00
안다쇼핑
Top으로 이동