클라우드 기반 유전체 분석 기술 공유
[서울=뉴스핌] 양태훈 기자 = 카카오엔터프라이즈는 지난 22일부터 25일까지 경주화백컨벤션센터에서 열린 한국생명정보학회 정기 학술대회 'BIOINFO 2024'에서 카카오클라우드 기반의 유전체 빅데이터 분석 교육 워크숍을 진행했다고 29일 밝혔다.
이날 워크숍에는 병원 관계자와 연구원, 대학생 등 약 30명이 참여했다. 카카오엔터프라이즈는 카카오클라우드 소개를 시작으로 유전체 분석 툴킷(GATK) 파이프라인 구성 및 개요 설명, 빅데이터 분석 실습 등으로 워크숍을 진행했다.
특히 이번 워크숍에서는 미국 국립표준기술연구소(NIST) 주도의 GIAB 컨소시엄이 제공하는 골드 스탠더드 유전체를 활용해 인구 내 유전체 변이 발생 빈도, 질병 관계, 유해성 예측 등을 분석했다.
카카오엔터프라이즈는 지난 22일부터 25일까지 경주화백컨벤션센터에서 열린 한국생명정보학회 정기 학술대회 'BIOINFO 2024'에서 카카오클라우드 기반의 유전체 빅데이터 분석 교육 워크숍을 진행했다. [사진=카카오엔터프라이즈] |
카카오엔터프라이즈 측은 "유전체 데이터는 의료 빅데이터의 핵심 자원으로 주목받고 있다"며 "한 사람의 유전체 데이터는 약 30억 개의 염기쌍과 2만 개의 유전자로 구성되어 있으며, 전장 유전체는 약 120GB, 전사체는 약 10GB, 메타지놈은 약 20GB의 저장 공간이 필요하다"고 설명했다.
한편 이번 워크숍은 지난 7월 고려대학교 의과대학과 체결한 업무 협약의 일환으로, 카카오클라우드의 분산 데이터 처리 프레임워크인 하둡 에코 기반의 최적화된 GATK 파이프라인이 활용됐다.
최광묵 카카오엔터프라이즈 사업 개발 TF장은 "카카오클라우드는 의료·바이오 산업 분야에서 클라우드를 더욱 원활하게 사용할 수 있도록 적극 지원하고 있으며 업계 전문가들과 지속적인 기술 교류 및 협력을 이어가고 있다"고 전했다.
dconnect@newspim.com