01/ 05
갓 나온 신작
핫한 과학 이슈
생성AI 2024 트렌드3 - 멀티모달・초거대・맞춤형
생성 인공지능(AI) 기술을 둘러싼 글로벌 빅테크 기업들의 경쟁이 뜨겁다. 오픈AI-마이크로소프트(MS)보다 출발이 늦었던 구글, 메타, 아마존 등이 자체 생성 AI를 속속 공개하며 생성 AI 기술 추격에 나섰다. 2024년 생성 AI 기술 개발 트렌드 3가지를 짚어봤다. 트렌드1. 멀티모달 AI 오늘날 생성 인공지능(AI)는 이미지, 사운드, 텍스트 등을 동시에 이해하고 생성하는 멀티모달(시각, 청각 등 여러 인터페이스로 정보를 주고 받는) AI로 발전하고 있다. 김영길 한국전자통신연구원(ETRI) 언어지능연구그룹 그룹장은 “2024년 생성 AI 분야의 주요 연구 주제는 멀티모달 AI일 것”이라며 “2024년에는 하나의 생성 AI 서비스가 이미지, 사운드, 텍스트를 모두 생성하는 것이 일상화될 것”이라고 설명했다. 실제로 오픈AI-마이크로소프트(이하 오픈AI)는 2023년 9월 챗GPT에 음성 대화 기능과 이미지를 입력, 출력 기능을 추가했다. 그리고 두 달 뒤인 11월, ‘데브데이’ 행사에서 GPT-4에 이미지를 분석하고 출력할 수 있는 멀티모달 AI인 GPT-비전을 접목해 텍스트, 이미지, 사운드 생성이 모두 가능한 멀티모달 AI ‘GPT-4 Turbo’를 선보였다. 데브데이는 오픈AI가 개최하는 개발자 대상 대규모 공개 행사다. 구글도 2023년 12월 7일 멀티모달이 가능한 대규모 언어모델(LLM)인 ‘제미나이’를 공개했다. 제미나이는 문자와 이미지를 생성하고 처리할 수 있는 멀티모달 언어모델로 유튜브 영상과 온라인 이미지 자료를 학습해 폭넓은 추론을 할 수 있다. 멀티모달 AI는 빅데이터와 자본력이 바탕이 돼야 개발할 수 있다. 이미지, 음성, 영상 등의 다양한 형태를 가진 대용량의 데이터를 학습하고 처리하기 위해선 수많은 파라미터와 성능 좋은 연산장치가 필요하기 때문이다. 파라미터는 상황에 따라 달라지는 정보인 변수를 처리하기 위한 단위를 뜻한다. 김 그룹장은 “멀티모달 AI의 탄생은 (오픈AI나 구글과 같은) 빅테크 기업이 있기에 가능한 것”이라며 “2024년은 빅테크 기업이 만들어낸 멀티모달 AI 상용화의 원년이 될 것”이라고 말했다. 트렌드2. 초거대 AI 2020년 재러드 카플란 미국 존슨홉킨스대 교수팀은 연산장치인 컴퓨터가 많을수록, 파라미터와 데이터가 많을수록 생성 AI의 언어 모델링 성능이 좋아진다는 연구 결과를 논문 사전 공개 사이트 ‘아카이브’에 발표했다. doi: 10.48550/arXiv.2001.08361 이후 생성 AI 산업에서는 더 많은 데이터와 더 많은 파라미터를 사용해 거대한 생성 AI를 만드는 것이 큰 목표가 됐다. 파라미터가 많아질수록 더 여러 층에 걸쳐 학습이 가능해지고, AI 언어 모델링으로 만든 ‘사전’이 더 완벽해지기 때문이다. 박진영 성균관대 인공지능융합학과 교수는 “앞으로의 생성 AI는 기존의 AI와 비교해 규모와 문제 해결능력이 월등하게 뛰어난 ‘초거대 AI’로 발전할 것”이라고 설명했다. 실제로 2019년 구글이 발표한 T5는 110억 개 정도의 파라미터를 사용했다면, 2020년 오픈AI가 발표한 GPT-3는 1750억 개의 파라미터를 사용했다. 오픈AI가 2023년 3월 14일 공개한 ‘GPT-4’는 정보를 공개하지 않았지만 파라미터가 1조 7000억 개인것으로 추정된다. 김수현 한국과학기술연구원(KIST) 인공지능연구단 책임연구원은 “초거대 AI의 등장은 인간이 할 수 있는 어떤 지적 행동도 해내는 인공일반지능(AGI)의 탄생을 더욱 앞당길 것”이라고 말했다. 초거대 AI를 만드는 데 가장 큰 걸림돌은 비용이다. 미국 스탠퍼드대 인간중심 인공지능 연구소가 발표한 ‘2023 인공지능 보고서’는 “2019년 GPT-2(매개변수 15억 개)의 개발 비용은 5만 달러(약만 원)였지만, 2022년 PaLM(매개변수 5400억 개)에는 800만 달러(약 104억 원)가 소요됐다”며 “자본이 풍부한 산업계가 학계를 앞서고 있다”는 분석을 내놨다. 구글 제미나이는 파라미터가 1조 개가 넘는 것으로 추정된다. 사실이라면 개발에 수 억 달러가 투입됐다는 뜻이다. 김 연구원은 “생성 AI의 파라미터를 무작정 늘리는 것에는 비용적 한계가 있을 것”이라 지적하며 빅테크 기업들이 새로운 기술 개발에 더 힘을 쏟을 것이라 예측했다. 생성 AI가 트랜스포머 모델의 등장으로 폭발적으로 성장했듯이, 새로운 기술의 등장은 비용 절감으로 이어질 수 있다. 물론 기술을 개발하는 데에도 큰 비용 투자가 필요하다. 김 연구원은 “앞으로 더 효율적인 연산 기술을 찾는 것이 모든 AI 과학자들의 공통된 목표가 될 것”이라며 “자본이 풍부한 빅테크 기업이 이번에도 그 선두에 서지 않을까 추측한다”고 말했다. AI가 연산할 때 필요한 그래픽처리장치(GPU) 가격도 만만치 않다. 앞서 파라미터가 AI를 더 똑똑하게 만들어주는 요소라면, GPU는 생성 AI가 더 빠르게 연산하는 데 중요한 역할을 한다. GPU 시장은 현재 시스템반도체 설계기업인 엔비디아가 독점하고 있다. 가격을 보면 엔비디아의 최고사양 GPU인 H100의 가격은 2022년까지만 해도 약 4700만 원이었으나 2023년 4월엔 6000만 원까지 올랐다. 몇 개월 사이에 1300만 원 가량 오른 것이다. 새로운 GPT-5를 훈련하기 위해 H100 3만~5만 개가 필요하다고 추정한 일론 머스크의 계산에 따르면, 생성 AI를 만드는 데 GPU 비용만 약 1조 8000억 원에서 3조 원까지 든다. 빅테크 기업들은 자체적으로 개발에 나섰다. 마이크로소프트가 2023년 11월 개발한 AI GPU칩‘마이아100’이 대표적이다. 김 연구원은 “생성 AI의 학습과 추론에 필요한 비용을 절감하는 것은 저렴한 서비스로 이어지고, 이는 다시 사용자의 증가, 빅테크 기업의 자본 증가, 더 좋은 AI 서비스로 이어질 것”이라고 설명했다. 트렌드3. 맞춤형 AI 국내 검색 시장 점유율 1위인 네이버는 챗GPT 대비 한국어를 6500배 더 많이 학습한 초거대 생성 AI인 하이퍼클로바X를 2023년 8월 공개했다. 네이버는 하이퍼클로바X를 이용해 여러 가지 서비스를 구축하고 있다. 그 중 하나가 맞춤형 상품 추천과 맞춤형 광고 설정이다. 네이버는 과학동아와 진행한 e메일 인터뷰를 통해 “초개인화된 광고는 상호 대화를 통해 사업자가 사용자에게 제안하고 싶은 바와, 사용자가 원하는 바를 모두 전달할 수 있다”며 “서비스 이용자가 마치 오프라인에서 쇼핑하는 것과 같은 경험을 할 수 있다”고 설명했다. 옆에서 점원이 대화하며 안내하듯 소통할 수 있다는 것이다. 맞춤형 생성 AI로 구현할 수 있는 서비스가 비단 광고뿐만은 아니다. 해외 빅테크 기업들은 우리 삶에 밀접한 플랫폼에 생성 AI를 추가해 사용자 맞춤형 서비스를 제공한다. 마이크로소프트는 2023년 9월 21일 미국 뉴욕 행사에서 ‘마이크로소프트 코파일럿’ 출시를 알렸다. 이날 공개한 마이크로소프트 코파일럿은 윈도우 11, 마이크로소프트 365, 엣지, 빙 등 마이크로소프트의 플랫폼에서 수행하는 작업을 통합한다. 이를 바탕으로 검색 엔진 엣지와 빙에서는 서비스 이용자의 검색 내용을 학습해 이용자 맞춤형 검색 결과를 제시하고, 워드(Word)에서는 이용자가 입력한 텍스트를 이용자가 원하는 그래픽으로 변환할 수 있다. 나처럼 검색하고 나처럼 쓰고 그리는 생성 AI가 가능해진 것이다. 여기에 원도우의 기본 프로그램인 그림판, 노트패드, 음성 지원 기능 등도 추가될 예정이다. 김영길 그룹장은 “우리가 주로 사용하는 문서작업 플랫폼, 검색 플랫폼의 정보가 모두 합쳐진다면 개인의 특성을 파악하는 것이 그리 어려운 일은 아니다”라며 “개인의 특성을 반영한 생성 AI로 업무의 효율성을 올릴 날이 그리 멀지 않았다”고 말했다.쓸 줄 모르면 손해! 생성AI 똑똑한 사용법
생성 인공지능(AI)을 잘 활용하는 것은 실력 좋은 개인 비서를 두는 것과 같다. 대화 몇 마디로 내가 원하는 정보를 찾아내고, 그 정보를 원하는 형태로 정리하기 때문이다. 안 쓰면 손해인 생성 AI, 어떻게 더 잘 사용할 수 있을까.2024년을 살아가는 가상의 인물들의 하루로 살펴봤다.(❋편집자주. PART 2에 삽입된 이미지는 오픈AI의 이미지 생성 인공지능(AI) ‘달리(DALL-E)’에 기사의 내용을 넣어 만든 그림입니다. 기사와 어울리는 가상의 인물과 상황이 뚝딱 만들어졌습니다.) “발표가 제일 쉬웠어요” 30대 직장인 이창래 씨의 하루 내일은 이창래 씨에게 중요한 사업 발표가 있는 날이다. 가장 먼저 해야할 일은 발표에 들어갈 자료 정리. 해당 주제로 팀원들과 수차례 회의한 기록이 남아있지만 그 양이 너무 많아 어디서부터 봐야할지 엄두가 나지 않는다. 이때 창래 씨는 문서 작성 프로그램 워드에 내장된 마이크로소프트(MS)의 ‘MS 365 코파일럿’을 활용한다. 수많은 워드, 엑셀 파일에 적힌 글자들이 ‘회의록 요약’ 버튼 하나에 1장으로 요약된다. 이것을 파워포인트 파일로 아름답게 디자인하는 것도 생성 인공지능(AI)의 몫이다. 감마(Gamma) AI에 요약된 회의록을 입력하자 1분도 안 돼 세련된 PPT가 만들어졌다. 이제 창래 씨가 할 일은 생성 AI가 만든 자료를 꼼꼼히 확인하며 더 수준 높은 PPT로 업그레이드 시키는 것이다. PPT를 살피던 창래 씨는 시각화 자료가 있으면 좋겠다는 생각을 한다. 수치가 정리된 엑셀을 켜고 채팅창에 “시각화 자료를 만들어 달라”고 입력하자 데이터가 깔끔한 그래프로 정리된다. 마지막으로 내일 참석하는 프랑스인 바이어를 위한 프랑스어 자료를 따로 만든다. 챗GPT 번역 프로그램에 PPT 파일을 넣으면 끝나는 아주 간단한 작업이다. 오늘도 열심히 일한 창래 씨는 내일을 위해 일찍 잠자리에 든다. 그건 생성 AI가 해줄 수 없는 일이니까. 공부 의지 뿜뿜! 고1 김태린 양의 하루 중학생 뽀시래기 시절의 김태린은 잊어라. 컴퓨터과학자를 꿈꾸며 고1부터 열공을 다짐한 태린 양의 오늘 공부 목표는 수학 모의고사 풀이와 영어 듣기평가 연습과 단어 공부이다. 먼저 작년 3월 모의고사 수학 문제지를 펼쳤다. 열심히 풀어보려는데 맙소사, 첫 문제부터 도저히 풀리지가 않는다. 그는 챗GPT의 울프럼 알파(Wolfram Alpha) 플러그인을 사용해 문제풀이를 확인해보기로 한다. 문제의 수식을 하나씩 입력하는 과정이 조금 번거롭지만, 일단 입력을 끝내고 나면 친절한 생성 AI는 문제 풀이를 보여준다. 채팅창에 “그래프를 그려달라”고 말하면 풀이와 관련한 그래프도 그려준다. 그래프를 보고야 풀이를 이해한 태린 양은 겨우 다음 문제로 넘어간다.수학 모의고사 풀이를 마무리한 뒤에는 영어 교과서를 편다. 말하기보다 듣기에 약한 그는 교과서 속 지문을 챗GPT에게 입력해 챗GPT가 읽어주는 지문을 들으며 듣기 연습을 한다. 그리고 외워야 하는 단어를 챗GPT 커스텀 단어 시험기에 입력한다. 커스텀 단어 시험기는 태린 양이 단어 공부를 위해 GPTs로 직접 만든 시험 프로그램이다. 프로그램을 켜면 “오늘 공부할 단원을 알려주세요”라는 질문이 뜬다. “2단원”이라고 입력하면 “awkard의 뜻은 무엇일까요?”라고 다시 질문한다. 바로 생각나지 않는 단어는 “예문을 보여달라”고 하면 “It feels a bit awkward to talk alone”이라는 교과서 2단원 속 활용 지문을 말해준다. 정답인 “뻘쭘하다”를 입력하면 다음 문제로 넘어간다. 오늘도 목표를 달성한 태린 양은 스스로에게 주는 보상으로 최애 아이돌 ‘투바투’ 영상을 보며 휴식을 취한다. 손주가 너무 예쁜 60대 박미연 씨의 하루 60대 박미연 씨에게 큰 고민이 있다. 바로 초등학교에 입학하는 손주에게 꼭 맞는 선물을 고르는 것이다. 골머리를 앓던 그는 생성 AI를 떠올린다. 대화하듯 말을 건네면 사용자가 원하는 내용을 검색해주는 네이버 ‘Cue’ 서비스다.“초등학교에 입학하는 손자가 좋아할 만한 선물을 추천해줘” 조심스레 말을 걸자 Cue는 문구세트부터 현미경, 자전거까지 초등학생이 좋아할 만한 선물들을 주르륵 화면에 띄운다. 하지만 가격대가 너무 다양해 고르기 어렵다. “20만 원 이하 선물로 찾아줘” “남자 아이 선물로 골라줘” 미연 씨는 말을 이어갔다. Cue는 파란색 백팩을 추천했다. 딱이다! 이미지를 클릭하자 화면은 네이버 쇼핑으로 연결됐다. 설날에 만나 선물을 건네줄 기대를 하며 미연 씨는 기대에 부풀었다. 취미 부자 정소혜 씨의 하루 정소혜 씨는 짬짬이 유튜브 영상도 편집하고 웹툰도 그려 블로그에 올리는 취미 부자다. 그런 그가 요즘은 생성 AI로 취미활동하는 데 푹 빠졌다. 먼저 영상을 만들 땐 어도비의 생성 AI ‘파이어플라이’를 활용해 저작권 없는 이미지를 만들고, 음악 생성 AI ‘사운드로우(Soundraw)’로 BGM을 제작한다. 이 자료들을 영상 편집 AI, ‘브루(vrew)’에 넣으면 자동으로 컷편집을 해주고 자막도 생성해준다. 생성 AI를 이용하면 피사체가 계속 카메라를 바라보고 있는 것처럼 촬영도 가능하다. 즉 영상에 들어갈 대본을 종이에 써서 읽는 모습을 촬영해도, 계속 카메라를 바라보며 말하는 것처럼 연출할 수 있다. 웹툰을 제작하는 시간도 생성 AI로 크게 줄었다. 네이버 ‘웹툰 AI 페인터’를 사용하면 몇번의 터치만으로 자동 채색이 된다. 원하는 색을 끌어다 원하는 부분에 내려놓으면, 해당 부분에 색이 칠해지고 그 주변부도 어울리는 색으로 채워진다. 생성 AI로 시간을 번 소혜 씨는 다른 취미생활을 해볼까, 행복한 고민을 한다. 이제는 AI 리터러시를 고민해야 할 때 생성 AI는 어떻게 활용하는가에 따라 그 활용도가 천차만별이다. 누군가에겐 검색을 대신 해주는 검색창 정도의 역할만 할 수도 있고, 누군가에겐 영화 ‘아이언맨’ 토니 스타크의 ‘자비스’처럼 훌륭한 개인 비서가 될 수도 있다. 그렇다면 어떤 사람이 생성 AI를 잘 활용할까? 김란우 KAIST 디지털 인문사회과학부 교수는 2023년 9월 14일부터 19일까지 전국 20~50대 직장인 1100명에게 생성 AI 활용도에 대한 설문조사를 실시했다. 그 결과 학력이 높을수록, 월소득이 높을수록 생성 AI 사용 빈도수가 높았다. 김 교수는 “머리가 좋고 돈을 잘 버는 것이 생성 AI 활용 능력과 연관있는 것이 아니라, AI에 대한 사전 교육이 잘 된 사람일수록 새로운 AI의 등장에 빠르게 발맞춘다는 의미”라고 말했다. 이는 ‘AI 리터러시’ 격차로도 설명할 수 있다. 리터러시는 ‘읽고 쓸 수 있는 능력’이라는 뜻으로, AI 리터러시는 AI를 올바르게 이해하고 활용할 수 있는 능력이다. 다가올 미래에 AI 리터러시 격차는 피하기 어렵다. 가령 AI 교육을 자주 접하지 못한 청소년들은 자주 접한 청소년에 비해 AI를 낯설게 여기고, 그 결과 AI를 적극적으로 학습하지 못한다. AI 리터러시 격차를 해소하기 위해 한국의 빅테크 기업들은 발빠르게 움직이고 있다. SKT는 모든 사내 구성원을 대상으로 AI 리터러시 교육을 실시했다. 네이버는 ‘커넥트 재단’을 운영하며 유아부터 청소년, 일반 대중까지 다양한 이들을 대상으로 AI, 소프트웨어 교육을 제공하고 있다. 특히 ‘소프트웨어야 놀자’라는 교육 프로그램은 AI 교육의 기회에서 소외되는 지역이 없도록 전국의 청소년에게 제공된다. 김 교수는 “대국민적인 AI 리터러시 교육을 통해 전국민이 AI와 친숙해져야, 앞으로 더욱 발전할 생성 AI 시대 속에서 격차를 줄일 수 있을 것”이라고 설명했다.[특별한 수학] 만화를 잘 그리고 싶어!
'나도 이렇게 재미있는 만화를 그리고 싶은데·•·.''마나'가 고민에 빠져 있던 그때, 만화책 속에서 누군가 튀어나왔어요."안녕? 난 만화의 요정 '투니'야! 만화를 잘 그리는 비결이 궁금하면 날 따라와~!" 만화 요정이라고? 믿기지 않았지만, 마나는 일단 투니를 따라가 보기로 했어요.여러분도 함께 가보실래요? ▼이어지는 기사를 보려면?Intro. [특별한 수학] 만화를 잘 그리고 싶어!Part1. 캐릭터 얼굴 그릴 땐, 도형이 필요해!Part2. 몸과 머리의 비율이 중요해!Part3. 움직이는 만화, 애니메이션Part4. 이제는 인공지능도 만화가![특집] Part2. 유전체 연구의 미래, 생물학에서 정밀의학으로
2015년 1월 20일, 버락 오바마 당시 미국 대통령은 한 해를 여는 국정연설인 ‘연두교서’를 통해 정밀의학의 시대를 열겠다고 발표했다. 인간 유전체 프로젝트(HGP)로 밝혀진 유전체 연구 결과를 바탕으로, 정밀 진단과 치료를 하는 새로운 의료 체계를 구축하겠다는 뜻이었다. HGP는 생물학을 넘어 의학에는 어떤 영향을 미쳤을까. HGP 20년이 지난 지금, 유전체 의학의 최전선을 다투는 두 기업의 현장을 방문했다.6년 걸릴 희귀 유전질환 진단을 한 달 만에 학교에서 또는 회사에서 평범한 하루를 보내던 어느 날, 몸의 이상을 느낀다. 머리가 아프거나, 숨을 쉬기 힘들어 병원을 방문한다. 그러나 의사는 원인을 찾지 못하고, 며칠 쉬라고만 얘기한다. 증상은 심해지지만 어떤 병원에서도 원인을 찾지 못한다. 시간은 속절없이 흐른다. 마침내 국내 유병인구 2만 명이 안되는 희귀 질환에 걸렸다는 사실을 알게 됐을 땐 첫 진단으로부터 6년 후. 이미 병세는 심각해진 상황이다. 위에 가정한 상황은 많은 희귀 질환 환자들이 겪는 고통이다. 희귀병 중에서도 약 80%를 차지하는 희귀 유전질환의 문제는 질병을 특정하는 데 오랜 시간이 걸린다는 것이다. 사례가 적어 환자도 의사도 원인을 알기 힘들다. 질환명을 정확히 진단받는 데만 4~9년 정도의 시간이 걸린다는 분석도 있다. doi: 10.1371/journal.pone.0265847 “질환 특정이 힘든 희귀 유전질환 환자의 경우, 유전체 전체를 분석하면 질환의 원인을 찾기가 훨씬 수월합니다. 이제는 전체 유전체를 대상으로 희귀질환 환자 검사를 진행하는 것이 글로벌 표준입니다.” 11월 9일 서울 강남구 테헤란로에서 만난 희귀 질환 유전체 검사 업체 쓰리빌리언 금창원 대표의 설명이다. 쓰리빌리언은 환자의 유전체 전체에서 병원성 돌연변이를 찾아 유전질환을 진단한다. ‘한 달 만에 희귀 유전질환을 진단한다’, 이것이 쓰리빌리언의 목표다. 유전자 염기서열을 읽어서 유전병을 판단하는 것은 이전부터 해왔던 일이다. 대표적인 예는 1996년부터 시작된 유전성 유방암 검사인 ‘브라카(BRCA) 검사’다. 브라카 검사는 유방암 발병에 관여하는 두 유전자인 BRCA1, BRCA2의 유전자 염기서열을 읽어내 병원성, 즉 병을 일으키는 돌연변이를 밝혀 낸다. 예전에는 몇몇 유전자에 한해서만 검사를 시행했다면, 최근에는 전체 유전체 염기서열을 분석한다는 것이 차이점이다. 이렇게 하면 7000종 이상의 희귀 질병을 한 번에 검사해 비용과 시간을 극적으로 절약할 수 있다. 금 대표는 “글로벌 표준 변이 병원석 해석 기준인 ACMG 가이드라인의 28개 기준을 통해 돌연변이의 병원성을 분석한다”고 설명했다. 이전에 보고된 병원성 돌연변이인지, 일반인에게서도 발견되는지, 보고되지 않았다면 단백질의 구조를 크게 변화시키는 ‘넌센스 돌연변이’인지 등을 하나하나 분석하는 식이다. 데이터 쌓일수록 유전체 의학 강해져 이렇게 전체 유전체 분석이 가능해진 가장 큰 요인은 유전체 분석 가격 하락이다. HGP 시절 한 명의 유전체 염기서열 분석을 위해 들인 돈은 3조 원에 달했다. 이 비용이 2015년 1인당 1000달러(약 130만원)의 벽을 돌파하더니 현재는 거의 200달러(약 26만원)까지 떨어졌다. 유전체 분석이 자기공명영상(MRI) 같은 의학 장비를 사용하는 비용만큼 저렴해지면서, 진정한 ‘유전체 의학’의 시대가 열릴 조건이 갖춰졌다. 저렴한 가격을 바탕으로 유전체 분석 데이터가 쌓이면서, 희귀 유전질환에 관한 새로운 데이터도 빠르게 모이고 있다. 금 대표는 “실제로 쓰리빌리언에서 진단한 희귀 유전질환의 60%가 기존에 보고되지 않은 새로운 돌연변이로 발생했다”고 밝혔다. 새롭게 발견된 희귀 유전질환 돌연변이는 미국 정부가 운영하는 ‘클린바(ClinVar)’ 라이브러리에 쌓여 전 세계의 생명공학 기업과 병원에 공유된다. 이렇게 데이터가 쌓일수록 전 세계 희귀 유전질환 환자들의 진단율이 높아지고, 진단율이 높아지면 희귀 유전질환을 판별할 AI 프로그램을 더 정확하게 만들 수 있다. 선순환이 지속되는 것이다. 세계 각국 정부와 연구 단체가 많은 유전체 분석 데이터를 쌓으려는 이유도 건강에 영향을 미치는 유전 변이를 찾아내기 위해서다. 스케일을 더 키워 수만, 수십만 명의 다양한 인종별 유전체를 분석하면 특정 인종에서 많이 나타나는 유전적 변이도 찾아낼 수 있다. 2023년 5월 10일 국제학술지 ‘네이처’에 실린 ‘인간 범유전체(Human pangenome)’ 연구가 이러한 노력의 결실이다. doi: 10.1038/s41586-023-05896-x 국제 인간 범유전체 참조 지도 컨소시엄(HPRC) 공동 연구팀은 다양한 유전적 배경을 가진 47명의 유전체를 분석해 ‘참조 범유전체’를 만들었다. 그만큼 다양한 유전적 변이를 참조 범유전체를 통해 분석할 수 있다. 세계 각국의 유전체 데이터베이스 설립 노력도 지속되고 있다. 영국 정부는 2006년부터 ‘UK 바이오뱅크’ 사업을 통해 50만 명의 유전체를 분석하는 작업을 이어왔다. 2022년에는 이중 15만 명의 유전체 정보를 발표하기도 했다. doi: 10.1038/s41586-022-04965-x 2022년 11월 기준, UK 바이오뱅크의 자료를 활용해 나온 논문만 6000편에 달한다. 한국은 2024년부터 ‘국가통합 바이오 빅데이터 구축 사업’을 본격적으로 진행할 예정이다. 6000억 원이 넘는 예산을 투입해 최종 100만 명의 유전체 등을 분석하는 것이 목표다. 이렇게 정밀의학이 실현되면 미래 고령화 사회가 부담할 의료 비용도 획기적으로 줄어든다. 치료에서 예방 의학으로 가는 것이다. 이 모든 것이 HGP가 열어젖힌 문이다. 한 명의 유전체로는 부족하다. 많은 유전체 자료가 모일수록 유전체 의학의 힘은 강해진다. 아직은 모아야 할 자료가 많다. “지금까지 약 1만 개의 희귀 질환이 발견됐고, 그 중 80%가 유전질환에 속합니다. 지금도 매년 새로운 희귀 유전질환이 250~300개씩 발견되고 있어요. 앞으로도 유전체 의학과 진단 분야는 꾸준히 성장할 겁니다.” 금 대표의 말이다.“유전체 분석이 앞으로는 사회를 바꿀 것” 많은 독자들에게 희귀 유전질환 진단 서비스는 먼 이야기로 들릴 지도 모른다. 하지만 유전체 분석은 생각보다 훨씬 우리 삶 가까이에 다가와있다. 최근 SNS 등에서 이슈가 되는 ‘유전자 검사’가 한 예다. 한국의 유전체 분석 기업인 마크로젠은 지난 6월 28일 유전자 검사 플랫폼 ‘젠톡(GenTok)’을 출시했다. 젠톡은 식습관, 운동 능력, 비만, 피부와 모발 관리 등 생활과 밀접한 유전 요인들을 검사해준다. DNA칩 위에 원하는 특정 DNA의 돌연변이를 감지할 수 있는 염기서열을 부착해 검사자의 DNA와 반응시키는 것이다. 스마트폰 앱으로 신청 후 검사 키트에 타액을 담아 보내면, 열흘 정도 지나 앱을 통해 검사 결과를 받아볼 수 있다. “사람들이 유전체 분석 기술을 친숙하고 가깝게 느꼈으면 하는 바람에서 ‘젠톡’ 서비스를 만들었습니다.” 11월 2일, 마크로젠 본사에서 만난 서정선 마크로젠 회장은 젠톡 서비스의 취지를 이렇게 밝혔다. 서 회장은 서울대 의대 교수 시절, 한국인 유전체 ‘AK1’ 분석 결과를 네이처에 발표하는 등 한국인 유전체 연구의 기틀을 닦아왔다. 그가 만든 생명공학 기업인 마크로젠은 전 세계에서 보내온 유전체 시료를 분석하며 성장했다. 젠톡은 연구실과 병원에 국한된 유전체 분석을 더 많은 사람들이 공유할 수 있게끔 넓히려는 서 회장의 시도다. “미국에서 유전체학은 치료보다는 조상 찾기 등의 서비스로 먼저 소개됐습니다. 거대 생명공학 기업으로 성장한 미국의 ‘23andme’도 주 사업 수단은 조상 찾기였죠.” 서 회장은 자신에게 도움이 되는 유전체 분석을 저렴하고 재미있게 진행할 수 있다면, 한국에서도 찾는 사람이 많아질 것이라고 예측했다. 마지막으로 서 회장에게 유전체학의 미래에 대해 물었다. 그는 2003년 4월, 프랜시스 콜린스 당시 미국 국립유전체연구소(NHGRI) 소장이 동료들과 네이처에 쓴 “유전체 연구의 미래에 대한 비전”이라는 글을 인용했다. doi: 10.1038/nature01626 “콜린스 소장은 2003년 HGP를 완료한 후 유전체 연구의 청사진을 발표합니다. HGP가 만든 인간 유전체가 먼저 생물학을, 그 다음엔 의학을, 나중에는 사회에 혁명적 변화를 일으킬 거라는 내용이었죠. 지금까지의 유전체학은 생물학을 바꿨고, 지금은 의학을 바꾸고 있습니다. 앞으로는 사회를 바꾸게 되겠죠. 많은 분들이 유전자를 어렵거나 복잡한 것으로 느끼지 않는다면, 이런 변화가 더 빠르게 오리라 생각합니다.”베스트