01/ 05
갓 나온 신작
핫한 과학 이슈
[특집] Part2. 유전체 연구의 미래, 생물학에서 정밀의학으로
2015년 1월 20일, 버락 오바마 당시 미국 대통령은 한 해를 여는 국정연설인 ‘연두교서’를 통해 정밀의학의 시대를 열겠다고 발표했다. 인간 유전체 프로젝트(HGP)로 밝혀진 유전체 연구 결과를 바탕으로, 정밀 진단과 치료를 하는 새로운 의료 체계를 구축하겠다는 뜻이었다. HGP는 생물학을 넘어 의학에는 어떤 영향을 미쳤을까. HGP 20년이 지난 지금, 유전체 의학의 최전선을 다투는 두 기업의 현장을 방문했다.6년 걸릴 희귀 유전질환 진단을 한 달 만에 학교에서 또는 회사에서 평범한 하루를 보내던 어느 날, 몸의 이상을 느낀다. 머리가 아프거나, 숨을 쉬기 힘들어 병원을 방문한다. 그러나 의사는 원인을 찾지 못하고, 며칠 쉬라고만 얘기한다. 증상은 심해지지만 어떤 병원에서도 원인을 찾지 못한다. 시간은 속절없이 흐른다. 마침내 국내 유병인구 2만 명이 안되는 희귀 질환에 걸렸다는 사실을 알게 됐을 땐 첫 진단으로부터 6년 후. 이미 병세는 심각해진 상황이다. 위에 가정한 상황은 많은 희귀 질환 환자들이 겪는 고통이다. 희귀병 중에서도 약 80%를 차지하는 희귀 유전질환의 문제는 질병을 특정하는 데 오랜 시간이 걸린다는 것이다. 사례가 적어 환자도 의사도 원인을 알기 힘들다. 질환명을 정확히 진단받는 데만 4~9년 정도의 시간이 걸린다는 분석도 있다. doi: 10.1371/journal.pone.0265847 “질환 특정이 힘든 희귀 유전질환 환자의 경우, 유전체 전체를 분석하면 질환의 원인을 찾기가 훨씬 수월합니다. 이제는 전체 유전체를 대상으로 희귀질환 환자 검사를 진행하는 것이 글로벌 표준입니다.” 11월 9일 서울 강남구 테헤란로에서 만난 희귀 질환 유전체 검사 업체 쓰리빌리언 금창원 대표의 설명이다. 쓰리빌리언은 환자의 유전체 전체에서 병원성 돌연변이를 찾아 유전질환을 진단한다. ‘한 달 만에 희귀 유전질환을 진단한다’, 이것이 쓰리빌리언의 목표다. 유전자 염기서열을 읽어서 유전병을 판단하는 것은 이전부터 해왔던 일이다. 대표적인 예는 1996년부터 시작된 유전성 유방암 검사인 ‘브라카(BRCA) 검사’다. 브라카 검사는 유방암 발병에 관여하는 두 유전자인 BRCA1, BRCA2의 유전자 염기서열을 읽어내 병원성, 즉 병을 일으키는 돌연변이를 밝혀 낸다. 예전에는 몇몇 유전자에 한해서만 검사를 시행했다면, 최근에는 전체 유전체 염기서열을 분석한다는 것이 차이점이다. 이렇게 하면 7000종 이상의 희귀 질병을 한 번에 검사해 비용과 시간을 극적으로 절약할 수 있다. 금 대표는 “글로벌 표준 변이 병원석 해석 기준인 ACMG 가이드라인의 28개 기준을 통해 돌연변이의 병원성을 분석한다”고 설명했다. 이전에 보고된 병원성 돌연변이인지, 일반인에게서도 발견되는지, 보고되지 않았다면 단백질의 구조를 크게 변화시키는 ‘넌센스 돌연변이’인지 등을 하나하나 분석하는 식이다. 데이터 쌓일수록 유전체 의학 강해져 이렇게 전체 유전체 분석이 가능해진 가장 큰 요인은 유전체 분석 가격 하락이다. HGP 시절 한 명의 유전체 염기서열 분석을 위해 들인 돈은 3조 원에 달했다. 이 비용이 2015년 1인당 1000달러(약 130만원)의 벽을 돌파하더니 현재는 거의 200달러(약 26만원)까지 떨어졌다. 유전체 분석이 자기공명영상(MRI) 같은 의학 장비를 사용하는 비용만큼 저렴해지면서, 진정한 ‘유전체 의학’의 시대가 열릴 조건이 갖춰졌다. 저렴한 가격을 바탕으로 유전체 분석 데이터가 쌓이면서, 희귀 유전질환에 관한 새로운 데이터도 빠르게 모이고 있다. 금 대표는 “실제로 쓰리빌리언에서 진단한 희귀 유전질환의 60%가 기존에 보고되지 않은 새로운 돌연변이로 발생했다”고 밝혔다. 새롭게 발견된 희귀 유전질환 돌연변이는 미국 정부가 운영하는 ‘클린바(ClinVar)’ 라이브러리에 쌓여 전 세계의 생명공학 기업과 병원에 공유된다. 이렇게 데이터가 쌓일수록 전 세계 희귀 유전질환 환자들의 진단율이 높아지고, 진단율이 높아지면 희귀 유전질환을 판별할 AI 프로그램을 더 정확하게 만들 수 있다. 선순환이 지속되는 것이다. 세계 각국 정부와 연구 단체가 많은 유전체 분석 데이터를 쌓으려는 이유도 건강에 영향을 미치는 유전 변이를 찾아내기 위해서다. 스케일을 더 키워 수만, 수십만 명의 다양한 인종별 유전체를 분석하면 특정 인종에서 많이 나타나는 유전적 변이도 찾아낼 수 있다. 2023년 5월 10일 국제학술지 ‘네이처’에 실린 ‘인간 범유전체(Human pangenome)’ 연구가 이러한 노력의 결실이다. doi: 10.1038/s41586-023-05896-x 국제 인간 범유전체 참조 지도 컨소시엄(HPRC) 공동 연구팀은 다양한 유전적 배경을 가진 47명의 유전체를 분석해 ‘참조 범유전체’를 만들었다. 그만큼 다양한 유전적 변이를 참조 범유전체를 통해 분석할 수 있다. 세계 각국의 유전체 데이터베이스 설립 노력도 지속되고 있다. 영국 정부는 2006년부터 ‘UK 바이오뱅크’ 사업을 통해 50만 명의 유전체를 분석하는 작업을 이어왔다. 2022년에는 이중 15만 명의 유전체 정보를 발표하기도 했다. doi: 10.1038/s41586-022-04965-x 2022년 11월 기준, UK 바이오뱅크의 자료를 활용해 나온 논문만 6000편에 달한다. 한국은 2024년부터 ‘국가통합 바이오 빅데이터 구축 사업’을 본격적으로 진행할 예정이다. 6000억 원이 넘는 예산을 투입해 최종 100만 명의 유전체 등을 분석하는 것이 목표다. 이렇게 정밀의학이 실현되면 미래 고령화 사회가 부담할 의료 비용도 획기적으로 줄어든다. 치료에서 예방 의학으로 가는 것이다. 이 모든 것이 HGP가 열어젖힌 문이다. 한 명의 유전체로는 부족하다. 많은 유전체 자료가 모일수록 유전체 의학의 힘은 강해진다. 아직은 모아야 할 자료가 많다. “지금까지 약 1만 개의 희귀 질환이 발견됐고, 그 중 80%가 유전질환에 속합니다. 지금도 매년 새로운 희귀 유전질환이 250~300개씩 발견되고 있어요. 앞으로도 유전체 의학과 진단 분야는 꾸준히 성장할 겁니다.” 금 대표의 말이다.“유전체 분석이 앞으로는 사회를 바꿀 것” 많은 독자들에게 희귀 유전질환 진단 서비스는 먼 이야기로 들릴 지도 모른다. 하지만 유전체 분석은 생각보다 훨씬 우리 삶 가까이에 다가와있다. 최근 SNS 등에서 이슈가 되는 ‘유전자 검사’가 한 예다. 한국의 유전체 분석 기업인 마크로젠은 지난 6월 28일 유전자 검사 플랫폼 ‘젠톡(GenTok)’을 출시했다. 젠톡은 식습관, 운동 능력, 비만, 피부와 모발 관리 등 생활과 밀접한 유전 요인들을 검사해준다. DNA칩 위에 원하는 특정 DNA의 돌연변이를 감지할 수 있는 염기서열을 부착해 검사자의 DNA와 반응시키는 것이다. 스마트폰 앱으로 신청 후 검사 키트에 타액을 담아 보내면, 열흘 정도 지나 앱을 통해 검사 결과를 받아볼 수 있다. “사람들이 유전체 분석 기술을 친숙하고 가깝게 느꼈으면 하는 바람에서 ‘젠톡’ 서비스를 만들었습니다.” 11월 2일, 마크로젠 본사에서 만난 서정선 마크로젠 회장은 젠톡 서비스의 취지를 이렇게 밝혔다. 서 회장은 서울대 의대 교수 시절, 한국인 유전체 ‘AK1’ 분석 결과를 네이처에 발표하는 등 한국인 유전체 연구의 기틀을 닦아왔다. 그가 만든 생명공학 기업인 마크로젠은 전 세계에서 보내온 유전체 시료를 분석하며 성장했다. 젠톡은 연구실과 병원에 국한된 유전체 분석을 더 많은 사람들이 공유할 수 있게끔 넓히려는 서 회장의 시도다. “미국에서 유전체학은 치료보다는 조상 찾기 등의 서비스로 먼저 소개됐습니다. 거대 생명공학 기업으로 성장한 미국의 ‘23andme’도 주 사업 수단은 조상 찾기였죠.” 서 회장은 자신에게 도움이 되는 유전체 분석을 저렴하고 재미있게 진행할 수 있다면, 한국에서도 찾는 사람이 많아질 것이라고 예측했다. 마지막으로 서 회장에게 유전체학의 미래에 대해 물었다. 그는 2003년 4월, 프랜시스 콜린스 당시 미국 국립유전체연구소(NHGRI) 소장이 동료들과 네이처에 쓴 “유전체 연구의 미래에 대한 비전”이라는 글을 인용했다. doi: 10.1038/nature01626 “콜린스 소장은 2003년 HGP를 완료한 후 유전체 연구의 청사진을 발표합니다. HGP가 만든 인간 유전체가 먼저 생물학을, 그 다음엔 의학을, 나중에는 사회에 혁명적 변화를 일으킬 거라는 내용이었죠. 지금까지의 유전체학은 생물학을 바꿨고, 지금은 의학을 바꾸고 있습니다. 앞으로는 사회를 바꾸게 되겠죠. 많은 분들이 유전자를 어렵거나 복잡한 것으로 느끼지 않는다면, 이런 변화가 더 빠르게 오리라 생각합니다.”생성AI 2024 트렌드3 - 멀티모달・초거대・맞춤형
생성 인공지능(AI) 기술을 둘러싼 글로벌 빅테크 기업들의 경쟁이 뜨겁다. 오픈AI-마이크로소프트(MS)보다 출발이 늦었던 구글, 메타, 아마존 등이 자체 생성 AI를 속속 공개하며 생성 AI 기술 추격에 나섰다. 2024년 생성 AI 기술 개발 트렌드 3가지를 짚어봤다. 트렌드1. 멀티모달 AI 오늘날 생성 인공지능(AI)는 이미지, 사운드, 텍스트 등을 동시에 이해하고 생성하는 멀티모달(시각, 청각 등 여러 인터페이스로 정보를 주고 받는) AI로 발전하고 있다. 김영길 한국전자통신연구원(ETRI) 언어지능연구그룹 그룹장은 “2024년 생성 AI 분야의 주요 연구 주제는 멀티모달 AI일 것”이라며 “2024년에는 하나의 생성 AI 서비스가 이미지, 사운드, 텍스트를 모두 생성하는 것이 일상화될 것”이라고 설명했다. 실제로 오픈AI-마이크로소프트(이하 오픈AI)는 2023년 9월 챗GPT에 음성 대화 기능과 이미지를 입력, 출력 기능을 추가했다. 그리고 두 달 뒤인 11월, ‘데브데이’ 행사에서 GPT-4에 이미지를 분석하고 출력할 수 있는 멀티모달 AI인 GPT-비전을 접목해 텍스트, 이미지, 사운드 생성이 모두 가능한 멀티모달 AI ‘GPT-4 Turbo’를 선보였다. 데브데이는 오픈AI가 개최하는 개발자 대상 대규모 공개 행사다. 구글도 2023년 12월 7일 멀티모달이 가능한 대규모 언어모델(LLM)인 ‘제미나이’를 공개했다. 제미나이는 문자와 이미지를 생성하고 처리할 수 있는 멀티모달 언어모델로 유튜브 영상과 온라인 이미지 자료를 학습해 폭넓은 추론을 할 수 있다. 멀티모달 AI는 빅데이터와 자본력이 바탕이 돼야 개발할 수 있다. 이미지, 음성, 영상 등의 다양한 형태를 가진 대용량의 데이터를 학습하고 처리하기 위해선 수많은 파라미터와 성능 좋은 연산장치가 필요하기 때문이다. 파라미터는 상황에 따라 달라지는 정보인 변수를 처리하기 위한 단위를 뜻한다. 김 그룹장은 “멀티모달 AI의 탄생은 (오픈AI나 구글과 같은) 빅테크 기업이 있기에 가능한 것”이라며 “2024년은 빅테크 기업이 만들어낸 멀티모달 AI 상용화의 원년이 될 것”이라고 말했다. 트렌드2. 초거대 AI 2020년 재러드 카플란 미국 존슨홉킨스대 교수팀은 연산장치인 컴퓨터가 많을수록, 파라미터와 데이터가 많을수록 생성 AI의 언어 모델링 성능이 좋아진다는 연구 결과를 논문 사전 공개 사이트 ‘아카이브’에 발표했다. doi: 10.48550/arXiv.2001.08361 이후 생성 AI 산업에서는 더 많은 데이터와 더 많은 파라미터를 사용해 거대한 생성 AI를 만드는 것이 큰 목표가 됐다. 파라미터가 많아질수록 더 여러 층에 걸쳐 학습이 가능해지고, AI 언어 모델링으로 만든 ‘사전’이 더 완벽해지기 때문이다. 박진영 성균관대 인공지능융합학과 교수는 “앞으로의 생성 AI는 기존의 AI와 비교해 규모와 문제 해결능력이 월등하게 뛰어난 ‘초거대 AI’로 발전할 것”이라고 설명했다. 실제로 2019년 구글이 발표한 T5는 110억 개 정도의 파라미터를 사용했다면, 2020년 오픈AI가 발표한 GPT-3는 1750억 개의 파라미터를 사용했다. 오픈AI가 2023년 3월 14일 공개한 ‘GPT-4’는 정보를 공개하지 않았지만 파라미터가 1조 7000억 개인것으로 추정된다. 김수현 한국과학기술연구원(KIST) 인공지능연구단 책임연구원은 “초거대 AI의 등장은 인간이 할 수 있는 어떤 지적 행동도 해내는 인공일반지능(AGI)의 탄생을 더욱 앞당길 것”이라고 말했다. 초거대 AI를 만드는 데 가장 큰 걸림돌은 비용이다. 미국 스탠퍼드대 인간중심 인공지능 연구소가 발표한 ‘2023 인공지능 보고서’는 “2019년 GPT-2(매개변수 15억 개)의 개발 비용은 5만 달러(약만 원)였지만, 2022년 PaLM(매개변수 5400억 개)에는 800만 달러(약 104억 원)가 소요됐다”며 “자본이 풍부한 산업계가 학계를 앞서고 있다”는 분석을 내놨다. 구글 제미나이는 파라미터가 1조 개가 넘는 것으로 추정된다. 사실이라면 개발에 수 억 달러가 투입됐다는 뜻이다. 김 연구원은 “생성 AI의 파라미터를 무작정 늘리는 것에는 비용적 한계가 있을 것”이라 지적하며 빅테크 기업들이 새로운 기술 개발에 더 힘을 쏟을 것이라 예측했다. 생성 AI가 트랜스포머 모델의 등장으로 폭발적으로 성장했듯이, 새로운 기술의 등장은 비용 절감으로 이어질 수 있다. 물론 기술을 개발하는 데에도 큰 비용 투자가 필요하다. 김 연구원은 “앞으로 더 효율적인 연산 기술을 찾는 것이 모든 AI 과학자들의 공통된 목표가 될 것”이라며 “자본이 풍부한 빅테크 기업이 이번에도 그 선두에 서지 않을까 추측한다”고 말했다. AI가 연산할 때 필요한 그래픽처리장치(GPU) 가격도 만만치 않다. 앞서 파라미터가 AI를 더 똑똑하게 만들어주는 요소라면, GPU는 생성 AI가 더 빠르게 연산하는 데 중요한 역할을 한다. GPU 시장은 현재 시스템반도체 설계기업인 엔비디아가 독점하고 있다. 가격을 보면 엔비디아의 최고사양 GPU인 H100의 가격은 2022년까지만 해도 약 4700만 원이었으나 2023년 4월엔 6000만 원까지 올랐다. 몇 개월 사이에 1300만 원 가량 오른 것이다. 새로운 GPT-5를 훈련하기 위해 H100 3만~5만 개가 필요하다고 추정한 일론 머스크의 계산에 따르면, 생성 AI를 만드는 데 GPU 비용만 약 1조 8000억 원에서 3조 원까지 든다. 빅테크 기업들은 자체적으로 개발에 나섰다. 마이크로소프트가 2023년 11월 개발한 AI GPU칩‘마이아100’이 대표적이다. 김 연구원은 “생성 AI의 학습과 추론에 필요한 비용을 절감하는 것은 저렴한 서비스로 이어지고, 이는 다시 사용자의 증가, 빅테크 기업의 자본 증가, 더 좋은 AI 서비스로 이어질 것”이라고 설명했다. 트렌드3. 맞춤형 AI 국내 검색 시장 점유율 1위인 네이버는 챗GPT 대비 한국어를 6500배 더 많이 학습한 초거대 생성 AI인 하이퍼클로바X를 2023년 8월 공개했다. 네이버는 하이퍼클로바X를 이용해 여러 가지 서비스를 구축하고 있다. 그 중 하나가 맞춤형 상품 추천과 맞춤형 광고 설정이다. 네이버는 과학동아와 진행한 e메일 인터뷰를 통해 “초개인화된 광고는 상호 대화를 통해 사업자가 사용자에게 제안하고 싶은 바와, 사용자가 원하는 바를 모두 전달할 수 있다”며 “서비스 이용자가 마치 오프라인에서 쇼핑하는 것과 같은 경험을 할 수 있다”고 설명했다. 옆에서 점원이 대화하며 안내하듯 소통할 수 있다는 것이다. 맞춤형 생성 AI로 구현할 수 있는 서비스가 비단 광고뿐만은 아니다. 해외 빅테크 기업들은 우리 삶에 밀접한 플랫폼에 생성 AI를 추가해 사용자 맞춤형 서비스를 제공한다. 마이크로소프트는 2023년 9월 21일 미국 뉴욕 행사에서 ‘마이크로소프트 코파일럿’ 출시를 알렸다. 이날 공개한 마이크로소프트 코파일럿은 윈도우 11, 마이크로소프트 365, 엣지, 빙 등 마이크로소프트의 플랫폼에서 수행하는 작업을 통합한다. 이를 바탕으로 검색 엔진 엣지와 빙에서는 서비스 이용자의 검색 내용을 학습해 이용자 맞춤형 검색 결과를 제시하고, 워드(Word)에서는 이용자가 입력한 텍스트를 이용자가 원하는 그래픽으로 변환할 수 있다. 나처럼 검색하고 나처럼 쓰고 그리는 생성 AI가 가능해진 것이다. 여기에 원도우의 기본 프로그램인 그림판, 노트패드, 음성 지원 기능 등도 추가될 예정이다. 김영길 그룹장은 “우리가 주로 사용하는 문서작업 플랫폼, 검색 플랫폼의 정보가 모두 합쳐진다면 개인의 특성을 파악하는 것이 그리 어려운 일은 아니다”라며 “개인의 특성을 반영한 생성 AI로 업무의 효율성을 올릴 날이 그리 멀지 않았다”고 말했다.[꿀꺽! 수학 한 입] 요술같은 규칙, 알함브라 궁전의 비밀
안녕! 나는 규칙의 요정 ‘찌니’야. 세상의 모든 규칙을 찾아내는 능력이 있지. 여기는 스페인 그라나다에 있는 알람브라 궁전이야! 알람브라는 붉은 성이라는 뜻이야. 성을 지을 때 붉은 흙을 많이 써서 그렇다나. 그런데, 내가 왜 여기에 와 있냐고? 바로 이곳에 엄청난 비밀이 있다는 얘기를 들었거든! 나, 규칙의 요정이 그냥 지나칠 수 없는 비밀말이야! ▼이어지는 기사를 보려면? Intro. 밀고 돌리고 뒤집어라!Part1. 딱 들어맞게! 테셀레이션Part2. 비틀고 바꿔도 테셀레이션이야!홈 어드밴티지 정말 있을까?
보통 소속팀(홈팀) 경기장에서 경기할 때 이점이 많다고 한다. 늘 훈련했던 익숙한 잔디, 잘 아는 날씨, 열화와 같은 팬들의 응원 속에서 경기하면 심리적으로 안정되기 때문이다. 또 홈팀 경기장에서 경기하면 해당 선수들은 멀리 이동하지 않아도 되고, 평소 묵는 숙소에서 평소 먹던 음식을 먹으며 몸을 관리할 수 있다. 하지만 상대 팀 경기장으로 이동하게 되면 챙겨야 할 것들이 생긴다. 만약 다른 나라에서 경기하게 되면 기후부터 먹는 것까지 신경써야 할 것이 많다. 월드컵이나 올림픽 등 국제 경기를 봐도 개최국이 다른 때보다 성적이 우수할 때가 많다. 우리나라도 2002 한일 월드컵에서 4강, 1988 서울 올림픽에서 종합 4위 등 상상 이상의 성과를 거뒀다. 그런데 한 연구에 따르면 홈팀 경기장에서 뛰는 것이 심판의 판정에서도 좀 더 유리하다고 한다. 심판은 어느 팀에도 치우치지 않고 정확한 판정을 해야 하지만, 압도적으로 많은 사람이 한 팀을 응원하면 심판이 심리적으로 압박을 받기 때문이다. 심리학에서는 개인의 태도나 행동이 집단에 영향을 받는 것을 ‘동조 이론’이라고 한다. 2022년 영국의 스포츠 심리학자 앨런 네빌은 관중의 함성이 심판 판정에 영향을 주는지 확인해봤다. 2010-11시즌과 2019-20시즌의 EPL 경기 47개를 분석한 결과 홈팀 선수는 상대 팀 선수보다 파울을 15% 적게 받았다. 상대 팀 선수가 파울을 10개 받을 때 홈팀 선수는 파울을 8.5개 받은 것이다. 관중이 없으면 심판 판정 공정할까? 그렇다면 혹시 관중이 없을 때 심판 판정은 공정할까? 2021년 독일 쾰른체육대학교 연구팀이 국제학술지 ‘플러스 원’에 발표한 결과에 따르면 무관중 경기일 때 심판의 판정이 더 공정했다. 연구팀은 영국, 독일, 스페인, 이탈리아 등 6개국에서 진행하는 10개 프로리그 경기를 분석했다. 코로나19 전인 2010-11시즌부터 2019-20시즌까지 관중과 함께 치러진 3만 6882개 경기와 코로나19로 무관중으로 치러진 1006개 경기를 비교했다. 이들은 심판의 판정과 관련이 있는 파울과 옐로카드, 레드카드 판정이 경기장에 관중이 있을 때와 없을 때 어느 팀에 유리한지 수학적으로 알아봤다. 그 결과 코로나19 전에는 세 판정 모두 홈팀에게 좀 더 유리했다. 그러나 무관중으로 진행된 경기에서는 파울과 옐로카드 판정이 상대 팀에게 도움이 됐다. 레드카드 판정만 공정한 것으로 나왔다. 무관중일 때는 두 팀이 거의 비슷한 심판 판정을 받거나 오히려 상대 팀이 유리한 판정을 받은 셈이다. 또 관중이 있던 코로나19 이전의 홈팀 승률은 58.5%였고, 무관중 경기 때 홈팀의 승률은 55.5%였다. 승률이 조금 떨어지긴 했지만, 승률이 여전히 50%가 넘기 때문에 홈 어드밴티지가 있다고 볼 수 있다. 별별 스포츠 확률1. 축구하다 새똥 먹을 확률은 얼마일까? 가끔 축구 경기 중 돌발 상황이 발생하기도 한다. 2014년 8월 17일 열린 EPL 개막전 경기에서도 말도 안 되는 상황이 벌어졌다. 맨체스터 유나이티드 FC와 스완지 시티 AFC의 경기가 한창 진행되던 전반 11분 동료들에게 말하는 맨체스터 유나이티드 FC의 애슐리 영 선수의 입에 무언가 들어갔다. 이 모습은 중계 화면에도 잡혔는데, 새똥이 날아와 영 선수 입으로 떨어진 것이었다. 이후 영 선수는 새똥이 아니라 주장했지만, 정말 새똥처럼 보였다. 3년 뒤 이 사건을 수학적으로 따져 본 사람들이 나타난다. 축구와 관련된 영상을 만드는 ‘슛포러브’다. 슛포러브는 영 선수 입에 똥을 싼 새는 세상에서 가장 높이 나는 새로 알려진 루펠대머리수리라고 가정했다. 상공 11.27km까지 날 수 있고, 루펠대머리수리가 지구에서 최대로 활동할 수 있는 영역을 구했다. 그런 뒤 새가 애슐리 영이 있던 위치에 똥을 쌀 확률을 구하고, 여기에 애슐리 영 선수 입의 면적과 경기가 있던 올드 트래퍼드 경기장 면적에서 애슐리 영이 차지하는 비율까지 고려했다. 그 결과 새가 똥을 쌌는데 애슐리 영 선수 입에 들어갈 확률은 3.83105946778710-19이었다. 확률이 0이 아니니 일어날 수 있는 일지만, 그 가능성은 매우 희박했다. 그런데 그런 일이 축구 경기 도중 일어난 것이다. 보고도 믿기지 않은 사건이다. 별별 스포츠 확률2. 투수가 던진 야구공에 새가 죽을 확률은? 축구 경기 도중 새똥을 먹은 사건만큼이나 황당한 사건이 야구에서도 일어났다. 2001년 3월 25일 미국 애리조나주에 있는 투산 일렉트릭파크 야구장에서 비둘기가 야구공에 맞아서 안타깝게도 세상을 떠났다. 비둘기를 맞춘 랜디 존슨 선수의 별명은 ‘공포의 좌완 파이어볼러’로, 최대 160km/h의 구속으로 공을 내리꽂는 것이 특징이었다. 존슨 선수가 평소처럼 154km/h로 던진 공이 우연히 야구장을 지나가던 비둘기에 맞은 것이다. 이후 이 사건을 계산하는 사람들이 나타났다. 물리학 커뮤니티인 ‘피직스포럼’의 네티즌 quora는 분자가 자유 운동할 때 다른 분자와 충돌하기까지의 평균 거리인 ‘평균 자유 거리’ 공식을 이용했다. 그리고 이 공식으로 사건이 벌어지는 데 필요한 최소한의 투구 수를 구했다. 대략적인 수치를 이용해 구한 평균 자유 거리는 약 36000km로, 이 값을 투구 거리인 18.44m로 나누면 약 195만 2277로, 이만큼 던져야 때마침 그곳을 지나가는 새를 맞힐 사건이 벌어질 수 있다. 그러나 야구 경기에서 양 팀이 던지는 공은 기껏해야 300번이다. 물론 이 확률은 네티즌의 자의적인 계산이기에 아주 확실하다고 보긴 어렵지만, 그만큼 다시 한 번 벌어지기 힘든 희귀한 사건임은 분명하다. 영 선수의 사건을 계산한 슛포러브는 존슨 선수의 사건보다 영 선수의 사건이 다시 일어나기 어렵다고 밝혔다. 야구공과 비둘기 면적은 영 선수가 먹은 새똥에 비하면 크고, 투수는 마운드라는 정해진 위치에서만 타자를 상대로 공을 던지지만, 축구 선수는 넓은 축구장을 이리저리 뛰어다니니 그 순간 그 위치에서 새똥과 만나고 중계 화면에 잡히는 건 매우 희박한 일이라는 것이다.베스트