본 게시글은 학부에서 진행되는 '생물정보학(Bioinformatics)' 수업을 수강하며 필자가 이해한 바를 정리한 내용입니다.
나에게 있어 기초과학은 말그대로 '기초' 과학. 원론적인 내용들을 탐구하고 밝혀내는 학문으로 알고 있었다. 그러기에 이를 탐구하는 방법 또한 매우 고전적일 수 밖에 없을 것이라 생각했다. 수많은 피펫팅과 검출의 반복으로 끝내 어떠한 매커니즘을 알아내는... 진정한 낭만의 학문이라 생각했다. 그 기다림이 낭만이고 그 결실을 더 의미있게 만들어주는 과학이라 믿었다. 하지만 세상은 매우 빠르게 달라지고 있다. 컴퓨터는 우리의 삶에 거의 대부분 녹아들었고 연구활동 또한 예외는 아니었던 것이다. 이제는 컴퓨팅 자체는 별개의 학문이 아닌 모든 학문을 유기적으로 연결해주기 위한 매개체가 아닐까. 이 특이점을 지나가고 있는 우리에게 기초과학 또한 빅데이터, 인공지능과 손을 잡았다.
생물학 커리큘럼 돌아보기
Macro molecule -> Micro molecule
생물정보학(Bioinformatics)라 해서 완전 새로운 별개의 전공 과목이 아니었다. 오히려 4년의 학부 생활동안 배워온 모든 과목을 더욱 효율적으로 이어줄 실과 바늘이 되어준 현대식 도구라는 것이다. 생물학을 전공하였다면 위 그림에 명시되어 있는 대부분의 개체들을 한 번이라도 들어봤거나 보았을 것이다. 엄밀히 말하면 세균 또는 단세포 생물과 같이 매우 작은 생명체는 육안으로 관찰하지 못해도 살아 있다는 것을 알고 있다. 더 나아가 우리는 이들을 분자수준 까지 깊이 들여다 보기도 했다. 전체를 아우르는 생태학부터 개체 하나의 원자, 분자 하나 하나가 상호작용하는 생화학까지 배웠다. 모든 것을 아우르는 생태학, 깊이 들어가 개체를 배우고 그 안의 식물과 동물에 대해 공부했다. 또한, 그 개체 마다의 특성을 공부했다. 그것도 모자라 더 들어가 세포, 그리고 소기관에 대한 세포생물학을 배웠다. 그에 파생되는 유전학, 생명공학 등도 배웠을 것이다. 세포를 알아야 더 작은 DNA, 단백질도 배울 수 있을테니까. 이러한 거대 분자(Macro molecule)에서 이제 미세 분자(Micro molecule) 수준까지 오면서 생화학을 배우게 되었다. 우리는 이를 통해 단백질, 탄수화물, 지질, 핵산 을 주로 학습했다.
이 금자탑과 같은 교육과정을 소화하고 이제 이 생물정보학을 마주하게 되었다. Bioinformatics, 정보학이다. 말그대로 정보이다. 수많은 연구진들이 쌓아온 지식들은 데이터가 되어 보이지 않은 산을 만들었다. 기초과학인 만큼 데이터의 양도 매우 방대하다. 이제 우리는 이를 분류해왔고 더 늘어날 정보들을 효율적으로 찾고 활용하고 또 찾아내어 차곡차곡 잘 보관해야 할 것이다. 그러기에 전에도 분류학은 매우 중요할 수 밖에 없는 과목이었을 것이다. 이를 더욱 더 효율적으로 만들어 주는 것이 생물정보학일 터.
생물학에 대한 모든 정보를 다루는 학문이 생물정보학. 즉, 생물정보학은 생물학의 모든 분야를 아우르는 학문이 된다. 분류학, 분자생물학, 생태학, 생화학 등 다양한 분야를 포괄한다. 앞서 서론에서 서술하였듯 프로그래밍과 접목이 되면서 생물정보학은 이제 실험 연구에 있어서 가장 중요한 기술이 될 것이다. 하지만 여기서 중요한 점은, 코딩을 잘하는 것보다 코딩을 잘 활용하는 것이 더 중요하다. 코딩 자체를 연구하고 잘하는 것은 공학의 몫일 것이다. 우리는 그들이 만들어 놓은 좋은 기술들을 잘 생물학에 적용하면 되는 것이다.
생성형 AI의 등장
과거에는 네이버의 검색엔진이, 이제는 CHAT GPT와 같은 생성형 AI. 데이터를 기반으로 질문에 대한 답을 생성하는 이 방식을 활용함으로서 수많은 데이터를 쉽게 다룰 수 있게 되었다.
하지만 초기의 GPT도 어리숙한 부분은 많았다. 우리의 지능을 따라한 모델이기 때문에 인간도 아는게 없으면 할 수 있는게 없듯이 AI라고 해서 다를 바 없다. 여기서 허술한 점이 하나 나타난다. 우리는 모르면 모른다고 하면 되지만 Chat GPT는 본인이 아는게 없더라도, 다시 말해 데이터가 없으면 대답을 위해서 일부러 지어서라도 대답한다. 거짓말을 한다는 것이다. 그래서 답변의 신뢰성이 현저하게 줄어들었던 시절이 있었다.
시간이 지남에 따라 수많은 데이터들이 쌓이고 인공지능은 이를 학습했다. 그 학습 덕분에 우리는 인공지능을 이용해서 쉽게 질문하고 정보를 얻어갈 수 있는 시기가 되었다. 생물정보학도 마찬가지. 생물정보학에서 정보를 정확하게 표현하기 어렵기 때문에 생물정보학에서 다루는 다양한 과목들을 공부하면 AI를 잘 활용할 수 있다. 생물학에 관한 많은 정보를 가지고 있고 우리는 물어보기만 하면 된다. 좋은 질문을 위해서는 우리도 공부해야 한다는 점을 간과하면 안된다. 인공지능의 데이터는 필요한 정보를 더욱 효율적으로 사용하고 볼 수 있게 도와줄 뿐 공부를 대신해준 다는 뜻이 아니라는 것이다.
생물정보학과 AI의 연구는 데이터를 기반으로 진행된다. 데이터가 적을 경우 연구가 제한되고 정보가 점점 부족해질 것이다. 데이터도 빈익빈 부익부가 가능하다는 것. 따라서 AI 연구를 위해서는 충분한 데이터와 정보가 필요하다. 위에서 언급하였듯 생물정보학을 효율적으로 활용하기 위해서는 다른 전공, 그리고 그 외의 다양한 분야의 지식들을 두루두루 섭렵하면 AI의 활용성은 더더욱 극대화 될 것이다.
내가 정진하고 있는 이 생물학 분야에서 생물정보학은 나에게 새로운 관점 보여주었다. 내가 SF 영화의 세계관에 들어왔다는 느낌도 든다. 정말 디지몬 세계를 현실화 할 수 있는건가?
'BIOLOGY > Bioinformatics' 카테고리의 다른 글
데이터 만들기 a.k.a 데이터 생산 (3) | 2024.10.19 |
---|---|
Sequencing에 점수를, Phred score (0) | 2024.10.18 |
저는 NGS를 하고 싶어요. (0) | 2024.10.18 |
생명과학의 미래, NGS(차세대 염기서열 분석) (2) | 2024.10.15 |
바이오 빅데이터의 종류와 활용 (4) | 2024.10.13 |
나의 성장 드라마
포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!