![[팀프로젝트] 팀 프로젝트의 서막](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FW6Sks%2FbtsLaA3lpDG%2FX8MdXzMKVhpKjhOvZp4SX0%2Fimg.png)
본 게시글 내용은 학부 '생물정보학(Bioinformatics)' 강의에서 교수님 지도 하에 진행된 팀프로젝트 입니다.
바야흐로 2024년 10월 30일
인생은 실전이라 했다. NGS가 어떻고 DNA-seq, RNA-seq이 어떻다는 걸 머릿 속에만 있다면 과연 이것은 우리가 알고 있다고 할 수 있을까? 도구를 쥐어주었으면 써야하지 않겠는가.
이제 종강까지 대장정 프로젝트를 시작할 것이다. 우리는 NGS 모델을 이용하여 현재 밝혀져있는 DNA와 RNA 시퀀스를 가지고 alignment를 진행하여 우리가 관심있는 유전자에 관계성을 찾아 해석을 해보려 한다.
우리가 진행할 sequencing은 RNA-seq이다. Sequencing 중 가장 간단하고 알아낼 것들이 많은 sequencing이다. 앞서 설명했던 sequencing 들의 종류를 떠올려보자. Sequencing들은 각 방식마다 목적과 생산 결과가 확연하게 다르다. 그래서 우리가 특정한 연구를 진행하고 싶다면 어떤 sequencing을 수행했을 때, 생산된 데이터와 결과값들에서 찾아낼 수 있는 관계성은 완전히 다르다. 그래서 우리는 무엇을 하고 싶은지에 대한 목적의식이 확고해야할 것이다.
Phase 1 알아보고 싶은 주제 정하기
아직 나는 애기 학부생이다. 직접 데이터를 생산할 능력은 없다. 그래서 우리는 연구진 대선배님들이 만들어 놓으신 연구 데이터 파일을 토대로 진행해야 할 것이다. 우리가 알아보고 싶은 큰 틀 안에서 흥미를 유발할 만한 소스들을 찾아보도록 하자.
수많은 종의 데이터 중에 우리의 목적과 연관있는 데이터들을 바로바로 찾아내기는 매우 힘들 것이다. NCBI SRA에 접속하여 제일 넓은 범위인 종을 검색하고 하나씩 범위를 좁혀나가는 방식으로 검색해 나가면 훨씬 효율적이다. 컴퓨터 과학에서 Binary Search와 비슷한 느낌이지 않을까.
- 종 검색 e.g. Homo Sapiens
- Seqeuncing 기술 추가 e.g. RNA seq, DNA seq, Chip seq, DIPseq etc.
- 내가 연구하고자 하는 분야 추가 e.g. COVID19 DNA seq genome
최종 검색어 예시로는
Homo Sapiens COVID19 DNA seq genome
이런 형태가 될 것이다.
Ensembl 사이트에는 각종 종들에 대한 표준 유전체 파일들이 있다. 심지어 무료다.
그 중 우리에게 친숙한 사람, Homo Sapiens를 분석하기로 했다.
문득 떠올렸다. 우리의 잃어버린 3년, 코로나 바이러스의 기억. 우리는 그 역병의 역사 한 페이지의 주인공이었다. 우리는 이들에 대해 알아보려 한다. 현재도 연구가 활발할 것이고, 그만큼 최신 데이터도 많을 것이라 생각했다.
표준 유전체?
Ensembl 사이트에는 다양한 종의 표준유전체(Reference genome) 데이터 파일이 업로드되어 있다. 이 데이터는 해당 종 내에서 가장 건강하고 유전적으로 안정적인 개체를 선별해, 고품질로 분석한 결과물이라 할 수 있다. 말 그대로 그 종을 대표할 수 있을 정도, '정석'에 가깝다고 본 것이다. 표준이라는 단어에 걸맞게 특정 집단이나 종의 유전적 기준점이 된다. 이후 환자나 실험군 데이터를 분석할 때 차이점을 비교하고 해석하는데 중요한 기준이 되어줄 것이다.
그 결과, 최종 우리는 정상인 대조군 유전자와 질환을 앓고 있는 환자 유전자에 대한 RNA seq 데이터가 많은 연구를 찾아내어 그 중 우리가 흥미있는 주제의 sequence 파일을 찾아 주제를 정했다.
전사체 분석을 통한 Long COVID 환자의 심장 기능 장애 관련 바이오마커 및 기전 탐색
https://dportal.kdca.go.kr/pot/www/CVID19/CVID19_INFO/COVID_SNDRM.jsp?utm_source=chatgpt.com
질병청 등의 정부 부처에서는 몇 개월이상 지나도 코로나 바이러스에 대한 후유증이 남아있는 환자를 따로 Long COVID 환자로 정의하고 있다. 분명 이렇게 만성적인 후유증으로 번진 것에는 유전자적인 영향이 있었을 것이다. 그래서 우리는 이를 RNA-seq을 통해 발현량을 분석했을 때 확실한 차이가 존재하는 유전자가 존재할 것이라 판단했다.
추가적으로 조사해 보았을 때, Long COVID에서 혈관 내피가 심장 손상과 관련이 있다는 연구 결과도 찾을 수 있었다.
위 논문은 CCL2가 예후 마커(Prognostic marker)로서의 가능성과 항염증 치료 타겟으로서의 전략적 가치에 대해 논의하고 있다.
- SARS-CoV-2 감염 시 숙주의 면역세포가 CCL2를 과도하게 발현한다.
- CCL2는 단핵구(Monocyte) 및 대식세포(Macrophage)를 염증 부위로 유도하여 사이토카인 폭풍(Cytokine storm)을 유발할 수 있다.
- CCL2의 지속적인 발현은 조직 손상과 장기 기능 저하에 기여한다.
- CCL2 수치의 모니터링이 COVID19 중증도 예측에 유용할 수 있다.
- CCL2/CCR2 축을 억제하는 치료법이 항염증 전략으로 고려될 수 있음을 시사하고 있다.
- Long COVID 환자에서 지속적으로 높은 CCL2 수치가 보고가 되었음을 시사
- CCL2는 혈관 내피세포(Endothelial cells)에 손상을 유발하고, 이로 인해 심근 조직의 염증 및 기능 저하가 일어날 수 있다.
- Mouse 모델 및 조직 분석을 통해 CCL2가 심장 조직에서 섬유화, 염증 반응을 유도하는 경로를 제시하고 있다.
- CCL2 차단이 심장 기능 회복에 도움을 줄 수 있는 가능성을 제시하고 있다.
Long COVID 환자군에서 혈관 내피가 심장 손상과 관련이 있다는 연구 결과, 논문을 토대로 우리는 혈관 내피 세포가 분비하는 cytokine 발현량이 심장 기능 장애에 관여할 것이라고 판단하였다. 그래서 이를 Bioinformatics 관점으로 분석을 하기로 결정했다.
'BIOLOGY > Bioinformatics' 카테고리의 다른 글
[팀 프로젝트] 데이터 바다에서 바늘 찾기 (0) | 2024.12.14 |
---|---|
데이터 수집부터 Alignment까지 (0) | 2024.10.22 |
DNA 온라인 스토어 (4) | 2024.10.20 |
데이터 만들기 a.k.a 데이터 생산 (3) | 2024.10.19 |
Sequencing에 점수를, Phred score (0) | 2024.10.18 |
나의 성장 드라마
포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!