DNA 온라인 스토어
BIOLOGY/Bioinformatics2024. 10. 20. 21:06DNA 온라인 스토어

본 게시글은 학부 '생물정보학(Bioinformatics)' 강의를 토대로 필자가 이해한 내용을 정리하였습니다.  데이터가 어떻게 생겨나는지 알아보았다. 언급했던 회사에 취직하지 않는 이상 우리가 직접 만들어내는 일은 없지 않을까. 그래서 한낱 머글에 불과한 우리는 연구진들이 만들어 놓은 데이터를 다운받아서 사용할 것이다. 데이터가 의미를 가지고 공신력이 생기려면 어디에 보관되어있는지 기록되어 있고, 누구나 다운로드 받을 수 있어야 한다. Data가 Deposit되어 있어야 한다는 것. 이제 데이터를 쇼핑하러 가자.    미국 : NCBI유럽 : EBI일본 : DDBJ중국 : CNBGNG한국 : KBDS 중국은 현재 NCBI와 정보를 공유하고 있지 않다. NCBI와 같은 사이트는 일종의 클라우드 개념이라..

데이터 만들기 a.k.a 데이터 생산
BIOLOGY/Bioinformatics2024. 10. 19. 20:50데이터 만들기 a.k.a 데이터 생산

본 게시글은 학부 '생물정보학(Bioinformatics)' 강의를 토대로 필자가 이해한 내용을 정리하였습니다.   생물학을 정진하는 3, 4학년에게도 NGS는 생소할 것이다. 물론 알아본 데이터들이 어떻게 생기는 지는 중요하지 않다. 우리가 직접 생산하는 집단이라면 이들이 중요할 수는 있겠으나 이제 대부분 업체가 생산한다. 우리가 DNA, RNA sample을 PREP을 해야하겠지만, DNA 또는 RNA 상태로 그냥 보내면 그것들을 데이터로 받아볼 수 있다. 이러한 이유로 데이터가 어떻게 생겼는지 아는 것이 중요하다. Youtube 사이트에 회사들이 잘 설명해 놓았다.   Illumina - short readPacBio - Long read, 일루미나에 비해 방식이 완전 다르다. Long read 방..

Sequencing에 점수를, Phred score
BIOLOGY/Bioinformatics2024. 10. 18. 18:46Sequencing에 점수를, Phred score

본 게시글은 학부 강의 '생물정보학(Bioinformatics)'를 토대로 필자가 이해한 내용을 정리하였습니다.   Genomics와 Transcriptomics. 여기에는 연구진들이 현재 가장 활발하게 연구되어 있고 가장 많이, 쉽게 이용할 수 있다. 그렇다면 이 데이터들이 어떻게 나오는지 알아야 하지 않겠는가? 앞서 배운 여러 장비들을 이용해서 우리가 데이터를 생산한다. 그래서 정리된 sequencing data를 열면 아래와 같은 4줄의 data를 확인할 수 있다.  이 4줄이 한 쌍이다. 무조건 4줄 단위로 해야 한다. 이 4줄이 Read 하나. DNA, RNA를 '읽었다'는 것.이 데이터를 자르거나 분할하거나 할 때에는 무조건 4줄 단위로 해야한다.Short-read, Long-read 모두 4..

저는 NGS를 하고 싶어요.
BIOLOGY/Bioinformatics2024. 10. 18. 11:36저는 NGS를 하고 싶어요.

본 게시글은 학부 '생물정보학' 강의를 수강한 내용을 토대로 이해한 바를 정리하였습니다.  흐름 잘타야 한다. 여기를 잘 이해하느냐가 성적을 좌우할 것이다.- Neverthe1ess  우리는 수능의 민족. 중학교 고등학교를 거쳐 수능을 치르고 대학교에 입학했다. 우리는 공부를 더 잘하고 싶다. 우리는 각자 개개인이 공부하고 싶은 과목이, 잘하는 과목이 있었을 것이다. 하지만 우리는 수능을 치르기 위해서는 하기 싫은 과목도 공부해야 했다. 그랬기에, 우리의 성적은 전체적으로 하향평준화가 되었을지도 모른다. 이와 달리 대학교에서는 우리가 듣고 싶은 과목을 골라 들을 수 있다.(물론 빠른 클릭과 타이밍을 재는 능력은 필수.) 공부를 오래한 사람과 그렇지 않은 사람. 한 분야에 오래 종사한 사람과 그렇지 않은 ..

생명과학의 미래, NGS(차세대 염기서열 분석)
BIOLOGY/Bioinformatics2024. 10. 15. 16:47생명과학의 미래, NGS(차세대 염기서열 분석)

본 게시글은 학부 강의 '생물정보학(Bioinformatics)'를 수강한 내용을 토대로 필자가 이해한 점들을 정리하였습니다.Sequencing(시퀀싱, 염기서열 분석)  DNA sequence RNA sequence  Sequencing의 역사 1977년 Sanger의 Sanger method 개발분자생물학이라는 학문이 생기면서 우리는 DNA 서열을 모르면 분자생물학을 제대로 이해할 수 없게 되었다. 그 가장 흔한 Cloning 실험 조차도 우리는 서열을 모르면 진행할 수 없다. 우리가 배우는 Enzyme site. 제한 효소가 자르는 자리를 알기위해서는 Sequencing 기술이 있기에 가능하다. 우리가 아무 생각없이 행해왔던 실험은 모두 sequencing이라는 기술이 있었기에 지금의 모든 학문이 ..

바이오 빅데이터의 종류와 활용
BIOLOGY/Bioinformatics2024. 10. 13. 17:50바이오 빅데이터의 종류와 활용

본 게시물은 학부 '생물정보학(Bioinformatics)' 강의를 토대로 필자가 이해한 내용을 정리하였습니다.   바이오 빅데이터의 생산 과정 Large datasets generated by complex equipmentData management - storage, transfer, data transformation : domain of Information TechnologyData analysis - mapping, assembly, algorithm scaling : domain of Computer ScienceStatistical challenges - traditional statistiscs is not well suited for modeling systematic errors o..

생물학, 그리고 코딩을 곁들인
BIOLOGY/Bioinformatics2024. 9. 6. 19:44생물학, 그리고 코딩을 곁들인

본 게시글은 학부에서 진행되는 '생물정보학(Bioinformatics)' 수업을 수강하며 필자가 이해한 바를 정리한 내용입니다.   나에게 있어 기초과학은 말그대로 '기초' 과학. 원론적인 내용들을 탐구하고 밝혀내는 학문으로 알고 있었다. 그러기에 이를 탐구하는 방법 또한 매우 고전적일 수 밖에 없을 것이라 생각했다. 수많은 피펫팅과 검출의 반복으로 끝내 어떠한 매커니즘을 알아내는... 진정한 낭만의 학문이라 생각했다. 그 기다림이 낭만이고 그 결실을 더 의미있게 만들어주는 과학이라 믿었다. 하지만 세상은 매우 빠르게 달라지고 있다. 컴퓨터는 우리의 삶에 거의 대부분 녹아들었고 연구활동 또한 예외는 아니었던 것이다. 이제는 컴퓨팅 자체는 별개의 학문이 아닌 모든 학문을 유기적으로 연결해주기 위한 매개체가..

image