- 다양한 주제에 대해 자유롭게 글을 작성하는 게시판입니다.
Date 16/10/21 22:11:30
Name   JUFAFA
Subject   퍼즐 맞추기, DNA sequencing
DNA 분석은 일반인들도 많이 들어본 적이 있는 분야죠. 친자 확인이라거나 과학수사라던지.. 하지만 아직도 인간의 유전자를 통째로 ATGC..와 같은 형태로 읽어내는 방법은 없습니다. 그래서 적당히 우리가 읽어낼 수 있는 수준으로 쪼갭니다. 이 쪼갠 DNA를 박테리아에 집어넣어서 배양을 통해 늘린 후, 이걸 분석한 후에 연결하면 완성!

.
.
.

으로 끝나면 아마 이 글을 쓰지 않았겠죠. 다음과 같은 문제가 있습니다.
1. 자른 부분이 어딘지 모른다.
잘 잘라서 DNA를 읽어낸 것까지는 좋은데 이게 어디부터 어디까지인지는 모릅니다.
2. 겹치는 부분이 너무 많다.
자른 다음에 배양을 했기 때문에 읽어낸 부분들에서 겹치는 부분이 생기게 됩니다.

하지만, 다행히 우리는 이 어려운 퍼즐의 정답지는 아니지만 참고서는 가지고 있습니다. 예전에 분석한 다른 사람들의 DNA가 있죠(Reference Sequence). 인간이라는 종의 DNA는 거의 유사하기 때문에 다른 사람의 DNA 가져다가 겹치는 부분에 맞추면 됩니다. 물론 다른 사람의 DNA이기 때문에 완전히 딱 맞지는 않습니다.

이 부분에서 이 문제는 컴퓨터공학의 일로 넘어가게 됩니다.
Reference Sequence를 텍스트로, 잘라낸 DNA를 패턴으로 보면, 텍스트에서 패턴을 찾는 문제가 되죠. 하지만, 앞에서 적었듯이 완전히 일치하지 않기 때문에 오차를 허용하는 패턴매칭 문제가 됩니다.

오차로 볼수 있는건 다음과 같습니다.
1. DNA 문자 일부가 바뀜
2. DNA 문자 일부가 빠짐
3. DNA 문자 일부가 추가됨
4. DNA 문자 일부의 순서가 바뀜

허용하는 오차의 범위가 커질수록 계산량은 무지막지하게 커지기 때문에, 계산용 그래픽 카드를 달고 몇 시간씩 돌려도 70~80% 정도 밖에 DNA조각을 배치를 못합니다. 속도와 배치율을 높이기 위해서 아직도 연구가 되고 있는 분야입니다.



2


    더.. 더 써주세요
    April_fool
    알고리즘 소개해주세요!
    이쪽은 설명하자면 KMP등에 비해 상당히 최신 기술이 되서.. 어느 정도 까지 해야하나 고민이 되는군요.
    April_fool
    꽤나 복잡한가 보군요.
    오 문과인 저한테는 분량이 딱 맞고 재미난 글예요. 이런 글 더 많았음 좋겠네요!
    까페레인
    재밌는 글 읽다보니 드는 생각...질문하나 드려도 될까요?

    제 일본친구가 DNA 분석해주는 곳에 돈주고 신청해서 분석했는데 몽고쪽 유라시아 쪽도 있고 또 한국인 유전자가 섞여 있다고 나왔다고 해요. 그 연구소의 이러한 검사가 신빙성이 있다고 보시나요? 한국인과 일본인 DNA 는 다른건지... 넘 무지하지요? 제가... -_-;; 친구네는 실제로 백제 사람들이 많이 건너가서 살았는 곳이 할아버지대의 고향이라고 해요.
    인종에 따라 DNA 풀이 차이가 있다는 이야기는 들어본 적이 있는 것 같네요. Reference Sequence로 쓰는 DNA도 그런 고려가 되는 걸로 알고 있습니다.
    질문하신 부분은 저도 잘 모르겠네요. 제가 생명공학 전공이 아니라 컴퓨터 공학 전공이라.. 배경지식정도 밖에 모르거든요.
    목록
    번호 제목 이름 날짜 조회 추천
    4251 IT/컴퓨터마, 얼굴만 봐도 알겠네! 너지! 24 Azurespace 16/11/29 7905 15
    4209 IT/컴퓨터애플워치 나이키 3일 사용기 5 Leeka 16/11/21 15647 0
    4196 IT/컴퓨터어쩌다보니 사과 농장이 완성됫습니다. 24 Leeka 16/11/20 5345 0
    4189 IT/컴퓨터웹 상에서 작성하는 수학기호 - MathML 7 Toby 16/11/19 8276 3
    4164 IT/컴퓨터구글, 신경망 기반 번역 기능 공개 20 Leeka 16/11/16 5546 5
    4109 IT/컴퓨터실망스러운 맥북프로 신형.. 11 Leeka 16/11/08 6016 0
    4094 IT/컴퓨터신경망 학습의 틀을 깨다, DFA 12 Azurespace 16/11/06 7788 8
    4081 IT/컴퓨터애플이 3분기 스마트폰 영업이익 점유율 신기록을 달성했습니다 15 Leeka 16/11/04 3593 0
    4073 IT/컴퓨터국내 데스크탑 브라우저 점유율 36 Toby 16/11/03 5108 2
    4058 IT/컴퓨터아이폰7 등장과 함께 사라진 V20 3 Leeka 16/11/02 3753 0
    4026 IT/컴퓨터맥북 프로 신형이 공개되었습니다. 9 Leeka 16/10/28 3715 0
    3993 IT/컴퓨터양띵도 탈 아프리카를 선언했습니다. 14 Leeka 16/10/23 4256 0
    3988 IT/컴퓨터아이폰7 사용 이틀 뒤 후기들 5 Leeka 16/10/23 4401 0
    3982 IT/컴퓨터아이폰 7, 출시 첫날 30만대 이상 개통된것으로 보여.. 6 Leeka 16/10/21 4311 0
    3981 IT/컴퓨터퍼즐 맞추기, DNA sequencing 7 JUFAFA 16/10/21 4645 2
    3948 IT/컴퓨터역대 아이폰 시리즈의 슬로건 4 Leeka 16/10/19 6777 0
    3947 IT/컴퓨터유쁠 매장에서 아이폰7 수령해왔습니다. 20 Leeka 16/10/18 5101 0
    3941 IT/컴퓨터갤노트7 해외여행 대책이 공개되었습니다 2 Leeka 16/10/18 3951 0
    3924 IT/컴퓨터아름다움이 적을 이기느니라 4 신문안사요 16/10/15 4898 0
    3908 IT/컴퓨터아재형 아가씨에게 3g 폴더폰 넘기란 말이다!!!!!! (멱살멱살) 26 진준 16/10/14 4557 0
    3898 IT/컴퓨터이원복 KTL 원장 "갤노트7 발화원인 검증 경솔했다" 12 Leeka 16/10/13 4330 0
    3888 IT/컴퓨터아이폰이 다음주면 한국에 나옵니다. 3 Leeka 16/10/13 4079 0
    3854 IT/컴퓨터송도 버거킹, 대전 한화 이글스파크에서 노트7이 발화했습니다 6 Leeka 16/10/09 4057 0
    3851 IT/컴퓨터미국에서 통신사발 갤노트7 교환이 시작되었습니다. 3 Leeka 16/10/08 4612 0
    3820 IT/컴퓨터컴퓨터는 어떻게 빠르게 검색을 할까 - 보이어-무어-호스풀 알고리즘 18 April_fool 16/10/04 6292 7
    목록

    + : 최근 2시간내에 달린 댓글
    + : 최근 4시간내에 달린 댓글

    댓글