See also ebooksgratis.com: no banners, no cookies, totally FREE.

CLASSICISTRANIERI HOME PAGE - YOUTUBE CHANNEL
Privacy Policy Cookie Policy Terms and Conditions
Shotgun Sequencing – Wikipedia

Shotgun Sequencing

aus Wikipedia, der freien Enzyklopädie

Shotgun Sequencing ist in der Molekularbiologie ein Methode zur Sequenzierung langer DNA-Stränge. Sie wurde von Frederick Sanger 1982 entwickelt. Hierbei wird die DNA mehrfach kopiert und die Kopien werden zufällig in zahlreiche kleine Fragmente zerhackt, die anschließend sequenziert werden. Die Fragmente werden mit Methoden aus der Bioinformatik auf Überlappungen untersucht und automatisiert zu einer Konsensussequenz mit möglichst wenigen Lücken zusammengesetzt.

Das Verfahren ist viel schneller als herkömmliche Sequenzierungsalgorithmen. Craig Venter hat 1995 das Verfahren durch den Einsatz von Bioinformatik revolutioniert. Anstatt (wie bisher) die Fragmente kartieren zu müssen, um zu wissen, wo welches Fragment im Genom ist, benutzte Venter Computer zur Rekonstruktion des Genoms aus den nun völlig zufällig sequenzierten Bereichen des Genoms. Dies wurde möglich, da die Sequenzierautomaten immer billiger und schneller wurden. Nur mit dieser Technik konnte das menschliche Genom sequenziert werden.

Inhaltsverzeichnis

[Bearbeiten] Motivation

Mit aktuellen Sequenzierverfahren kann man Präfixe von DNA-Strängen von ca. 800 Basen an einem Stück sequenzieren. Danach bricht das Verfahren ab, oder die gewonnene Sequenzinformation wird zu ungenau. Das menschliche Genom ist ca. 3 Milliarden Basen, das Genom einer Fruchtfliege ist ca. 200 Millionen Basen und das Genom des Darmbakteriums E. Coli ist. ca. 4 Millionen Basen lang. D.h. man kann Genome aufgrund ihrer Länge nicht einfach am Stück sequenzieren.

[Bearbeiten] Verfahren

Die Sequenzierung mit dem Shotgun-Verfahren wird in mehrere Phasen eingeteilt:

  • Fragmentierung der DNA und Sequenzierung der Fragmente (Fragmentierungs-Phase)
  • Feststellung von Überlappungen zwischen den Fragment-Sequenzen (Overlap-Phase)
  • Berechnung eines multiplen Alignments der Fragmente (Layout-Phase)
  • Ermittlung der Konsensus-Sequenz (Konsensus-Phase)

[Bearbeiten] Fragmentierungs-Phase

Die Fragmente werden zufällig erzeugt, in dem mechanische Scherkräfte auf die DNA einwirken (beispielsweise Ultraschall). Daher auch die Name Shotgun-Sequenzierung, da die Verteilung des Schrots im Ziel auch zufällig ist. Ein sequenziertes Fragment wird auch als read bezeichnet.

[Bearbeiten] Overlap-Phase

Um den Überlapp zwischen n sequenzierten Fragmenten festzustellen, müssen \binom{n}{2}\in O(n^2) Vergleiche durchgeführt werden. Bei Verwendung von einem modifizierten Standard-DP-Sequenzalignment-Algorithmus, liegt ein Vergleich in O(m2), wobei m die maximale Fragmentlänge ist. Deshalb werden in der Praxis auch effizientere heuristische Techniken verwendet (z.B. durch Verwendung von BLAST).

[Bearbeiten] Layout-Phase

Die Information der Overlap-phase wird verwendet um die Fragmente überlappend anzuordnen. Dieser Prozess wird mit Hilfe von Algorithmen der Bioinformatik automatisiert durchgeführt. In Abhängigkeit von der Abdeckung (coverage) der Eingabesequenz mit den zufällig erzeugten Fragmenten, sind nach der Anordnung der Fragmente Lücken in in diesem Alignment der Fragmente (Layout) vorhanden. Diese durch Lücken voneinander getrennte Inseln von Fragment-Alignments werden auch als Contigs bezeichnet.

Wiederholungen in der Eingabe DNA-Sequenz (repeats) sind problematisch, da in der Layout-Phase die Fragmente die Stücke eines repeats enthalten, falsch angeordnet werden können. Es kann zu einer Komprimierung der konstruierten Konsensussequenz kommen. Durch statistische Verfahren (z.B. Poisson-Verteilung (Lander-Waterman Statistik)) können solche Stellen erkannt und gesondert behandelt werden.

Wenn auch bei einer hohen Abdeckung Lücken vorhanden sind, dann können Lücken durch andere Verfahren, beispielsweise durch Primer-Walking, geschlossen werden.

[Bearbeiten] Varianten

Es wird zwischen whole-genome-shotgun-sequencing und clone-by-clone-sequencing unterschieden. Whole-genome-shotgun-sequencing wird auch als double-barrel-shotgun-sequencing bezeichnet, da hierbei die zufällig erzeugten Fragmente (> 2 * 800 Basen) von beiden Enden sequenziert werden. Die beiden Enden eines Fragments werden auch als Mate-pairs bezeichnet. Die Länge, und die beiden Endsequenzen jedes Fragmentes werden in der späteren Assemblierungsphase der Fragmente verwendet. Aus diesen Informationen wird ein Gerüst erstellt, an dem Inseln von überlappenen Fragmenten (Contigs), ausgerichtet werden, wenn jeweils ein Fragment eines Mate-pairs auf unterschiedlichen Contigs liegt (dieser Prozess wird auch als Scaffolding bezeichnet).

Bei der clone-by-clone-Sequenzierung wird das Genom zuerst mit Restriktionsenzymen in mehrere überlappene Bereiche geschnitten. Die einzelnen Bereiche werden kloniert und es wird eine physikalische Karte der Klone in dem Genom erstellt (d.h. die Reihenfolge und die Orientierung der Sequenzen der Clone wird durch Untersuchung auf genetische Marker ermittelt, Physical Mapping). Danach wird jede Clone-Sequenz einzeln Shotgun-sequenziert und mit Hilfe der physikalischen Karte kann eine komplette Konsensussequenz abgeleitet werden.

[Bearbeiten] Siehe auch

  • Celera Assembler - ein konkretes whole-Genome-shotgun-sequencing Programmpaket

[Bearbeiten] Weblinks

[Bearbeiten] Literatur

  • R. Merkl, S. Waack: Bioinformatik Interaktiv. WILEY-VCH, 2003, ISBN 3-527-30662-5, S. 313-324.
  • Dan Gusfield: Algorithms on strings, trees, and sequences. Cambridge University Press, 1999, ISBN 0-521-58519-8, S. 420ff (Shotgun Sequencing).
  • Rolf Knippers: Molekulare Genetik. 8. Auflage. Georg Thieme Verlag, 2001, ISBN 3-13-477008-3, S. 465-470.
  • S.B. Primrose, R.M. Twyman: Principles of Gene Manipulation and Genomics. 7. Auflage. Blackwell Publishing, 2006, ISBN 1-4051-3544-1, S. 362-371.
Andere Sprachen


aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -