2 Transkriptom RNA Seq 1: Difference between revisions

From Bioinformatik Wiki
No edit summary
No edit summary
Line 1: Line 1:
Auf dieser Seite sind die Themen zusammengeführt, die in Vorlesung 2 am 18.04.2019 behandelt wurden.
Auf dieser Seite sind die Themen zusammengeführt, die in Vorlesung 2 am 18.04.2019 behandelt wurden.


Line 58: Line 59:


<big>(c meist bei 30)</big>
<big>(c meist bei 30)</big>
== Assemblierung der reads ==
<big>
{|
|-
| A || C || C || T || G || A || C || T || A || G || C || T || G || A || T || C || A || A || G || G || -|| -||  Template
|-
| || || || || || || || || || || || || G || A || T || C || A || A || || || || || ||
|-
| || || || || || || || || A|| G|| C|| T|| G|| A|| || || || || || || || || || || ||
|-
| || || || || || A|| C|| <span style="color:#00F; border-style: solid; border-width: 0.5px; margin: 0.5px"> G</span>|| A|| G|| C|| T|| || || || || || || || || -|| -|| Punktmutation
|-
| || || || || || || || || || || || || G|| A|| _|| C|| A|| A|| G|| G|| -||-|| Deletion
|}</big></br>

Revision as of 17:39, 1 May 2019

Auf dieser Seite sind die Themen zusammengeführt, die in Vorlesung 2 am 18.04.2019 behandelt wurden.

Biologische Fragestellung

Da NAT8L in euren Prostatakarzinomzellen erhöht exprimiert ist, habt ihr euch entschlossen die Genexpression durch RNAi (RNA Interferenz) zu silencen.

Experiment

  • insert pic here*

Sanger Methode

Als Wiederholung:

400px][https://de.wikipedia.org/wiki/DNA-Sequenzierung#Didesoxymethode_nach_Sanger


Next Generation Sequencing (NGS)

Illumina Sequencing (2nd Generation Sequencing)

Ergebnis der Illumina Sequenzierung:

  • Länge der reads 50-600bp
  • Fehlerrate ca. 0,1%
  • humanes Genom kann 30x am Tag sequenziert werden
  • Daten werden in FASTQ Format geliefert


FASTQ

Eine FASTQ-Datei ist folgendermaßen aufgebaut:

@identifier ← Sequenz ID
GATCTT ← Sequenz
+ irgendeine Beschreibung ← optionale Beschreibung
!'CC'*+*!? ← Qualität für jedes Level (Zahlenwert repräsentiert durch ASCII Tabelle

Problem

Viele kurze reads, die in einen Zusammenhang gebracht werden müssen!

Sequenzabdeckung

G: Länge der Genomsequenz
N: Anzahl der reads
L: durchschnittliche Länge der reads
c: Coverage (Abdeckung)

«insert Formel hier»

Lander-Waterman-Modell

Mathematisches Modell zur Errechnung, durch Sequenzierung, nicht abgedeckter Basenpaare.

P[nicht abgedecktes Bp] = e-c

Beispiele:
c=10 → 1 Gap in 22000 Bp
c=22 → 1 Gap in 3,6*109 Bp

(c meist bei 30)

Assemblierung der reads

A C C T G A C T A G C T G A T C A A G G - - Template
G A T C A A
A G C T G A
A C G A G C T - - Punktmutation
G A _ C A A G G - - Deletion