2 Transkriptom RNA Seq 1: Difference between revisions
From Bioinformatik Wiki
(→FASTQ) |
|||
Line 60: | Line 60: | ||
Beispiele:</br> | Beispiele:</br> | ||
C=10 → 1 Gap in 22000 Bp</br> | |||
C=22 → 1 Gap in 3,6*10<sup>9</sup> Bp</br> | |||
<big>(c meist bei 30)</big> | <big>(c meist bei 30)</big> |
Revision as of 20:05, 28 January 2021
Biologische Fragestellung
Da NAT8L in euren Prostatakarzinomzellen erhöht exprimiert ist, habt ihr euch entschlossen die Genexpression durch RNAi (RNA Interferenz) zu silencen.
Experiment
- Aus zwei Tumorzellkulturen wird die mRNA extrahiert
- mit Hilfe der reversen Transkriptase wird cDNA transkribiert
- cDNA wird sequenziert
- Sequenzunterschiede können analysiert werden
Sanger Methode
Als Wiederholung:
Next Generation Sequencing (NGS)
Illumina Sequencing (2nd Generation Sequencing)

1. Nach der Fragmentierung und Legierung der Adapter-Molekülen, heften sich die Fragmente an komplementäre Adaptersequenzen in der "flow cell". 2. Die DNA biegt sich um den zweiten Adapter zu hybridisieren. 3-4. Die Polymerase synthetisiert den komplementären Strang. 5. Die Stränge denaturieren und bilden neue Brücken. Das Resultat sind Cluster der DNA-Stränge.
Ergebnis der Illumina Sequenzierung:
- Länge der reads 50-600bp
- Fehlerrate ca. 0,1%
- humanes Genom kann 30x am Tag sequenziert werden
- Daten werden in FASTQ Format geliefert
FASTQ
Eine FASTQ-Datei ist folgendermaßen aufgebaut:
@ Identifier # Sequenz identifier GATCTT # Sequenz + # optionale Beschreibung !'CC'*+*!? # Qualität jedes Nukleotids (Zahlenwert repräsentiert durch ASCII Tabelle)
Problem
Viele kurze reads, die in einen Zusammenhang gebracht werden müssen!
Sequenzabdeckung
G: Länge der Genomsequenz
N: Anzahl der reads
L: durchschnittliche Länge der reads
C: Coverage (Abdeckung)
[math]\displaystyle{ C= \frac{N*L}{G} }[/math]
Lander-Waterman-Modell
Mathematisches Modell zur Errechnung, durch Sequenzierung, nicht abgedeckter Basenpaare.
P[nicht abgedecktes Bp] = e-c
Beispiele:
C=10 → 1 Gap in 22000 Bp
C=22 → 1 Gap in 3,6*109 Bp
(c meist bei 30)
Assemblierung der reads
-A | -C | -C | -T | -G | -A | -C | T | -A | -G | -C | -T | -G | -A | -T | -C | -A | -A | -G | -G | - | - | Template | |||
-G | -A | -T | -C | -A | -A | ||||||||||||||||||||
-A | -G | -C | -T | -G | -A | ||||||||||||||||||||
-A | -C | G | -A | -G | -C | -T | - | - | Punktmutation | ||||||||||||||||
-G | -A | -_ | -C | -A | -A | -G | -G | - | - | Deletion |