2 Transkriptom RNA Seq 1: Difference between revisions
m (→FASTQ) |
No edit summary |
||
Line 6: | Line 6: | ||
== Experiment == | == Experiment == | ||
[[File:Vorlesung 2 Experiment Skizze.jpg|400px|center|thumb]]<br /> | |||
* | * Aus zwei Tumorzellkulturen wird die mRNA extrahiert | ||
* mit Hilfe der reversen Transkriptase wird cDNA transkribiert | |||
* cDNA wird sequenziert | |||
* Sequenzunterschiede können analysiert werden <br> | |||
== Sanger Methode == | == Sanger Methode == | ||
Line 19: | Line 22: | ||
=== Illumina Sequencing (2nd Generation Sequencing) === | === Illumina Sequencing (2nd Generation Sequencing) === | ||
< | [[File:Cluster Generation.png|left|thumb|600px|The DNA attaches to the flow cell via complementary sequences. The strand bends over and attaches to a second oligo forming a bridge. A polymerase synthesizes the reverse strand. The two strands release and straighten. Each forms a new bridge (bridge amplification). The result is a cluster of DNA forward and reverse strands clones.]]<br> | ||
Ergebnis der Illumina Sequenzierung: | Ergebnis der Illumina Sequenzierung: | ||
Line 70: | Line 73: | ||
{| | {| | ||
|- | |- | ||
| -A || -C || -C || -T || -G || -A || -C || -T || -A || -G || -C || -T || -G || -A || -T || -C || -A || -A || -G || -G || -|| -|| Template | | -A || -C || -C || -T || -G || -A || -C || <span style=" border-style: solid; border-width: 2px; margin: 2px"> T</span>|| -A || -G || -C || -T || -G || -A || -T || -C || -A || -A || -G || -G || -|| -|| Template | ||
|- | |- | ||
| || || || || || || || || || || || || -G || -A || -T || -C || -A || -A || || || || || || | | || || || || || || || || || || || || -G || -A || -T || -C || -A || -A || || || || || || |
Revision as of 22:16, 8 May 2019
Auf dieser Seite sind die Themen zusammengeführt, die in Vorlesung 2 am 18.04.2019 behandelt wurden.
Biologische Fragestellung
Da NAT8L in euren Prostatakarzinomzellen erhöht exprimiert ist, habt ihr euch entschlossen die Genexpression durch RNAi (RNA Interferenz) zu silencen.
Experiment
- Aus zwei Tumorzellkulturen wird die mRNA extrahiert
- mit Hilfe der reversen Transkriptase wird cDNA transkribiert
- cDNA wird sequenziert
- Sequenzunterschiede können analysiert werden
Sanger Methode
Als Wiederholung:
400px][https://de.wikipedia.org/wiki/DNA-Sequenzierung#Didesoxymethode_nach_Sanger
Next Generation Sequencing (NGS)
Illumina Sequencing (2nd Generation Sequencing)

Ergebnis der Illumina Sequenzierung:
- Länge der reads 50-600bp
- Fehlerrate ca. 0,1%
- humanes Genom kann 30x am Tag sequenziert werden
- Daten werden in FASTQ Format geliefert
FASTQ
Eine FASTQ-Datei ist folgendermaßen aufgebaut:
@identifier # Sequenz identifier GATCTT # Sequenz + optionale Beschreibung !'CC'*+*!? # Qualität für jedes Level (Zahlenwert repräsentiert durch ASCII Tabelle
Problem
Viele kurze reads, die in einen Zusammenhang gebracht werden müssen!
Sequenzabdeckung
G: Länge der Genomsequenz
N: Anzahl der reads
L: durchschnittliche Länge der reads
c: Coverage (Abdeckung)
«insert Formel hier»
Lander-Waterman-Modell
Mathematisches Modell zur Errechnung, durch Sequenzierung, nicht abgedeckter Basenpaare.
P[nicht abgedecktes Bp] = e-c
Beispiele:
c=10 → 1 Gap in 22000 Bp
c=22 → 1 Gap in 3,6*109 Bp
(c meist bei 30)
Assemblierung der reads
-A | -C | -C | -T | -G | -A | -C | T | -A | -G | -C | -T | -G | -A | -T | -C | -A | -A | -G | -G | - | - | Template | |||
-G | -A | -T | -C | -A | -A | ||||||||||||||||||||
-A | -G | -C | -T | -G | -A | ||||||||||||||||||||
-A | -C | G | -A | -G | -C | -T | - | - | Punktmutation | ||||||||||||||||
-G | -A | -_ | -C | -A | -A | -G | -G | - | - | Deletion |