6.Normalisierungen

Aufgabe 1: Grundlagen

a. Warum ist es notwendig RNASeq Daten zu normalisieren?

Die Normalisierung von RNASeq Daten ist notwendig, um die Genexpression quantifizieren zu können und diese von verschiedenen Genen miteinander vergleichen zu können. Da die erhaltenen Daten meist sehr unterschiedlich sind, aufgrund verschiedener Genlängen und Sequenziertiefen etc., müssen diese erst durch die Normalisierungen aneinander angeglichen werden, um einen aussagekräftigen Vergleich möglich zu machen.

b. Rolle der Sequenziertiefe und Genlänge

Die Sequenziertiefen und Genlängen müssen normalisiert werden, um die erhaltenen RNASeq Daten miteinander vergleichen zu können, da diese oft sehr unterschiedlich sind und das die Auswertung beeinflussen kann. So erhält man für längere Gene möglicherweise mehr reads, als für kürzere Gene, obwohl die Genexpression gleich ist, würde man da fälschlicherweise annehmen, dass das längere Gen stärker exprimiert wird. Bei einer hohen Sequenziertiefe erhält man mehr reads, als bei einer niedrigen Sequenziertiefe, dabei muss das Verhältnis der erhaltenen reads für ein Gen, zu der Gesamtzahl an reads einer Sequenzierung beachtet werden, dies ist durch Normalisierungen möglich.

Aufgabe 2: RPKM und TPM

Gen & Genlänge (L)	Counts (c) Replikat 1	Counts (c) Replikat 2
A (7 kb)	5	16
B (12 kb)	10	36
C (0,5 kb)	2	8
D (25 kb)	1	0

a. Normalisierung mit RPKM

RPKM steht für 'Reads per kilobase of transcript per Million mapped reads'
Für die Normalisierung wird die Formel [math]\displaystyle{ RPKM = \frac{ c_\text{i}}{L_\text{i} \cdot N} }[/math] verwendet.

Parameter:
c_i = Anzahl an ausrichtbaren reads für ein Transkript 'i'
L_i = Länge des Transkripts/Gens 'i' in kbp
N = Gesamtanzahl an ausrichtbaren reads in Millionen

 [math]\displaystyle{    \frac{ c_\text{i}}{L_\text{i}}  }[/math]  → Normalisierung der Genlänge 

 [math]\displaystyle{  L_\text{i} \cdot N  }[/math] → Normalisierung der Sequenziertiefe

In dieser Aufgabe:
c = siehe Tabelle
L = siehe Tabelle
N (Replikat 1) = 18 | N (Replikat 2) = 60

Anonymous

Search

6.Normalisierungen

Namespaces

More

Page actions

Contents

Aufgabe 1: Grundlagen

a. Warum ist es notwendig RNASeq Daten zu normalisieren?

b. Rolle der Sequenziertiefe und Genlänge

Aufgabe 2: RPKM und TPM

a. Normalisierung mit RPKM

b. Normalisierung mit TPM

c Anwendungsbereich

Aufgabe 3: Normalisierung zwischen Proben

Navigation

Navigation

Wiki tools

Wiki tools

Anonymous

Search

6.Normalisierungen

Aufgabe 1: Grundlagen

a. Warum ist es notwendig RNASeq Daten zu normalisieren?

b. Rolle der Sequenziertiefe und Genlänge

Aufgabe 2: RPKM und TPM

a. Normalisierung mit RPKM

b. Normalisierung mit TPM

c Anwendungsbereich

Aufgabe 3: Normalisierung zwischen Proben

Navigation

Wiki tools

Page tools