6 Normalisierungen: Difference between revisions

From Bioinformatik Wiki
No edit summary
No edit summary
Line 4: Line 4:
Normalisierungen der RNASeq-Daten sind notwendig, um diese vergleichbar machen zu können und die tatsächliche Genexpression quantifizieren zu können.  
Normalisierungen der RNASeq-Daten sind notwendig, um diese vergleichbar machen zu können und die tatsächliche Genexpression quantifizieren zu können.  
==RPKM==
==RPKM==
RPKM steht für 'Reads per kilobase of transcript per Million mapped reads' <br>
RPKM steht für 'Reads per kilobase of transcript per Million mapped reads'. <br>
<math> RPKM =  \frac{ c_\text{i}}{L_\text{i} \cdot N} </math>
{| class="wikitable"
|-
! Formel              !! Parameter
|-
| <math> RPKM =  \frac{ c_\text{i}}{L_\text{i} \cdot N} </math> || c<sub>i</sub> = Anzahl an ausrichtbaren reads für ein Transkript 'i'<br>
L<sub>i</sub> = Länge des Transkripts/Gens 'i' in Kbp <br>
N = Gesamtanzahl an ausrichtbaren reads in Millionen
|} <br>
Beispiel: <br>
 
[[File:Beispiel Probe.png|Beispiel Probe]] <br><br>
 
 
 
==TPM==
==TPM==
TPM steht für 'Transcripts per Million' <br>
TPM steht für 'Transcripts per Million'. <br>
<math>  TPM =  \frac{ c_\text{i}}{L_\text{i}}  \cdot  \dfrac {1}{\sum_\text{n} \dfrac {c_\text{n}}{L_\text{n}}}  \cdot 10^6 </math>
 
{| class="wikitable"
|-
! Formel              !! Parameter
|-
|<math>  TPM =  \frac{ c_\text{i}}{L_\text{i}}  \cdot  \dfrac {1}{\sum_\text{n} \dfrac {c_\text{n}}{L_\text{n}}}  \cdot 10^6 </math> <br> || c<sub>i</sub> = Anzahl an ausrichtbaren reads für ein Transkript 'i'<br>
L<sub>i</sub> = Länge des Transkripts/Gens 'i' in Kbp <br>
N = Gesamtanzahl an ausrichtbaren reads in Millionen
|} <br>


==TMM==
==TMM==
TMM steht für 'Trimmed mean of M-values normalization method'
TMM steht für 'Trimmed mean of M-values normalization method'.


<math> M_\text{gk}^\text{k`} = log_2  \dfrac { \dfrac {Y_\text{gk}}{N_\text{k}}}{ \dfrac {Y_\text{gk`}}{N_\text{k`}}}  </math>
<math> M_\text{gk}^\text{k`} = log_2  \dfrac { \dfrac {Y_\text{gk}}{N_\text{k}}}{ \dfrac {Y_\text{gk`}}{N_\text{k`}}}  </math>

Revision as of 18:23, 3 June 2019

Auf dieser Seite sind die Themen zusammengeführt, die in Vorlesung 5 am 16.05.2019 behandelt wurden.

Normalisierungen

Normalisierungen der RNASeq-Daten sind notwendig, um diese vergleichbar machen zu können und die tatsächliche Genexpression quantifizieren zu können.

RPKM

RPKM steht für 'Reads per kilobase of transcript per Million mapped reads'.

Formel Parameter
[math]\displaystyle{ RPKM = \frac{ c_\text{i}}{L_\text{i} \cdot N} }[/math] ci = Anzahl an ausrichtbaren reads für ein Transkript 'i'

Li = Länge des Transkripts/Gens 'i' in Kbp
N = Gesamtanzahl an ausrichtbaren reads in Millionen


Beispiel:

Beispiel Probe


TPM

TPM steht für 'Transcripts per Million'.

Formel Parameter
[math]\displaystyle{ TPM = \frac{ c_\text{i}}{L_\text{i}} \cdot \dfrac {1}{\sum_\text{n} \dfrac {c_\text{n}}{L_\text{n}}} \cdot 10^6 }[/math]
ci = Anzahl an ausrichtbaren reads für ein Transkript 'i'

Li = Länge des Transkripts/Gens 'i' in Kbp
N = Gesamtanzahl an ausrichtbaren reads in Millionen


TMM

TMM steht für 'Trimmed mean of M-values normalization method'.

[math]\displaystyle{ M_\text{gk}^\text{k`} = log_2 \dfrac { \dfrac {Y_\text{gk}}{N_\text{k}}}{ \dfrac {Y_\text{gk`}}{N_\text{k`}}} }[/math]


[math]\displaystyle{ log_2 (TMM_\text{k}^\text{k`}) = \frac{ \underset {g \in G}{\sum} W_\text{gk}^\text{k´} \cdot M_\text{gk}^\text{k´}} { \sum_{g \in G} W_\text{gk}^\text{k´}} }[/math]



[math]\displaystyle{ W_\text{gk}^\text{k`} = \frac{ N_\text{k} - Y_\text{gk}}{N_\text{k} \cdot Y_\text{gk}} + \frac{ N_\text{k`} - Y_\text{gk`}}{N_\text{k`} \cdot Y_\text{gk`}} }[/math]


Der Spaß hier wird morgen erweitert, hab mich nur mit den Formeln vertraut gemacht :D _ Vero