RPKM
From Bioinformatik Wiki
RPKM
RPKM steht für 'Reads per kilobase of transcript per Million mapped reads' und ist eine Normalisierungsmethode für Expressionsstärken von Genen aus einer Probe.
Formel | Parameter |
---|---|
[math]\displaystyle{ RPKM = \frac{ c_\text{i}}{L_\text{i} \cdot N} }[/math] | ci = Anzahl an ausrichtbaren reads für ein Transkript 'i' Li = Länge des Transkripts/Gens 'i' in kbp |
[math]\displaystyle{ \frac{ c_\text{i}}{L_\text{i}} }[/math] → Normalisierung der Genlänge
[math]\displaystyle{ L_\text{i} \cdot N }[/math] → Normalisierung der Sequenziertiefe
Je höher der RPKM-Wert ist, desto höher ist die Genexpression.
RPKM-Werte können gut zum Vergleich der Genexpressionen innerhalb einer Probe genutzt werden, jedoch sind sie nicht dafür geeignet mehrere Experimente bzw. Proben miteinander zu vergleichen.
Beispiel:
- [math]\displaystyle{ RPKM (A) = \frac{12}{0,6 kbp \cdot 6 \cdot 10^6} = 3,33 \cdot 10^{-6} }[/math]
- [math]\displaystyle{ RPKM (B) = \frac{24}{1,1 kbp \cdot 6 \cdot 10^6} = 3,64 \cdot 10^{-6} }[/math]
- [math]\displaystyle{ RPKM (C) = \frac{12}{1,4 kbp \cdot 6 \cdot 10^6} = 1,43 \cdot 10^{-6} }[/math]
Durch die Normalisierung der Expressionsstärken können diese nun miteinander vergleichen werden.In diesem Beispiel wird Gen B am stärksten exprimiert und Gen C am schwächsten.