<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="en">
	<id>http://wiki.bioinfo.nat.tu-bs.de/api.php?action=feedcontributions&amp;feedformat=atom&amp;user=Vero</id>
	<title>Bioinformatik Wiki - User contributions [en]</title>
	<link rel="self" type="application/atom+xml" href="http://wiki.bioinfo.nat.tu-bs.de/api.php?action=feedcontributions&amp;feedformat=atom&amp;user=Vero"/>
	<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/Special:Contributions/Vero"/>
	<updated>2026-05-28T19:13:22Z</updated>
	<subtitle>User contributions</subtitle>
	<generator>MediaWiki 1.39.7</generator>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=7_Multiples_Testen&amp;diff=186</id>
		<title>7 Multiples Testen</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=7_Multiples_Testen&amp;diff=186"/>
		<updated>2019-07-02T07:12:31Z</updated>

		<summary type="html">&lt;p&gt;Vero: /* Lösung 2: Benjamini-Hochberg-Prozedur */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;=Multiples Testen=&lt;br /&gt;
[[File:VL7.png|right|frameless|thumb]] &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
In der Tabelle sind die Werte für 4 Gene dargestellt. Insgesamt wurden 5000 Gene untersucht. &amp;lt;br&amp;gt;&lt;br /&gt;
* K1-3 stellen die Kontrollen dar. &amp;lt;br&amp;gt;&lt;br /&gt;
* T1-3 die getesteten mit dem NAT8L knock-out.&lt;br /&gt;
* Der fold change stellt das Verhältnis von knock-out und Kontrolle dar             → Hoch oder runter regulierte Gene.&lt;br /&gt;
* Die Ergebnisse sind nicht gut vergleichbar, da sie teilweise eine große Streuung zeigen.&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot; style=&amp;quot;text-align:center&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Gen !!  K1 !! K2 !!  K3 !!  T1 !! T2 !! T3 !! &amp;lt;math&amp;gt;\overline{X}&amp;lt;/math&amp;gt; Kontrolle !! &amp;lt;math&amp;gt;\overline{X}&amp;lt;/math&amp;gt; -NAT8L !! fold change !! p-Wert !! pi-Wert&lt;br /&gt;
|-&lt;br /&gt;
| NAT8L || 340 || 348 || 350 || 2 || 0 || 4 || 340 || 2 || 0,0058 || 1,00 x &amp;lt;math&amp;gt;10^{-5}&amp;lt;/math&amp;gt; || 0,05&lt;br /&gt;
|-&lt;br /&gt;
| LDH || 57 || 68 || 34 || 112 || 128 || 105 || 59,7 || 115 || 1,93 || 0,0043 || 21,5&lt;br /&gt;
|-&lt;br /&gt;
| IDH || 215 || 110 || 55 || 158 || 357 || 415 || 126,7 || 310 || 2,44 || 0,129 || 645 &lt;br /&gt;
|-&lt;br /&gt;
| HIF1&amp;lt;math&amp;gt;\alpha&amp;lt;/math&amp;gt; || 57 || 58 || 57 || 564 || 570 || 565 || 57,3 || 566,3 || 9,88 || 7,2 x &amp;lt;math&amp;gt;10^{-6}&amp;lt;/math&amp;gt; || 0,036&lt;br /&gt;
|-&lt;br /&gt;
|}&lt;br /&gt;
== t-Test==&lt;br /&gt;
Der t-Test wird verwendet, um zu bestimmen, ob die Mittelwerte zweier Stichproben sich signifikant voneinander unterscheiden. Dafür wird die Nullhypothese H0 getestet, sie sagt aus, dass Stichprobe und Kontrolle sich nicht signifikant unterscheiden. In diesem Fall also  &amp;lt;math&amp;gt;H_0: \overline{X} Kontrolle = \overline{X}-NAT8L &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Die Gegenhypothese H1 sagt aus, dass sich die Ergebnisse signifikant unterscheiden, also &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt;H_1: \overline{X} Kontrolle \ne \overline{X}-NAT8L &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
Mit Hilfe des t-Tests wird bestimmt, ob die Nullhypothese zutrifft, oder ob sie verworfen wird und die Gegenhypothese angenommen wird. Die Formel zur Berechnung der t-Werte entspricht: &amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;math&amp;gt; t = \frac{\overline{X}_{1} - \overline{X}_{2} }{s_{x} \cdot \surd \frac{1}{n_{1}} + \frac{1}{n_{2}}} &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''Parameter:''' &amp;lt;br&amp;gt;&lt;br /&gt;
* &amp;lt;math&amp;gt;\overline{X}_1 &amp;lt;/math&amp;gt;  = Mittelwert Stichprobe 1&amp;lt;br&amp;gt;&lt;br /&gt;
* &amp;lt;math&amp;gt;\overline{X}_2  &amp;lt;/math&amp;gt; = Mittelwert Stichprobe 2 &amp;lt;br&amp;gt;&lt;br /&gt;
* &amp;lt;math&amp;gt;s_x  &amp;lt;/math&amp;gt; = Standardabweichung&lt;br /&gt;
* n = Größe der Stichprobe&amp;lt;br&amp;gt;&lt;br /&gt;
Nach der Berechnung der t- Werte, Standardabweichung und den Freiheitsgraden werden die t-Werte in die t-Verteilung eingesetzt. Daraus kann mit Hilfe des p-Werts beurteilt werden, ob die Nullhypotese angenommen, oder verworfen wird.&amp;lt;br&amp;gt;&lt;br /&gt;
===P-Wert===&lt;br /&gt;
Der p-Wert &lt;br /&gt;
&lt;br /&gt;
'''Problem:'''&amp;lt;br&amp;gt;&lt;br /&gt;
In diesem Fall wurden 5000 Genexpressionen verglichen (n=5000). Statistisch gesehen werden ca. 250 Gene durch Zufall einen p-Wert von &amp;lt;math&amp;gt;\leq&amp;lt;/math&amp;gt; 0,05 haben. → &amp;lt;math&amp;gt;\alpha&amp;lt;/math&amp;gt;-Fehler (Fehler 1. Art)&lt;br /&gt;
* Fehler 1. Art: Die Nullhypothese wird verworfen, obwohl sie eigentlich zutrifft.&lt;br /&gt;
&lt;br /&gt;
==Lösung 1: Bonferroni-Korrektur==&lt;br /&gt;
* Für jeden p-Wert wird ein neuer p-Wert berechnet.&lt;br /&gt;
* Bestimmter p-Wert wird mit Größe der Stichprobe multipliziert.&lt;br /&gt;
&amp;lt;math&amp;gt;P_i* = P_i \cdot n &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
'''Parameter:'''&amp;lt;br&amp;gt;&lt;br /&gt;
* &amp;lt;math&amp;gt;P_i = &amp;lt;/math&amp;gt; Bestimmter p-Wert für Gen 'i' &amp;lt;br&amp;gt;&lt;br /&gt;
* &amp;lt;math&amp;gt;P_i* = &amp;lt;/math&amp;gt; Korrigierter P-Wert für Gen 'i'&amp;lt;br&amp;gt;&lt;br /&gt;
* n = Größe der Stichprobe&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot; style=&amp;quot;float:left; margin-right:1em&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
!  Gen !! &amp;lt;math&amp;gt;P_i  &amp;lt;/math&amp;gt; !! &amp;lt;math&amp;gt;P_i* =&amp;lt;/math&amp;gt; &lt;br /&gt;
|-&lt;br /&gt;
| NAT8L || 1,00 x &amp;lt;math&amp;gt;10^{-5}&amp;lt;/math&amp;gt; || 0,05 → Signifikant&lt;br /&gt;
|-&lt;br /&gt;
| LDH || 0,0043 || 21,5&lt;br /&gt;
|-&lt;br /&gt;
| IDH || 0,129 || 645&lt;br /&gt;
|-&lt;br /&gt;
|HIF1&amp;lt;math&amp;gt;\alpha&amp;lt;/math&amp;gt; || 7,2 x &amp;lt;math&amp;gt;10^{-6}&amp;lt;/math&amp;gt; || 0,036 → Signifikant&lt;br /&gt;
|}&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot; style=&amp;quot;float:left&amp;quot;&lt;br /&gt;
! Vorteile || Nachteile&lt;br /&gt;
|-&lt;br /&gt;
| -  Statistisch sehr sicher || - Statistisch sehr sicher, aber auch sehr streng &lt;br /&gt;
|-&lt;br /&gt;
| || - Produzuert viele falsch negative Ergebnisse&lt;br /&gt;
|-&lt;br /&gt;
|}&lt;br /&gt;
&amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
==Lösung 2: Benjamini-Hochberg-Prozedur== &lt;br /&gt;
* Eine Alternative zu Bonferroni, die nicht so streng ist. &amp;lt;br&amp;gt;&lt;br /&gt;
* Es wird ein gewisser Prozentsatz bestimmt, der auch falsch akzeptiert wird. &amp;lt;br&amp;gt;&lt;br /&gt;
* Q als Bezeichnung für die False Discovery Rate (FDR).&amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;br&amp;gt;&lt;br /&gt;
# Sortiere alle p-Werte aufsteigend. &amp;lt;br&amp;gt;&lt;br /&gt;
# Weise jedem p-Wert einen Rang 'i' zu. &amp;lt;br&amp;gt;&lt;br /&gt;
# Berechne für jeden p-Wert den Benjamini-Hochberg kritischen Wert. &amp;lt;br&amp;gt;&lt;br /&gt;
# Vergleiche original p-Wert mit kritischem BH und finde den größten p-Wert (&amp;lt;math&amp;gt; p_k &amp;lt;/math&amp;gt;), der kleiner, als der der kritische BH ist.&lt;br /&gt;
# Lehne alle Nullhypothesen &amp;lt;math&amp;gt; H_t&amp;lt;/math&amp;gt; für t= 1 bis k ab.&lt;br /&gt;
&lt;br /&gt;
Benjamini-Hochberg kritischer Wert (BH) = &amp;lt;math&amp;gt;\frac{i}{n} \cdot Q &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
'''Parameter:''' &amp;lt;br&amp;gt;&lt;br /&gt;
n = Anzahl der Tests &amp;lt;br&amp;gt;&lt;br /&gt;
i = Rang &amp;lt;br&amp;gt;&lt;br /&gt;
Q = False Discovery Rate &amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''Beispiel:'''&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot; style=&amp;quot;text-align:center&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Gen !!  p-Wert !! Rang 'i'  !!  BH !! p &amp;lt; BH !! Signifikant für Q = 5 %&lt;br /&gt;
|-&lt;br /&gt;
| HIF1&amp;lt;math&amp;gt;\alpha&amp;lt;/math&amp;gt; || 7,2 x &amp;lt;math&amp;gt;10^{-6}&amp;lt;/math&amp;gt; || 1 || 1 x &amp;lt;math&amp;gt;10^{-5}&amp;lt;/math&amp;gt; || wahr || ja&lt;br /&gt;
|-&lt;br /&gt;
| MDH || 2,5 x &amp;lt;math&amp;gt;10^{-5}&amp;lt;/math&amp;gt; || 2 || 2 x &amp;lt;math&amp;gt;10^{-5}&amp;lt;/math&amp;gt; || falsch ||ja&lt;br /&gt;
|-&lt;br /&gt;
| HK || 2,8 x &amp;lt;math&amp;gt;10^{-5}&amp;lt;/math&amp;gt; || 3 || 3 x &amp;lt;math&amp;gt;10^{-5}&amp;lt;/math&amp;gt; || '''wahr''' || → '''ja'''&lt;br /&gt;
|-&lt;br /&gt;
| LDH || 0,0043 || 4 || 4 x &amp;lt;math&amp;gt;10^{-5}&amp;lt;/math&amp;gt; || falsch || nein&lt;br /&gt;
|-&lt;br /&gt;
| PDH || 0,02 ||5 || 5 x &amp;lt;math&amp;gt;10^{-5}&amp;lt;/math&amp;gt;|| falsch || nein&lt;br /&gt;
|-&lt;br /&gt;
| IDH || 0,129 || 6 || 6 x &amp;lt;math&amp;gt;10^{-5}&amp;lt;/math&amp;gt; || falsch || nein&lt;br /&gt;
|-&lt;br /&gt;
| ...4994 weitere Gene || ... || ... || ... ||... || ...&lt;br /&gt;
|-&lt;br /&gt;
|}&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=9_Biomarker&amp;diff=185</id>
		<title>9 Biomarker</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=9_Biomarker&amp;diff=185"/>
		<updated>2019-07-02T00:31:43Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Biomarker =&lt;br /&gt;
'''Medizinische Biomarker'''&amp;lt;br&amp;gt;&lt;br /&gt;
* Ein Biomarker ist ein messbarer Parameter biologischer Prozesse, der prognostische, oder diagnostische Aussagekraft hat und somit ein Indikator für Krankheiten, oder Umwelteinflüsse ist. &lt;br /&gt;
* Charakteristische biologische Merkmale, die objektiv gemessen werden können und auf einen normalen biologischen, oder krankhaften Prozess im Körper hinweisen können. &lt;br /&gt;
*  Es können Zellen, Gene, Genprodukte, Enzyme, oder Hormone sein.&lt;br /&gt;
[[File:VL8 1.png|mini|850px]]&lt;br /&gt;
Wie in der Abbildung oben dargestellt, kann über Einzelwerte keine Aussage getroffen werden, ob der Patient krank oder gesund ist. &amp;lt;br&amp;gt;&lt;br /&gt;
→ deswegen bedarf es mehrerer Biomarker &amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''Frage:''' &amp;lt;br&amp;gt;&lt;br /&gt;
Wie kann für einen TPM-Wert vorhergesagt werden, ob es sich um 'Krebs' oder 'gesund' handelt?&amp;lt;br&amp;gt;&lt;br /&gt;
==Logistische Funktion==&lt;br /&gt;
&amp;lt;math&amp;gt; y = \beta_1 \cdot TPM_{HIF1\alpha} + \beta_0 &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt; logit_{(P)} = log \frac{P}{1-P} &amp;lt;/math&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
* Damit wird die Wahrscheinlichkeit, dass jemand z.B. Krebs bekommt durch Gegenwahrscheinlichkeit bestimmt. &amp;lt;br&amp;gt;&lt;br /&gt;
''' WIRD NOCH FERTIG GEMACHT'''&lt;br /&gt;
==Biomarkersignatur==&lt;br /&gt;
Erweiterung für mehrere Gene: &lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt; P(x) = \frac{1}{e^{-((\beta)_1 \cdot x_1) + ((\beta)_2 \cdot x_1) + .... + (\beta)_n \cdot x_n) + \beta_0)}}&amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
'''Mashine learning''' &amp;lt;br&amp;gt;&lt;br /&gt;
* Ein Modell muss zunächst von einem System erlent werden, dann kann das System eine Aussage treffen, ob z.B. 'krank' oder 'gesund'. &amp;lt;br&amp;gt;&lt;br /&gt;
* Parameter &amp;lt;math&amp;gt; \beta_1 &amp;lt;/math&amp;gt; und &amp;lt;math&amp;gt; \beta_0 &amp;lt;/math&amp;gt; können nicht berechnet werden. →  Müssen mit Hilfe eines Algorithmus geschätzt werden. &amp;lt;br&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''Maximum-Likelihood:''' &amp;lt;br&amp;gt;&lt;br /&gt;
* Schätzung zur Parameterbestimmung. &amp;lt;br&amp;gt;&lt;br /&gt;
* ''Training'': Lerndaten sind bekannte Werte zur Aussage 'krank' oder 'gesund' &amp;lt;br&amp;gt;&lt;br /&gt;
→  Algorithmus bestimmt einen genauen Wert für &amp;lt;math&amp;gt; \beta_1&amp;lt;/math&amp;gt;, um krank (1) und gesund (0) zu bestimmen. &amp;lt;br&amp;gt;&lt;br /&gt;
→  Danach kann mit dem Modell bestimmt werden, ob es gut oder schlecht ist. &amp;lt;br&amp;gt;&lt;br /&gt;
*'''Problem''': System versucht einen optimalen Wert zu finden &amp;lt;br&amp;gt;&lt;br /&gt;
→  ''Overfitting'': Zu genaue Beschreibung des Modells.&amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
'''Frage:''' Wie gut ist die Qualität des Modells? &amp;lt;br&amp;gt;&lt;br /&gt;
==Receiver Operation Characteristic (ROC)== &lt;br /&gt;
Wird genutzt um zu prüfen, ob das Modell gut ist. &amp;lt;br&amp;gt;&lt;br /&gt;
→ Wie viele falsch positive, falsch negative, aber auch richtig positive und richtig negative Aussagen trifft das Modell? &amp;lt;br&amp;gt;&lt;br /&gt;
{| class=&amp;quot;wikitable float-left&amp;quot; style=&amp;quot;text-align:center&amp;quot;&lt;br /&gt;
| || ||colspan=&amp;quot;3&amp;quot; style=&amp;quot;text-align:center&amp;quot;| Mensch&lt;br /&gt;
|-&lt;br /&gt;
| || ||  '''Krebs''' || '''Gesund''' &lt;br /&gt;
|-&lt;br /&gt;
|rowspan=&amp;quot;2&amp;quot;| Modellvorhersage&lt;br /&gt;
| '''Krebs''' ||style=&amp;quot;background:#B9FFC5 &amp;quot; | TP ||  	style=&amp;quot;background:#FFCBCB| FP&lt;br /&gt;
|-&lt;br /&gt;
| '''Gesund''' ||style=&amp;quot;background:#FFCBCB| FN || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN&lt;br /&gt;
|-&lt;br /&gt;
|}&lt;br /&gt;
Beispiel 'Krebs' = positiv, 'geund' = negativ&lt;br /&gt;
* &amp;lt;span style=&amp;quot;background:#B9FFC5&amp;quot;&amp;gt; TP&amp;lt;/span&amp;gt;: True Positive (richtig positiv)  → Modell sagt 'Krebs' richtig voraus. &amp;lt;br&amp;gt;&lt;br /&gt;
*&amp;lt;span style=&amp;quot;background:#B9FFC5&amp;quot;&amp;gt; TN&amp;lt;/span&amp;gt;: True Negative (richtig negativ) → Modell sagt 'gesund' richtig voraus. &amp;lt;br&amp;gt;&lt;br /&gt;
*&amp;lt;span style=&amp;quot;background:#FFCBCB&amp;quot;&amp;gt; FP&amp;lt;/span&amp;gt;: False Positive (falsch positiv) → Modell sagt der Patient hat Krebs, obwohl er gesund ist. &amp;lt;br&amp;gt;&lt;br /&gt;
*&amp;lt;span style=&amp;quot;background:#FFCBCB&amp;quot;&amp;gt; FN&amp;lt;/span&amp;gt;: False Negative (falsch negativ) → Modell sagt 'gesund', obwohl der Patient Krebs hat. &amp;lt;br&amp;gt;&lt;br /&gt;
==Testen auf Sensitivität==&lt;br /&gt;
Möglichst viele 'Kranke' sollen richtig bestimmt werden. &amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;math&amp;gt; \text{Sensitivität} = \frac{\text{TP}}{\text{TP + FN}} &amp;lt;/math&amp;gt;&lt;br /&gt;
* Bei einem perfekten Modell gibt dieses keine falsch negativen Ergebnisse aus. &amp;lt;br&amp;gt;&lt;br /&gt;
* Ausgabe 1 = Perfektes Modell, erkennt alle mit Krebs. &amp;lt;br&amp;gt;&lt;br /&gt;
* Ausgabe 0 = Schlechtes Modell, erkennt keine mit Krebs. &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
==Testen auf Spezifität==&lt;br /&gt;
Möglichst viele 'Gesunde' sollen richtig bestimmt werden. &amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;math&amp;gt; \text{Spezifität} = \frac{\text{TN}}{\text{ FP + TN}} &amp;lt;/math&amp;gt;&lt;br /&gt;
*Entweder hohe Sensitivität oder hohe Spezifität. &amp;lt;br&amp;gt;&lt;br /&gt;
* Was besser ist kommt auf die Fragestellung an. &amp;lt;br&amp;gt;&lt;br /&gt;
'''Treshold''': &amp;lt;br&amp;gt;&lt;br /&gt;
Cutoff-Wert der als Grenzwert festgelegt wird nach dem beurteilt wird, ob der zu bewertende Wert 'krank', oder 'gesund' zugeordnet wird. &amp;lt;br&amp;gt;&lt;br /&gt;
'''Beispiel zur Bestimmung des optimalen Treshold''' &amp;lt;br&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
| || || || colspan=&amp;quot;5&amp;quot; style=&amp;quot;text-align:center&amp;quot;| Treshold&lt;br /&gt;
|-&lt;br /&gt;
!  Zustand !!  Ausgabe Modell !! 0 !! 0,25 !! 0,45 !! 0,55 !! 0,75&lt;br /&gt;
|-&lt;br /&gt;
| krank || 0,5 || style=&amp;quot;background:#B9FFC5 &amp;quot; |TP || style=&amp;quot;background:#B9FFC5 &amp;quot; |TP || style=&amp;quot;background:#B9FFC5 &amp;quot; |TP|| style=&amp;quot;background:#FFCBCB| FN || style=&amp;quot;background:#FFCBCB| FN &lt;br /&gt;
|- &lt;br /&gt;
| krank || 0,6 || style=&amp;quot;background:#B9FFC5 &amp;quot; | TP || style=&amp;quot;background:#B9FFC5 &amp;quot; | TP || style=&amp;quot;background:#B9FFC5 &amp;quot; | TP || style=&amp;quot;background:#B9FFC5 &amp;quot; | TP|| style=&amp;quot;background:#FFCBCB| FN&lt;br /&gt;
|-&lt;br /&gt;
| krank || 0,2 || style=&amp;quot;background:#B9FFC5 &amp;quot; | TP || style=&amp;quot;background:#FFCBCB| FN || style=&amp;quot;background:#FFCBCB| FN || style=&amp;quot;background:#FFCBCB| FN || style=&amp;quot;background:#FFCBCB| FN&lt;br /&gt;
|-&lt;br /&gt;
| krank || 0,56 || style=&amp;quot;background:#B9FFC5 &amp;quot; | TP || style=&amp;quot;background:#B9FFC5 &amp;quot; | TP|| style=&amp;quot;background:#B9FFC5 &amp;quot; | TP || style=&amp;quot;background:#B9FFC5 &amp;quot; | TP || style=&amp;quot;background:#FFCBCB|  FN&lt;br /&gt;
|- &lt;br /&gt;
| gesund || 0,5 || style=&amp;quot;background:#FFCBCB|  FP || style=&amp;quot;background:#FFCBCB| FP || style=&amp;quot;background:#FFCBCB|  FP || style=&amp;quot;background:#FFCBCB|  FP || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN &lt;br /&gt;
|-&lt;br /&gt;
| gesund || 0,1 || style=&amp;quot;background:#FFCBCB| FP || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN &lt;br /&gt;
|- &lt;br /&gt;
| gesund || 0,2 || style=&amp;quot;background:#FFCBCB| FP || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN &lt;br /&gt;
|- &lt;br /&gt;
| gesund || 0,4 || style=&amp;quot;background:#FFCBCB| FP || style=&amp;quot;background:#FFCBCB|  FP || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN  || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN &lt;br /&gt;
|}&lt;br /&gt;
*Treshold 0 = hohe Sensitivität &amp;lt;br&amp;gt;&lt;br /&gt;
*Treshold 0,75 = hohe Spezifität &amp;lt;br&amp;gt;&lt;br /&gt;
==Area Under the Curve==&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
| ||  || colspan=&amp;quot;5&amp;quot; style=&amp;quot;text-align:center&amp;quot;| Treshold&lt;br /&gt;
|-&lt;br /&gt;
! !!  !! 0 !! 0,25 !! 0,45 !! 0,55 !! 0,75&lt;br /&gt;
|-&lt;br /&gt;
| Sensitivitätt || &amp;lt;math&amp;gt;\frac{\text{TP}}{\text{TP + FN}} &amp;lt;/math&amp;gt; || style=&amp;quot;background:#FFAA00 | 1 || style=&amp;quot;background:#FFFF40 | 0,75 || style=&amp;quot;background:#B3B7FF | 0,75 || style=&amp;quot;background:#FFCBCB| 0,5 || style=&amp;quot;background:#B9FFC5 &amp;quot;| 0&lt;br /&gt;
|-&lt;br /&gt;
| Spezifität || &amp;lt;math&amp;gt;\frac{\text{TN}}{\text{ FP + TN}} &amp;lt;/math&amp;gt; || style=&amp;quot;background:#FFAA00 | 0 || style=&amp;quot;background:#FFFF40 |0,5 || style=&amp;quot;background:#B3B7FF | 0,75 || style=&amp;quot;background:#FFCBCB| 1 || style=&amp;quot;background:#B9FFC5 &amp;quot;| 1&lt;br /&gt;
|}&lt;br /&gt;
[[File:VL8 AUC.png|mini|500px]]&lt;br /&gt;
&lt;br /&gt;
*1 = optimal &amp;lt;br&amp;gt;&lt;br /&gt;
*0 = auch gut, positiv und negativ müssen nur umgedreht werden &amp;lt;br&amp;gt;&lt;br /&gt;
*0,5 = schlecht, da die Bestimmung des Systems durch Zufall erfolgt&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=9_Biomarker&amp;diff=184</id>
		<title>9 Biomarker</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=9_Biomarker&amp;diff=184"/>
		<updated>2019-07-02T00:31:04Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Biomarker =&lt;br /&gt;
'''Medizinische Biomarker'''&amp;lt;br&amp;gt;&lt;br /&gt;
* Ein Biomarker ist ein messbarer Parameter biologischer Prozesse, der prognostische, oder diagnostische Aussagekraft hat und somit ein Indikator für Krankheiten, oder Umwelteinflüsse ist. &lt;br /&gt;
* Charakteristische biologische Merkmale, die objektiv gemessen werden können und auf einen normalen biologischen, oder krankhaften Prozess im Körper hinweisen können. &lt;br /&gt;
*  Es können Zellen, Gene, Genprodukte, Enzyme, oder Hormone sein.&lt;br /&gt;
[[File:VL8 1.png|mini|850px]]&lt;br /&gt;
Wie in der Abbildung oben dargestellt, kann über Einzelwerte keine Aussage getroffen werden, ob der Patient krank oder gesund ist. &amp;lt;br&amp;gt;&lt;br /&gt;
→ deswegen bedarf es mehrerer Biomarker &amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''Frage:''' &amp;lt;br&amp;gt;&lt;br /&gt;
Wie kann für einen TPM-Wert vorhergesagt werden, ob es sich um 'Krebs' oder 'gesund' handelt?&amp;lt;br&amp;gt;&lt;br /&gt;
==Logistische Funktion==&lt;br /&gt;
&amp;lt;math&amp;gt; y = \beta_1 \cdot TPM_{HIF1\alpha} + \beta_0 &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt; logit_{(P)} = log \frac{P}{1-P} &amp;lt;/math&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
* Damit wird die Wahrscheinlichkeit, dass jemand z.B. Krebs bekommt durch Gegenwahrscheinlichkeit bestimmt. &amp;lt;br&amp;gt;&lt;br /&gt;
==Biomarkersignatur==&lt;br /&gt;
Erweiterung für mehrere Gene: &lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt; P(x) = \frac{1}{e^{-((\beta)_1 \cdot x_1) + ((\beta)_2 \cdot x_1) + .... + (\beta)_n \cdot x_n) + \beta_0)}}&amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
'''Mashine learning''' &amp;lt;br&amp;gt;&lt;br /&gt;
* Ein Modell muss zunächst von einem System erlent werden, dann kann das System eine Aussage treffen, ob z.B. 'krank' oder 'gesund'. &amp;lt;br&amp;gt;&lt;br /&gt;
* Parameter &amp;lt;math&amp;gt; \beta_1 &amp;lt;/math&amp;gt; und &amp;lt;math&amp;gt; \beta_0 &amp;lt;/math&amp;gt; können nicht berechnet werden. →  Müssen mit Hilfe eines Algorithmus geschätzt werden. &amp;lt;br&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
''' WIRD NOCH FERTIG GEMACHT'''&lt;br /&gt;
'''Maximum-Likelihood:''' &amp;lt;br&amp;gt;&lt;br /&gt;
* Schätzung zur Parameterbestimmung. &amp;lt;br&amp;gt;&lt;br /&gt;
* ''Training'': Lerndaten sind bekannte Werte zur Aussage 'krank' oder 'gesund' &amp;lt;br&amp;gt;&lt;br /&gt;
→  Algorithmus bestimmt einen genauen Wert für &amp;lt;math&amp;gt; \beta_1&amp;lt;/math&amp;gt;, um krank (1) und gesund (0) zu bestimmen. &amp;lt;br&amp;gt;&lt;br /&gt;
→  Danach kann mit dem Modell bestimmt werden, ob es gut oder schlecht ist. &amp;lt;br&amp;gt;&lt;br /&gt;
*'''Problem''': System versucht einen optimalen Wert zu finden &amp;lt;br&amp;gt;&lt;br /&gt;
→  ''Overfitting'': Zu genaue Beschreibung des Modells.&amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
'''Frage:''' Wie gut ist die Qualität des Modells? &amp;lt;br&amp;gt;&lt;br /&gt;
==Receiver Operation Characteristic (ROC)== &lt;br /&gt;
Wird genutzt um zu prüfen, ob das Modell gut ist. &amp;lt;br&amp;gt;&lt;br /&gt;
→ Wie viele falsch positive, falsch negative, aber auch richtig positive und richtig negative Aussagen trifft das Modell? &amp;lt;br&amp;gt;&lt;br /&gt;
{| class=&amp;quot;wikitable float-left&amp;quot; style=&amp;quot;text-align:center&amp;quot;&lt;br /&gt;
| || ||colspan=&amp;quot;3&amp;quot; style=&amp;quot;text-align:center&amp;quot;| Mensch&lt;br /&gt;
|-&lt;br /&gt;
| || ||  '''Krebs''' || '''Gesund''' &lt;br /&gt;
|-&lt;br /&gt;
|rowspan=&amp;quot;2&amp;quot;| Modellvorhersage&lt;br /&gt;
| '''Krebs''' ||style=&amp;quot;background:#B9FFC5 &amp;quot; | TP ||  	style=&amp;quot;background:#FFCBCB| FP&lt;br /&gt;
|-&lt;br /&gt;
| '''Gesund''' ||style=&amp;quot;background:#FFCBCB| FN || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN&lt;br /&gt;
|-&lt;br /&gt;
|}&lt;br /&gt;
Beispiel 'Krebs' = positiv, 'geund' = negativ&lt;br /&gt;
* &amp;lt;span style=&amp;quot;background:#B9FFC5&amp;quot;&amp;gt; TP&amp;lt;/span&amp;gt;: True Positive (richtig positiv)  → Modell sagt 'Krebs' richtig voraus. &amp;lt;br&amp;gt;&lt;br /&gt;
*&amp;lt;span style=&amp;quot;background:#B9FFC5&amp;quot;&amp;gt; TN&amp;lt;/span&amp;gt;: True Negative (richtig negativ) → Modell sagt 'gesund' richtig voraus. &amp;lt;br&amp;gt;&lt;br /&gt;
*&amp;lt;span style=&amp;quot;background:#FFCBCB&amp;quot;&amp;gt; FP&amp;lt;/span&amp;gt;: False Positive (falsch positiv) → Modell sagt der Patient hat Krebs, obwohl er gesund ist. &amp;lt;br&amp;gt;&lt;br /&gt;
*&amp;lt;span style=&amp;quot;background:#FFCBCB&amp;quot;&amp;gt; FN&amp;lt;/span&amp;gt;: False Negative (falsch negativ) → Modell sagt 'gesund', obwohl der Patient Krebs hat. &amp;lt;br&amp;gt;&lt;br /&gt;
==Testen auf Sensitivität==&lt;br /&gt;
Möglichst viele 'Kranke' sollen richtig bestimmt werden. &amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;math&amp;gt; \text{Sensitivität} = \frac{\text{TP}}{\text{TP + FN}} &amp;lt;/math&amp;gt;&lt;br /&gt;
* Bei einem perfekten Modell gibt dieses keine falsch negativen Ergebnisse aus. &amp;lt;br&amp;gt;&lt;br /&gt;
* Ausgabe 1 = Perfektes Modell, erkennt alle mit Krebs. &amp;lt;br&amp;gt;&lt;br /&gt;
* Ausgabe 0 = Schlechtes Modell, erkennt keine mit Krebs. &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
==Testen auf Spezifität==&lt;br /&gt;
Möglichst viele 'Gesunde' sollen richtig bestimmt werden. &amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;math&amp;gt; \text{Spezifität} = \frac{\text{TN}}{\text{ FP + TN}} &amp;lt;/math&amp;gt;&lt;br /&gt;
*Entweder hohe Sensitivität oder hohe Spezifität. &amp;lt;br&amp;gt;&lt;br /&gt;
* Was besser ist kommt auf die Fragestellung an. &amp;lt;br&amp;gt;&lt;br /&gt;
'''Treshold''': &amp;lt;br&amp;gt;&lt;br /&gt;
Cutoff-Wert der als Grenzwert festgelegt wird nach dem beurteilt wird, ob der zu bewertende Wert 'krank', oder 'gesund' zugeordnet wird. &amp;lt;br&amp;gt;&lt;br /&gt;
'''Beispiel zur Bestimmung des optimalen Treshold''' &amp;lt;br&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
| || || || colspan=&amp;quot;5&amp;quot; style=&amp;quot;text-align:center&amp;quot;| Treshold&lt;br /&gt;
|-&lt;br /&gt;
!  Zustand !!  Ausgabe Modell !! 0 !! 0,25 !! 0,45 !! 0,55 !! 0,75&lt;br /&gt;
|-&lt;br /&gt;
| krank || 0,5 || style=&amp;quot;background:#B9FFC5 &amp;quot; |TP || style=&amp;quot;background:#B9FFC5 &amp;quot; |TP || style=&amp;quot;background:#B9FFC5 &amp;quot; |TP|| style=&amp;quot;background:#FFCBCB| FN || style=&amp;quot;background:#FFCBCB| FN &lt;br /&gt;
|- &lt;br /&gt;
| krank || 0,6 || style=&amp;quot;background:#B9FFC5 &amp;quot; | TP || style=&amp;quot;background:#B9FFC5 &amp;quot; | TP || style=&amp;quot;background:#B9FFC5 &amp;quot; | TP || style=&amp;quot;background:#B9FFC5 &amp;quot; | TP|| style=&amp;quot;background:#FFCBCB| FN&lt;br /&gt;
|-&lt;br /&gt;
| krank || 0,2 || style=&amp;quot;background:#B9FFC5 &amp;quot; | TP || style=&amp;quot;background:#FFCBCB| FN || style=&amp;quot;background:#FFCBCB| FN || style=&amp;quot;background:#FFCBCB| FN || style=&amp;quot;background:#FFCBCB| FN&lt;br /&gt;
|-&lt;br /&gt;
| krank || 0,56 || style=&amp;quot;background:#B9FFC5 &amp;quot; | TP || style=&amp;quot;background:#B9FFC5 &amp;quot; | TP|| style=&amp;quot;background:#B9FFC5 &amp;quot; | TP || style=&amp;quot;background:#B9FFC5 &amp;quot; | TP || style=&amp;quot;background:#FFCBCB|  FN&lt;br /&gt;
|- &lt;br /&gt;
| gesund || 0,5 || style=&amp;quot;background:#FFCBCB|  FP || style=&amp;quot;background:#FFCBCB| FP || style=&amp;quot;background:#FFCBCB|  FP || style=&amp;quot;background:#FFCBCB|  FP || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN &lt;br /&gt;
|-&lt;br /&gt;
| gesund || 0,1 || style=&amp;quot;background:#FFCBCB| FP || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN &lt;br /&gt;
|- &lt;br /&gt;
| gesund || 0,2 || style=&amp;quot;background:#FFCBCB| FP || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN &lt;br /&gt;
|- &lt;br /&gt;
| gesund || 0,4 || style=&amp;quot;background:#FFCBCB| FP || style=&amp;quot;background:#FFCBCB|  FP || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN  || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN &lt;br /&gt;
|}&lt;br /&gt;
*Treshold 0 = hohe Sensitivität &amp;lt;br&amp;gt;&lt;br /&gt;
*Treshold 0,75 = hohe Spezifität &amp;lt;br&amp;gt;&lt;br /&gt;
==Area Under the Curve==&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
| ||  || colspan=&amp;quot;5&amp;quot; style=&amp;quot;text-align:center&amp;quot;| Treshold&lt;br /&gt;
|-&lt;br /&gt;
! !!  !! 0 !! 0,25 !! 0,45 !! 0,55 !! 0,75&lt;br /&gt;
|-&lt;br /&gt;
| Sensitivitätt || &amp;lt;math&amp;gt;\frac{\text{TP}}{\text{TP + FN}} &amp;lt;/math&amp;gt; || style=&amp;quot;background:#FFAA00 | 1 || style=&amp;quot;background:#FFFF40 | 0,75 || style=&amp;quot;background:#B3B7FF | 0,75 || style=&amp;quot;background:#FFCBCB| 0,5 || style=&amp;quot;background:#B9FFC5 &amp;quot;| 0&lt;br /&gt;
|-&lt;br /&gt;
| Spezifität || &amp;lt;math&amp;gt;\frac{\text{TN}}{\text{ FP + TN}} &amp;lt;/math&amp;gt; || style=&amp;quot;background:#FFAA00 | 0 || style=&amp;quot;background:#FFFF40 |0,5 || style=&amp;quot;background:#B3B7FF | 0,75 || style=&amp;quot;background:#FFCBCB| 1 || style=&amp;quot;background:#B9FFC5 &amp;quot;| 1&lt;br /&gt;
|}&lt;br /&gt;
[[File:VL8 AUC.png|mini|500px]]&lt;br /&gt;
&lt;br /&gt;
*1 = optimal &amp;lt;br&amp;gt;&lt;br /&gt;
*0 = auch gut, positiv und negativ müssen nur umgedreht werden &amp;lt;br&amp;gt;&lt;br /&gt;
*0,5 = schlecht, da die Bestimmung des Systems durch Zufall erfolgt&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=9_Biomarker&amp;diff=183</id>
		<title>9 Biomarker</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=9_Biomarker&amp;diff=183"/>
		<updated>2019-07-02T00:29:47Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Biomarker =&lt;br /&gt;
'''Medizinische Biomarker'''&amp;lt;br&amp;gt;&lt;br /&gt;
* Ein Biomarker ist ein messbarer Parameter biologischer Prozesse, der prognostische, oder diagnostische Aussagekraft hat und somit ein Indikator für Krankheiten, oder Umwelteinflüsse ist. &lt;br /&gt;
* Charakteristische biologische Merkmale, die objektiv gemessen werden können und auf einen normalen biologischen, oder krankhaften Prozess im Körper hinweisen können. &lt;br /&gt;
*  Es können Zellen, Gene, Genprodukte, Enzyme, oder Hormone sein.&lt;br /&gt;
[[File:VL8 1.png|mini|850px]]&lt;br /&gt;
Wie in der Abbildung oben dargestellt, kann über Einzelwerte keine Aussage getroffen werden, ob der Patient krank oder gesund ist. &amp;lt;br&amp;gt;&lt;br /&gt;
→ deswegen bedarf es mehrerer Biomarker &amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''Frage:''' &amp;lt;br&amp;gt;&lt;br /&gt;
Wie kann für einen TPM-Wert vorhergesagt werden, ob es sich um 'Krebs' oder 'gesund' handelt?&amp;lt;br&amp;gt;&lt;br /&gt;
==Logistische Funktion==&lt;br /&gt;
&amp;lt;math&amp;gt; y = \beta_1 \cdot TPM_{HIF1\alpha} + \beta_0 &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt; logit_{(P)} = log \frac{P}{1-P} &amp;lt;/math&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
* Damit wird die Wahrscheinlichkeit, dass jemand z.B. Krebs bekommt durch Gegenwahrscheinlichkeit bestimmt. &amp;lt;br&amp;gt;&lt;br /&gt;
==Biomarkersignatur==&lt;br /&gt;
Erweiterung für mehrere Gene: &lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt; P(x) = \frac{1}{e^{-((\beta)_1 \cdot x_1) + ((\beta)_2 \cdot x_1) + .... + (\beta)_n \cdot x_n) + \beta_0)}}&amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
'''Mashine learning''' &amp;lt;br&amp;gt;&lt;br /&gt;
* Ein Modell muss zunächst von einem System erlent werden, dann kann das System eine Aussage treffen, ob z.B. 'krank' oder 'gesund'. &amp;lt;br&amp;gt;&lt;br /&gt;
* Parameter &amp;lt;math&amp;gt; \beta_1 &amp;lt;/math&amp;gt; und &amp;lt;math&amp;gt; \beta_0 &amp;lt;/math&amp;gt; können nicht berechnet werden. →  Müssen mit Hilfe eines Algorithmus geschätzt werden. &amp;lt;br&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''Maximum-Likelihood:''' &amp;lt;br&amp;gt;&lt;br /&gt;
* Schätzung zur Parameterbestimmung. &amp;lt;br&amp;gt;&lt;br /&gt;
* ''Training'': Lerndaten sind bekannte Werte zur Aussage 'krank' oder 'gesund' &amp;lt;br&amp;gt;&lt;br /&gt;
→  Algorithmus bestimmt einen genauen Wert für &amp;lt;math&amp;gt; \beta_1&amp;lt;/math&amp;gt;, um krank (1) und gesund (0) zu bestimmen. &amp;lt;br&amp;gt;&lt;br /&gt;
→  Danach kann mit dem Modell bestimmt werden, ob es gut oder schlecht ist. &amp;lt;br&amp;gt;&lt;br /&gt;
*'''Problem''': System versucht einen optimalen Wert zu finden &amp;lt;br&amp;gt;&lt;br /&gt;
→  ''Overfitting'': Zu genaue Beschreibung des Modells.&amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
'''Frage:''' Wie gut ist die Qualität des Modells? &amp;lt;br&amp;gt;&lt;br /&gt;
==Receiver Operation Characteristic (ROC)== &lt;br /&gt;
Wird genutzt um zu prüfen, ob das Modell gut ist. &amp;lt;br&amp;gt;&lt;br /&gt;
→ Wie viele falsch positive, falsch negative, aber auch richtig positive und richtig negative Aussagen trifft das Modell? &amp;lt;br&amp;gt;&lt;br /&gt;
{| class=&amp;quot;wikitable float-left&amp;quot; style=&amp;quot;text-align:center&amp;quot;&lt;br /&gt;
| || ||colspan=&amp;quot;3&amp;quot; style=&amp;quot;text-align:center&amp;quot;| Mensch&lt;br /&gt;
|-&lt;br /&gt;
| || ||  '''Krebs''' || '''Gesund''' &lt;br /&gt;
|-&lt;br /&gt;
|rowspan=&amp;quot;2&amp;quot;| Modellvorhersage&lt;br /&gt;
| '''Krebs''' ||style=&amp;quot;background:#B9FFC5 &amp;quot; | TP ||  	style=&amp;quot;background:#FFCBCB| FP&lt;br /&gt;
|-&lt;br /&gt;
| '''Gesund''' ||style=&amp;quot;background:#FFCBCB| FN || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN&lt;br /&gt;
|-&lt;br /&gt;
|}&lt;br /&gt;
Beispiel 'Krebs' = positiv, 'geund' = negativ&lt;br /&gt;
* &amp;lt;span style=&amp;quot;background:#B9FFC5&amp;quot;&amp;gt; TP&amp;lt;/span&amp;gt;: True Positive (richtig positiv)  → Modell sagt 'Krebs' richtig voraus. &amp;lt;br&amp;gt;&lt;br /&gt;
*&amp;lt;span style=&amp;quot;background:#B9FFC5&amp;quot;&amp;gt; TN&amp;lt;/span&amp;gt;: True Negative (richtig negativ) → Modell sagt 'gesund' richtig voraus. &amp;lt;br&amp;gt;&lt;br /&gt;
*&amp;lt;span style=&amp;quot;background:#FFCBCB&amp;quot;&amp;gt; FP&amp;lt;/span&amp;gt;: False Positive (falsch positiv) → Modell sagt der Patient hat Krebs, obwohl er gesund ist. &amp;lt;br&amp;gt;&lt;br /&gt;
*&amp;lt;span style=&amp;quot;background:#FFCBCB&amp;quot;&amp;gt; FN&amp;lt;/span&amp;gt;: False Negative (falsch negativ) → Modell sagt 'gesund', obwohl der Patient Krebs hat. &amp;lt;br&amp;gt;&lt;br /&gt;
==Testen auf Sensitivität==&lt;br /&gt;
Möglichst viele 'Kranke' sollen richtig bestimmt werden. &amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;math&amp;gt; \text{Sensitivität} = \frac{\text{TP}}{\text{TP + FN}} &amp;lt;/math&amp;gt;&lt;br /&gt;
* Bei einem perfekten Modell gibt dieses keine falsch negativen Ergebnisse aus. &amp;lt;br&amp;gt;&lt;br /&gt;
* Ausgabe 1 = Perfektes Modell, erkennt alle mit Krebs. &amp;lt;br&amp;gt;&lt;br /&gt;
* Ausgabe 0 = Schlechtes Modell, erkennt keine mit Krebs. &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
==Testen auf Spezifität==&lt;br /&gt;
Möglichst viele 'Gesunde' sollen richtig bestimmt werden. &amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;math&amp;gt; \text{Spezifität} = \frac{\text{TN}}{\text{ FP + TN}} &amp;lt;/math&amp;gt;&lt;br /&gt;
*Entweder hohe Sensitivität oder hohe Spezifität. &amp;lt;br&amp;gt;&lt;br /&gt;
* Was besser ist kommt auf die Fragestellung an. &amp;lt;br&amp;gt;&lt;br /&gt;
'''Treshold''': &amp;lt;br&amp;gt;&lt;br /&gt;
Cutoff-Wert der als Grenzwert festgelegt wird nach dem beurteilt wird, ob der zu bewertende Wert 'krank', oder 'gesund' zugeordnet wird. &amp;lt;br&amp;gt;&lt;br /&gt;
'''Beispiel zur Bestimmung des optimalen Treshold''' &amp;lt;br&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
| || || || colspan=&amp;quot;5&amp;quot; style=&amp;quot;text-align:center&amp;quot;| Treshold&lt;br /&gt;
|-&lt;br /&gt;
!  Zustand !!  Ausgabe Modell !! 0 !! 0,25 !! 0,45 !! 0,55 !! 0,75&lt;br /&gt;
|-&lt;br /&gt;
| krank || 0,5 || style=&amp;quot;background:#B9FFC5 &amp;quot; |TP || style=&amp;quot;background:#B9FFC5 &amp;quot; |TP || style=&amp;quot;background:#B9FFC5 &amp;quot; |TP|| style=&amp;quot;background:#FFCBCB| FN || style=&amp;quot;background:#FFCBCB| FN &lt;br /&gt;
|- &lt;br /&gt;
| krank || 0,6 || style=&amp;quot;background:#B9FFC5 &amp;quot; | TP || style=&amp;quot;background:#B9FFC5 &amp;quot; | TP || style=&amp;quot;background:#B9FFC5 &amp;quot; | TP || style=&amp;quot;background:#B9FFC5 &amp;quot; | TP|| style=&amp;quot;background:#FFCBCB| FN&lt;br /&gt;
|-&lt;br /&gt;
| krank || 0,2 || style=&amp;quot;background:#B9FFC5 &amp;quot; | TP || style=&amp;quot;background:#FFCBCB| FN || style=&amp;quot;background:#FFCBCB| FN || style=&amp;quot;background:#FFCBCB| FN || style=&amp;quot;background:#FFCBCB| FN&lt;br /&gt;
|-&lt;br /&gt;
| krank || 0,56 || style=&amp;quot;background:#B9FFC5 &amp;quot; | TP || style=&amp;quot;background:#B9FFC5 &amp;quot; | TP|| style=&amp;quot;background:#B9FFC5 &amp;quot; | TP || style=&amp;quot;background:#B9FFC5 &amp;quot; | TP || style=&amp;quot;background:#FFCBCB|  FN&lt;br /&gt;
|- &lt;br /&gt;
| gesund || 0,5 || style=&amp;quot;background:#FFCBCB|  FP || style=&amp;quot;background:#FFCBCB| FP || style=&amp;quot;background:#FFCBCB|  FP || style=&amp;quot;background:#FFCBCB|  FP || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN &lt;br /&gt;
|-&lt;br /&gt;
| gesund || 0,1 || style=&amp;quot;background:#FFCBCB| FP || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN &lt;br /&gt;
|- &lt;br /&gt;
| gesund || 0,2 || style=&amp;quot;background:#FFCBCB| FP || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN &lt;br /&gt;
|- &lt;br /&gt;
| gesund || 0,4 || style=&amp;quot;background:#FFCBCB| FP || style=&amp;quot;background:#FFCBCB|  FP || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN  || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN &lt;br /&gt;
|}&lt;br /&gt;
*Treshold 0 = hohe Sensitivität &amp;lt;br&amp;gt;&lt;br /&gt;
*Treshold 0,75 = hohe Spezifität &amp;lt;br&amp;gt;&lt;br /&gt;
==Area Under the Curve==&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
| ||  || colspan=&amp;quot;5&amp;quot; style=&amp;quot;text-align:center&amp;quot;| Treshold&lt;br /&gt;
|-&lt;br /&gt;
! !!  !! 0 !! 0,25 !! 0,45 !! 0,55 !! 0,75&lt;br /&gt;
|-&lt;br /&gt;
| Sensitivitätt || &amp;lt;math&amp;gt;\frac{\text{TP}}{\text{TP + FN}} &amp;lt;/math&amp;gt; || style=&amp;quot;background:#FFAA00 | 1 || style=&amp;quot;background:#FFFF40 | 0,75 || style=&amp;quot;background:#B3B7FF | 0,75 || style=&amp;quot;background:#FFCBCB| 0,5 || style=&amp;quot;background:#B9FFC5 &amp;quot;| 0&lt;br /&gt;
|-&lt;br /&gt;
| Spezifität || &amp;lt;math&amp;gt;\frac{\text{TN}}{\text{ FP + TN}} &amp;lt;/math&amp;gt; || style=&amp;quot;background:#FFAA00 | 0 || style=&amp;quot;background:#FFFF40 |0,5 || style=&amp;quot;background:#B3B7FF | 0,75 || style=&amp;quot;background:#FFCBCB| 1 || style=&amp;quot;background:#B9FFC5 &amp;quot;| 1&lt;br /&gt;
|}&lt;br /&gt;
[[File:VL8 AUC.png|mini|500px]]&lt;br /&gt;
&lt;br /&gt;
*1 = optimal &amp;lt;br&amp;gt;&lt;br /&gt;
*0 = auch gut, positiv und negativ müssen nur umgedreht werden &amp;lt;br&amp;gt;&lt;br /&gt;
*0,5 = schlecht, da die Bestimmung des Systems durch Zufall erfolgt&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=File:VL8_AUC.png&amp;diff=182</id>
		<title>File:VL8 AUC.png</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=File:VL8_AUC.png&amp;diff=182"/>
		<updated>2019-07-02T00:21:13Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Area Under the Curve&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=9_Biomarker&amp;diff=181</id>
		<title>9 Biomarker</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=9_Biomarker&amp;diff=181"/>
		<updated>2019-07-01T23:42:00Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Biomarker =&lt;br /&gt;
'''Medizinische Biomarker'''&amp;lt;br&amp;gt;&lt;br /&gt;
* Ein Biomarker ist ein messbarer Parameter biologischer Prozesse, der prognostische, oder diagnostische Aussagekraft hat und somit ein Indikator für Krankheiten, oder Umwelteinflüsse ist. &lt;br /&gt;
* Charakteristische biologische Merkmale, die objektiv gemessen werden können und auf einen normalen biologischen, oder krankhaften Prozess im Körper hinweisen können. &lt;br /&gt;
*  Es können Zellen, Gene, Genprodukte, Enzyme, oder Hormone sein.&lt;br /&gt;
[[File:VL8 1.png|mini|850px]]&lt;br /&gt;
Wie in der Abbildung oben dargestellt, kann über Einzelwerte keine Aussage getroffen werden, ob der Patient krank oder gesund ist. &amp;lt;br&amp;gt;&lt;br /&gt;
→ deswegen bedarf es mehrerer Biomarker &amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''Frage:''' &amp;lt;br&amp;gt;&lt;br /&gt;
Wie kann für einen TPM-Wert vorhergesagt werden, ob es sich um 'Krebs' oder 'gesund' handelt?&amp;lt;br&amp;gt;&lt;br /&gt;
==Logistische Funktion==&lt;br /&gt;
&amp;lt;math&amp;gt; y = \beta_1 \cdot TPM_{HIF1\alpha} + \beta_0 &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt; logit_{(P)} = log \frac{P}{1-P} &amp;lt;/math&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
* Damit wird die Wahrscheinlichkeit, dass jemand z.B. Krebs bekommt durch Gegenwahrscheinlichkeit bestimmt. &amp;lt;br&amp;gt;&lt;br /&gt;
==Biomarkersignatur==&lt;br /&gt;
Erweiterung für mehrere Gene: &lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt; P(x) = \frac{1}{e^{-((\beta)_1 \cdot x_1) + ((\beta)_2 \cdot x_1) + .... + (\beta)_n \cdot x_n) + \beta_0)}}&amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
'''Mashine learning''' &amp;lt;br&amp;gt;&lt;br /&gt;
* Ein Modell muss zunächst von einem System erlent werden, dann kann das System eine Aussage treffen, ob z.B. 'krank' oder 'gesund'. &amp;lt;br&amp;gt;&lt;br /&gt;
* Parameter &amp;lt;math&amp;gt; \beta_1 &amp;lt;/math&amp;gt; und &amp;lt;math&amp;gt; \beta_0 &amp;lt;/math&amp;gt; können nicht berechnet werden. →  Müssen mit Hilfe eines Algorithmus geschätzt werden. &amp;lt;br&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''Maximum-Likelihood:''' &amp;lt;br&amp;gt;&lt;br /&gt;
* Schätzung zur Parameterbestimmung. &amp;lt;br&amp;gt;&lt;br /&gt;
* ''Training'': Lerndaten sind bekannte Werte zur Aussage 'krank' oder 'gesund' &amp;lt;br&amp;gt;&lt;br /&gt;
→  Algorithmus bestimmt einen genauen Wert für &amp;lt;math&amp;gt; \beta_1&amp;lt;/math&amp;gt;, um krank (1) und gesund (0) zu bestimmen. &amp;lt;br&amp;gt;&lt;br /&gt;
→  Danach kann mit dem Modell bestimmt werden, ob es gut oder schlecht ist. &amp;lt;br&amp;gt;&lt;br /&gt;
*'''Problem''': System versucht einen optimalen Wert zu finden &amp;lt;br&amp;gt;&lt;br /&gt;
→  ''Overfitting'': Zu genaue Beschreibung des Modells.&amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
'''Frage:''' Wie gut ist die Qualität des Modells? &amp;lt;br&amp;gt;&lt;br /&gt;
==Receiver Operation Characteristic (ROC)== &lt;br /&gt;
Wird genutzt um zu prüfen, ob das Modell gut ist. &amp;lt;br&amp;gt;&lt;br /&gt;
→ Wie viele falsch positive, falsch negative, aber auch richtig positive und richtig negative Aussagen trifft das Modell? &amp;lt;br&amp;gt;&lt;br /&gt;
{| class=&amp;quot;wikitable float-left&amp;quot; style=&amp;quot;text-align:center&amp;quot;&lt;br /&gt;
| || ||colspan=&amp;quot;3&amp;quot; style=&amp;quot;text-align:center&amp;quot;| Mensch&lt;br /&gt;
|-&lt;br /&gt;
| || ||  '''Krebs''' || '''Gesund''' &lt;br /&gt;
|-&lt;br /&gt;
|rowspan=&amp;quot;2&amp;quot;| Modellvorhersage&lt;br /&gt;
| '''Krebs''' ||style=&amp;quot;background:#B9FFC5 &amp;quot; | TP ||  	style=&amp;quot;background:#FFCBCB| FP&lt;br /&gt;
|-&lt;br /&gt;
| '''Gesund''' ||style=&amp;quot;background:#FFCBCB| FN || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN&lt;br /&gt;
|-&lt;br /&gt;
|}&lt;br /&gt;
Beispiel 'Krebs' = positiv, 'geund' = negativ&lt;br /&gt;
* &amp;lt;span style=&amp;quot;background:#B9FFC5&amp;quot;&amp;gt; TP&amp;lt;/span&amp;gt;: True Positive (richtig positiv)  → Modell sagt 'Krebs' richtig voraus. &amp;lt;br&amp;gt;&lt;br /&gt;
*&amp;lt;span style=&amp;quot;background:#B9FFC5&amp;quot;&amp;gt; TN&amp;lt;/span&amp;gt;: True Negative (richtig negativ) → Modell sagt 'gesund' richtig voraus. &amp;lt;br&amp;gt;&lt;br /&gt;
*&amp;lt;span style=&amp;quot;background:#FFCBCB&amp;quot;&amp;gt; FP&amp;lt;/span&amp;gt;: False Positive (falsch positiv) → Modell sagt der Patient hat Krebs, obwohl er gesund ist. &amp;lt;br&amp;gt;&lt;br /&gt;
*&amp;lt;span style=&amp;quot;background:#FFCBCB&amp;quot;&amp;gt; FN&amp;lt;/span&amp;gt;: False Negative (falsch negativ) → Modell sagt 'gesund', obwohl der Patient Krebs hat. &amp;lt;br&amp;gt;&lt;br /&gt;
==Testen auf Sensitivität==&lt;br /&gt;
Möglichst viele 'Kranke' sollen richtig bestimmt werden. &amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;math&amp;gt; \text{Sensitivität} = \frac{\text{TP}}{\text{TP + FN}} &amp;lt;/math&amp;gt;&lt;br /&gt;
* Bei einem perfekten Modell gibt dieses keine falsch negativen Ergebnisse aus. &amp;lt;br&amp;gt;&lt;br /&gt;
* Ausgabe 1 = Perfektes Modell, erkennt alle mit Krebs. &amp;lt;br&amp;gt;&lt;br /&gt;
* Ausgabe 0 = Schlechtes Modell, erkennt keine mit Krebs. &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
==Testen auf Spezifität==&lt;br /&gt;
Möglichst viele 'Gesunde' sollen richtig bestimmt werden. &amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;math&amp;gt; \text{Spezifität} = \frac{\text{TN}}{\text{ FP + TN}} &amp;lt;/math&amp;gt;&lt;br /&gt;
*Entweder hohe Sensitivität oder hohe Spezifität. &amp;lt;br&amp;gt;&lt;br /&gt;
* Was besser ist kommt auf die Fragestellung an. &amp;lt;br&amp;gt;&lt;br /&gt;
'''Treshold''': &amp;lt;br&amp;gt;&lt;br /&gt;
Cutoff-Wert der als Grenzwert festgelegt wird nach dem beurteilt wird, ob der zu bewertende Wert 'krank', oder 'gesund' zugeordnet wird. &amp;lt;br&amp;gt;&lt;br /&gt;
'''Beispiel zur Bestimmung des optimalen Treshold''' &amp;lt;br&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
| || || colspan=&amp;quot;5&amp;quot; style=&amp;quot;text-align:center&amp;quot;| Treshold&lt;br /&gt;
|-&lt;br /&gt;
!  Zustand !!  Ausgabe Modell !! 0 !! 0,25 !! 0,45 !! 0,55 !! 0,75&lt;br /&gt;
|-&lt;br /&gt;
| krank || 0,5 || style=&amp;quot;background:#B9FFC5 &amp;quot; |TP || style=&amp;quot;background:#B9FFC5 &amp;quot; |TP || style=&amp;quot;background:#B9FFC5 &amp;quot; |TP|| style=&amp;quot;background:#FFCBCB| FN || style=&amp;quot;background:#FFCBCB| FN &lt;br /&gt;
|- &lt;br /&gt;
| krank || 0,6 || style=&amp;quot;background:#B9FFC5 &amp;quot; | TP || style=&amp;quot;background:#B9FFC5 &amp;quot; | TP || style=&amp;quot;background:#B9FFC5 &amp;quot; | TP || style=&amp;quot;background:#B9FFC5 &amp;quot; | TP|| style=&amp;quot;background:#FFCBCB| FN&lt;br /&gt;
|-&lt;br /&gt;
| krank || 0,2 || style=&amp;quot;background:#B9FFC5 &amp;quot; | TP || style=&amp;quot;background:#FFCBCB| FN || style=&amp;quot;background:#FFCBCB| FN || style=&amp;quot;background:#FFCBCB| FN || style=&amp;quot;background:#FFCBCB| FN&lt;br /&gt;
|-&lt;br /&gt;
| krank || 0,56 || style=&amp;quot;background:#B9FFC5 &amp;quot; | TP || style=&amp;quot;background:#B9FFC5 &amp;quot; | TP|| style=&amp;quot;background:#B9FFC5 &amp;quot; | TP || style=&amp;quot;background:#B9FFC5 &amp;quot; | TP || style=&amp;quot;background:#FFCBCB|  FN&lt;br /&gt;
|- &lt;br /&gt;
| gesund || 0,5 || style=&amp;quot;background:#FFCBCB|  FP || style=&amp;quot;background:#FFCBCB| FP || style=&amp;quot;background:#FFCBCB|  FP || style=&amp;quot;background:#FFCBCB|  FP || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN &lt;br /&gt;
|-&lt;br /&gt;
| gesund || 0,1 || style=&amp;quot;background:#FFCBCB| FP || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN &lt;br /&gt;
|- &lt;br /&gt;
| gesund || 0,2 || style=&amp;quot;background:#FFCBCB| FP || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN &lt;br /&gt;
|- &lt;br /&gt;
| gesund || 0,4 || style=&amp;quot;background:#FFCBCB| FP || style=&amp;quot;background:#FFCBCB|  FP || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN  || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN &lt;br /&gt;
|}&lt;br /&gt;
*Treshold 0 = hohe Sensitivität &amp;lt;br&amp;gt;&lt;br /&gt;
*Treshold 0,75 = hohe Spezifität&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=9_Biomarker&amp;diff=180</id>
		<title>9 Biomarker</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=9_Biomarker&amp;diff=180"/>
		<updated>2019-07-01T22:48:43Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Biomarker =&lt;br /&gt;
'''Medizinische Biomarker'''&amp;lt;br&amp;gt;&lt;br /&gt;
* Ein Biomarker ist ein messbarer Parameter biologischer Prozesse, der prognostische, oder diagnostische Aussagekraft hat und somit ein Indikator für Krankheiten, oder Umwelteinflüsse ist. &lt;br /&gt;
* Charakteristische biologische Merkmale, die objektiv gemessen werden können und auf einen normalen biologischen, oder krankhaften Prozess im Körper hinweisen können. &lt;br /&gt;
*  Es können Zellen, Gene, Genprodukte, Enzyme, oder Hormone sein.&lt;br /&gt;
[[File:VL8 1.png|mini|850px]]&lt;br /&gt;
Wie in der Abbildung oben dargestellt, kann über Einzelwerte keine Aussage getroffen werden, ob der Patient krank oder gesund ist. &amp;lt;br&amp;gt;&lt;br /&gt;
→ deswegen bedarf es mehrerer Biomarker &amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''Frage:''' &amp;lt;br&amp;gt;&lt;br /&gt;
Wie kann für einen TPM-Wert vorhergesagt werden, ob es sich um 'Krebs' oder 'gesund' handelt?&amp;lt;br&amp;gt;&lt;br /&gt;
==Logistische Funktion==&lt;br /&gt;
&amp;lt;math&amp;gt; y = \beta_1 \cdot TPM_{HIF1\alpha} + \beta_0 &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt; logit_{(P)} = log \frac{P}{1-P} &amp;lt;/math&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
* Damit wird die Wahrscheinlichkeit, dass jemand z.B. Krebs bekommt durch Gegenwahrscheinlichkeit bestimmt. &amp;lt;br&amp;gt;&lt;br /&gt;
==Biomarkersignatur==&lt;br /&gt;
Erweiterung für mehrere Gene: &lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt; P(x) = \frac{1}{e^{-((\beta)_1 \cdot x_1) + ((\beta)_2 \cdot x_1) + .... + (\beta)_n \cdot x_n) + \beta_0)}}&amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
'''Mashine learning''' &amp;lt;br&amp;gt;&lt;br /&gt;
* Ein Modell muss zunächst von einem System erlent werden, dann kann das System eine Aussage treffen, ob z.B. 'krank' oder 'gesund'. &amp;lt;br&amp;gt;&lt;br /&gt;
* Parameter &amp;lt;math&amp;gt; \beta_1 &amp;lt;/math&amp;gt; und &amp;lt;math&amp;gt; \beta_0 &amp;lt;/math&amp;gt; können nicht berechnet werden. →  Müssen mit Hilfe eines Algorithmus geschätzt werden. &amp;lt;br&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''Maximum-Likelihood:''' &amp;lt;br&amp;gt;&lt;br /&gt;
* Schätzung zur Parameterbestimmung. &amp;lt;br&amp;gt;&lt;br /&gt;
* ''Training'': Lerndaten sind bekannte Werte zur Aussage 'krank' oder 'gesund' &amp;lt;br&amp;gt;&lt;br /&gt;
→  Algorithmus bestimmt einen genauen Wert für &amp;lt;math&amp;gt; \beta_1&amp;lt;/math&amp;gt;, um krank (1) und gesund (0) zu bestimmen. &amp;lt;br&amp;gt;&lt;br /&gt;
→  Danach kann mit dem Modell bestimmt werden, ob es gut oder schlecht ist. &amp;lt;br&amp;gt;&lt;br /&gt;
*'''Problem''': System versucht einen optimalen Wert zu finden &amp;lt;br&amp;gt;&lt;br /&gt;
→  ''Overfitting'': Zu genaue Beschreibung des Modells.&amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
'''Frage:''' Wie gut ist die Qualität des Modells? &amp;lt;br&amp;gt;&lt;br /&gt;
==Receiver Operation Characteristic (ROC)== &lt;br /&gt;
Wird genutzt um zu prüfen, ob das Modell gut ist. &amp;lt;br&amp;gt;&lt;br /&gt;
→ Wie viele falsch positive, falsch negative, aber auch richtig positive und richtig negative Aussagen trifft das Modell? &amp;lt;br&amp;gt;&lt;br /&gt;
{| class=&amp;quot;wikitable float-left&amp;quot; style=&amp;quot;text-align:center&amp;quot;&lt;br /&gt;
| || ||colspan=&amp;quot;3&amp;quot; style=&amp;quot;text-align:center&amp;quot;| Mensch&lt;br /&gt;
|-&lt;br /&gt;
| || ||  '''Krebs''' || '''Gesund''' &lt;br /&gt;
|-&lt;br /&gt;
|rowspan=&amp;quot;2&amp;quot;| Modellvorhersage&lt;br /&gt;
| '''Krebs''' ||style=&amp;quot;background:#B9FFC5 &amp;quot; | TP ||  	style=&amp;quot;background:#FFCBCB| FP&lt;br /&gt;
|-&lt;br /&gt;
| '''Gesund''' ||style=&amp;quot;background:#FFCBCB| FN || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN&lt;br /&gt;
|-&lt;br /&gt;
|}&lt;br /&gt;
Beispiel 'Krebs' = positiv, 'geund' = negativ&lt;br /&gt;
* &amp;lt;span style=&amp;quot;background:#B9FFC5&amp;quot;&amp;gt; TP&amp;lt;/span&amp;gt;: True Positive (richtig positiv)  → Modell sagt 'Krebs' richtig voraus. &amp;lt;br&amp;gt;&lt;br /&gt;
*&amp;lt;span style=&amp;quot;background:#B9FFC5&amp;quot;&amp;gt; TN&amp;lt;/span&amp;gt;: True Negative (richtig negativ) → Modell sagt 'gesund' richtig voraus. &amp;lt;br&amp;gt;&lt;br /&gt;
*&amp;lt;span style=&amp;quot;background:#FFCBCB&amp;quot;&amp;gt; FP&amp;lt;/span&amp;gt;: False Positive (falsch positiv) → Modell sagt der Patient hat Krebs, obwohl er gesund ist. &amp;lt;br&amp;gt;&lt;br /&gt;
*&amp;lt;span style=&amp;quot;background:#FFCBCB&amp;quot;&amp;gt; FN&amp;lt;/span&amp;gt;: False Negative (falsch negativ) → Modell sagt 'gesund', obwohl der Patient Krebs hat. &amp;lt;br&amp;gt;&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=9_Biomarker&amp;diff=179</id>
		<title>9 Biomarker</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=9_Biomarker&amp;diff=179"/>
		<updated>2019-07-01T22:46:38Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Biomarker =&lt;br /&gt;
'''Medizinische Biomarker'''&amp;lt;br&amp;gt;&lt;br /&gt;
* Ein Biomarker ist ein messbarer Parameter biologischer Prozesse, der prognostische, oder diagnostische Aussagekraft hat und somit ein Indikator für Krankheiten, oder Umwelteinflüsse ist. &lt;br /&gt;
* Charakteristische biologische Merkmale, die objektiv gemessen werden können und auf einen normalen biologischen, oder krankhaften Prozess im Körper hinweisen können. &lt;br /&gt;
*  Es können Zellen, Gene, Genprodukte, Enzyme, oder Hormone sein.&lt;br /&gt;
[[File:VL8 1.png|mini|850px]]&lt;br /&gt;
Wie in der Abbildung oben dargestellt, kann über Einzelwerte keine Aussage getroffen werden, ob der Patient krank oder gesund ist. &amp;lt;br&amp;gt;&lt;br /&gt;
→ deswegen bedarf es mehrerer Biomarker &amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''Frage:''' &amp;lt;br&amp;gt;&lt;br /&gt;
Wie kann für einen TPM-Wert vorhergesagt werden, ob es sich um 'Krebs' oder 'gesund' handelt?&amp;lt;br&amp;gt;&lt;br /&gt;
==Logistische Funktion==&lt;br /&gt;
&amp;lt;math&amp;gt; y = \beta_1 \cdot TPM_{HIF1\alpha} + \beta_0 &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt; logit_{(P)} = log \frac{P}{1-P} &amp;lt;/math&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
* Damit wird die Wahrscheinlichkeit, dass jemand z.B. Krebs bekommt durch Gegenwahrscheinlichkeit bestimmt.&lt;br /&gt;
==Biomarkersignatur==&lt;br /&gt;
Erweiterung für mehrere Gene. &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt; P(x) = \frac{1}{e^{-((\beta)_1 \cdot x_1) + ((\beta)_2 \cdot x_1) + .... + (\beta)_n \cdot x_n) + \beta_0)}}&amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
'''Mashine learning''' &amp;lt;br&amp;gt;&lt;br /&gt;
* Ein Modell muss zunächst von einem System erlent werden, dann kann das System eine Aussage treffen, ob z.B. 'krank' oder 'gesund'. &amp;lt;br&amp;gt;&lt;br /&gt;
* Parameter &amp;lt;math&amp;gt; \beta_1 &amp;lt;/math&amp;gt; und &amp;lt;math&amp;gt; \beta_0 &amp;lt;/math&amp;gt; können nicht berechnet werden. →  Müssen mit Hilfe eines Algorithmus geschätzt werden. &amp;lt;br&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''Maximum-Likelihood:''' &amp;lt;br&amp;gt;&lt;br /&gt;
* Schätzung zur Parameterbestimmung. &amp;lt;br&amp;gt;&lt;br /&gt;
* ''Training'': Lerndaten sind bekannte Werte zur Aussage 'krank' oder 'gesund' &amp;lt;br&amp;gt;&lt;br /&gt;
→  Algorithmus bestimmt einen genauen Wert für &amp;lt;math&amp;gt; \beta_1&amp;lt;/math&amp;gt;, um krank (1) und gesund (0) zu bestimmen. &amp;lt;br&amp;gt;&lt;br /&gt;
→  Danach kann mit dem Modell bestimmt werden, ob es gut oder schlecht ist. &amp;lt;br&amp;gt;&lt;br /&gt;
*'''Problem''': System versucht einen optimalen Wert zu finden &amp;lt;br&amp;gt;&lt;br /&gt;
→  ''Overfitting'': Zu genaue Beschreibung des Modells.&amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
'''Frage:''' Wie gut ist die Qualität des Modells? &amp;lt;br&amp;gt;&lt;br /&gt;
==Receiver Operation Characteristic (ROC)== &amp;lt;br&amp;gt;&lt;br /&gt;
Wird genutzt um zu prüfen, ob das Modell gut ist. &amp;lt;br&amp;gt;&lt;br /&gt;
→ Wie viele falsch positive, falsch negative, aber auch richtig positive und richtig negative Aussagen trifft das Modell? &amp;lt;br&amp;gt;&lt;br /&gt;
{| class=&amp;quot;wikitable float-left&amp;quot; style=&amp;quot;text-align:center&amp;quot;&lt;br /&gt;
| || ||colspan=&amp;quot;3&amp;quot; style=&amp;quot;text-align:center&amp;quot;| Mensch&lt;br /&gt;
|-&lt;br /&gt;
| || ||  '''Krebs''' || '''Gesund''' &lt;br /&gt;
|-&lt;br /&gt;
|rowspan=&amp;quot;2&amp;quot;| Modellvorhersage&lt;br /&gt;
| '''Krebs''' ||style=&amp;quot;background:#B9FFC5 &amp;quot; | TP ||  	style=&amp;quot;background:#FFCBCB| FP&lt;br /&gt;
|-&lt;br /&gt;
| '''Gesund''' ||style=&amp;quot;background:#FFCBCB| FN || style=&amp;quot;background:#B9FFC5 &amp;quot; | TN&lt;br /&gt;
|-&lt;br /&gt;
|}&lt;br /&gt;
Beispiel 'Krebs' = positiv, 'geund' = negativ&lt;br /&gt;
* &amp;lt;span style=&amp;quot;background:#B9FFC5&amp;quot;&amp;gt; TP&amp;lt;/span&amp;gt;: True Positive (richtig positiv)  → Modell sagt 'Krebs' richtig voraus. &amp;lt;br&amp;gt;&lt;br /&gt;
*&amp;lt;span style=&amp;quot;background:#B9FFC5&amp;quot;&amp;gt; TN&amp;lt;/span&amp;gt;: True Negative (richtig negativ) → Modell sagt 'gesund' richtig voraus. &amp;lt;br&amp;gt;&lt;br /&gt;
*&amp;lt;span style=&amp;quot;background:#FFCBCB&amp;quot;&amp;gt; FP&amp;lt;/span&amp;gt;: False Positive (falsch positiv) → Modell sagt der Patient hat Krebs, obwohl er gesund ist. &amp;lt;br&amp;gt;&lt;br /&gt;
*&amp;lt;span style=&amp;quot;background:#FFCBCB&amp;quot;&amp;gt; FN&amp;lt;/span&amp;gt;: False Negative (falsch negativ) → Modell sagt 'gesund', obwohl der Patient Krebs hat. &amp;lt;br&amp;gt;&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=9_Biomarker&amp;diff=178</id>
		<title>9 Biomarker</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=9_Biomarker&amp;diff=178"/>
		<updated>2019-07-01T21:16:09Z</updated>

		<summary type="html">&lt;p&gt;Vero: Created page with &amp;quot;= Biomarker = '''Medizinische Biomarker'''&amp;lt;br&amp;gt; * Ein Biomarker ist ein messbarer Parameter biologischer Prozesse, der prognostische, oder diagnostische Aussagekraft hat und so...&amp;quot;&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Biomarker =&lt;br /&gt;
'''Medizinische Biomarker'''&amp;lt;br&amp;gt;&lt;br /&gt;
* Ein Biomarker ist ein messbarer Parameter biologischer Prozesse, der prognostische, oder diagnostische Aussagekraft hat und somit ein Indikator für Krankheiten, oder Umwelteinflüsse ist. &lt;br /&gt;
* Charakteristische biologische Merkmale, die objektiv gemessen werden können und auf einen normalen biologischen, oder krankhaften Prozess im Körper hinweisen können. &lt;br /&gt;
*  Es können Zellen, Gene, Genprodukte, Enzyme, oder Hormone sein.&lt;br /&gt;
[[File:VL8 1.png|mini|850px]]&lt;br /&gt;
Wie in der Abbildung oben dargestellt, kann über Einzelwerte keine Aussage getroffen werden, ob der Patient krank oder gesund ist. &amp;lt;br&amp;gt;&lt;br /&gt;
→ deswegen bedarf es mehrerer Biomarker &amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''Frage:''' &amp;lt;br&amp;gt;&lt;br /&gt;
Wie kann für einen TPM-Wert vorhergesagt werden, ob es sich um 'Krebs' oder 'gesund' handelt?&amp;lt;br&amp;gt;&lt;br /&gt;
==Logistische Funktion==&lt;br /&gt;
&amp;lt;math&amp;gt; y = \beta_1 \cdot TPM_{HIF1\alpha} + \beta_0 &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt; logit_{(P)} = log \frac{P}{1-P} &amp;lt;/math&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
* Damit wird die Wahrscheinlichkeit, dass jemand z.B. Krebs bekommt durch Gegenwahrscheinlichkeit bestimmt.&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=File:VL8_1.png&amp;diff=177</id>
		<title>File:VL8 1.png</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=File:VL8_1.png&amp;diff=177"/>
		<updated>2019-07-01T20:57:30Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Expressionen&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=7_Multiples_Testen&amp;diff=176</id>
		<title>7 Multiples Testen</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=7_Multiples_Testen&amp;diff=176"/>
		<updated>2019-07-01T19:43:55Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;=Multiples Testen=&lt;br /&gt;
[[File:VL7.png|right|frameless|thumb]] &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
In der Tabelle sind die Werte für 4 Gene dargestellt. Insgesamt wurden 5000 Gene untersucht. &amp;lt;br&amp;gt;&lt;br /&gt;
* K1-3 stellen die Kontrollen dar. &amp;lt;br&amp;gt;&lt;br /&gt;
* T1-3 die getesteten mit dem NAT8L knock-out.&lt;br /&gt;
* Der fold change stellt das Verhältnis von knock-out und Kontrolle dar             → Hoch oder runter regulierte Gene.&lt;br /&gt;
* Die Ergebnisse sind nicht gut vergleichbar, da sie teilweise eine große Streuung zeigen.&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot; style=&amp;quot;text-align:center&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Gen !!  K1 !! K2 !!  K3 !!  T1 !! T2 !! T3 !! &amp;lt;math&amp;gt;\overline{X}&amp;lt;/math&amp;gt; Kontrolle !! &amp;lt;math&amp;gt;\overline{X}&amp;lt;/math&amp;gt; -NAT8L !! fold change !! p-Wert !! pi-Wert&lt;br /&gt;
|-&lt;br /&gt;
| NAT8L || 340 || 348 || 350 || 2 || 0 || 4 || 340 || 2 || 0,0058 || 1,00 x &amp;lt;math&amp;gt;10^{-5}&amp;lt;/math&amp;gt; || 0,05&lt;br /&gt;
|-&lt;br /&gt;
| LDH || 57 || 68 || 34 || 112 || 128 || 105 || 59,7 || 115 || 1,93 || 0,0043 || 21,5&lt;br /&gt;
|-&lt;br /&gt;
| IDH || 215 || 110 || 55 || 158 || 357 || 415 || 126,7 || 310 || 2,44 || 0,129 || 645 &lt;br /&gt;
|-&lt;br /&gt;
| HIF1&amp;lt;math&amp;gt;\alpha&amp;lt;/math&amp;gt; || 57 || 58 || 57 || 564 || 570 || 565 || 57,3 || 566,3 || 9,88 || 7,2 x &amp;lt;math&amp;gt;10^{-6}&amp;lt;/math&amp;gt; || 0,036&lt;br /&gt;
|-&lt;br /&gt;
|}&lt;br /&gt;
== t-Test==&lt;br /&gt;
Der t-Test wird verwendet, um zu bestimmen, ob die Mittelwerte zweier Stichproben sich signifikant voneinander unterscheiden. Dafür wird die Nullhypothese H0 getestet, sie sagt aus, dass Stichprobe und Kontrolle sich nicht signifikant unterscheiden. In diesem Fall also  &amp;lt;math&amp;gt;H_0: \overline{X} Kontrolle = \overline{X}-NAT8L &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Die Gegenhypothese H1 sagt aus, dass sich die Ergebnisse signifikant unterscheiden, also &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt;H_1: \overline{X} Kontrolle \ne \overline{X}-NAT8L &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
Mit Hilfe des t-Tests wird bestimmt, ob die Nullhypothese zutrifft, oder ob sie verworfen wird und die Gegenhypothese angenommen wird. Die Formel zur Berechnung der t-Werte entspricht: &amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;math&amp;gt; t = \frac{\overline{X}_{1} - \overline{X}_{2} }{s_{x} \cdot \surd \frac{1}{n_{1}} + \frac{1}{n_{2}}} &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''Parameter:''' &amp;lt;br&amp;gt;&lt;br /&gt;
* &amp;lt;math&amp;gt;\overline{X}_1 &amp;lt;/math&amp;gt;  = Mittelwert Stichprobe 1&amp;lt;br&amp;gt;&lt;br /&gt;
* &amp;lt;math&amp;gt;\overline{X}_2  &amp;lt;/math&amp;gt; = Mittelwert Stichprobe 2 &amp;lt;br&amp;gt;&lt;br /&gt;
* &amp;lt;math&amp;gt;s_x  &amp;lt;/math&amp;gt; = Standardabweichung&lt;br /&gt;
* n = Größe der Stichprobe&amp;lt;br&amp;gt;&lt;br /&gt;
Nach der Berechnung der t- Werte, Standardabweichung und den Freiheitsgraden werden die t-Werte in die t-Verteilung eingesetzt. Daraus kann mit Hilfe des p-Werts beurteilt werden, ob die Nullhypotese angenommen, oder verworfen wird.&amp;lt;br&amp;gt;&lt;br /&gt;
===P-Wert===&lt;br /&gt;
Der p-Wert &lt;br /&gt;
&lt;br /&gt;
'''Problem:'''&amp;lt;br&amp;gt;&lt;br /&gt;
In diesem Fall wurden 5000 Genexpressionen verglichen (n=5000). Statistisch gesehen werden ca. 250 Gene durch Zufall einen p-Wert von &amp;lt;math&amp;gt;\leq&amp;lt;/math&amp;gt; 0,05 haben. → &amp;lt;math&amp;gt;\alpha&amp;lt;/math&amp;gt;-Fehler (Fehler 1. Art)&lt;br /&gt;
* Fehler 1. Art: Die Nullhypothese wird verworfen, obwohl sie eigentlich zutrifft.&lt;br /&gt;
&lt;br /&gt;
==Lösung 1: Bonferroni-Korrektur==&lt;br /&gt;
* Für jeden p-Wert wird ein neuer p-Wert berechnet.&lt;br /&gt;
* Bestimmter p-Wert wird mit Größe der Stichprobe multipliziert.&lt;br /&gt;
&amp;lt;math&amp;gt;P_i* = P_i \cdot n &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
'''Parameter:'''&amp;lt;br&amp;gt;&lt;br /&gt;
* &amp;lt;math&amp;gt;P_i = &amp;lt;/math&amp;gt; Bestimmter p-Wert für Gen 'i' &amp;lt;br&amp;gt;&lt;br /&gt;
* &amp;lt;math&amp;gt;P_i* = &amp;lt;/math&amp;gt; Korrigierter P-Wert für Gen 'i'&amp;lt;br&amp;gt;&lt;br /&gt;
* n = Größe der Stichprobe&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot; style=&amp;quot;float:left; margin-right:1em&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
!  Gen !! &amp;lt;math&amp;gt;P_i  &amp;lt;/math&amp;gt; !! &amp;lt;math&amp;gt;P_i* =&amp;lt;/math&amp;gt; &lt;br /&gt;
|-&lt;br /&gt;
| NAT8L || 1,00 x &amp;lt;math&amp;gt;10^{-5}&amp;lt;/math&amp;gt; || 0,05 → Signifikant&lt;br /&gt;
|-&lt;br /&gt;
| LDH || 0,0043 || 21,5&lt;br /&gt;
|-&lt;br /&gt;
| IDH || 0,129 || 645&lt;br /&gt;
|-&lt;br /&gt;
|HIF1&amp;lt;math&amp;gt;\alpha&amp;lt;/math&amp;gt; || 7,2 x &amp;lt;math&amp;gt;10^{-6}&amp;lt;/math&amp;gt; || 0,036 → Signifikant&lt;br /&gt;
|}&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot; style=&amp;quot;float:left&amp;quot;&lt;br /&gt;
! Vorteile || Nachteile&lt;br /&gt;
|-&lt;br /&gt;
| -  Statistisch sehr sicher || - Statistisch sehr sicher, aber auch sehr streng &lt;br /&gt;
|-&lt;br /&gt;
| || - Produzuert viele falsch negative Ergebnisse&lt;br /&gt;
|-&lt;br /&gt;
|}&lt;br /&gt;
&amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
==Lösung 2: Benjamini-Hochberg-Prozedur== &lt;br /&gt;
* Eine Alternative zu Bonferroni, die nicht so streng ist. &amp;lt;br&amp;gt;&lt;br /&gt;
* Es wird ein gewisser Prozentsatz bestimmt, der auch falsch akzeptiert wird. &amp;lt;br&amp;gt;&lt;br /&gt;
* Q als Bezeichnung für die False Discovery Rate (FDR).&amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;br&amp;gt;&lt;br /&gt;
# Sortiere alle p-Werte aufsteigend. &amp;lt;br&amp;gt;&lt;br /&gt;
# Weise jedem p-Wert einen Rang 'i' zu. &amp;lt;br&amp;gt;&lt;br /&gt;
# Berechne für jeden p-Wert den Benjamini-Hochberg kritischen Wert. &amp;lt;br&amp;gt;&lt;br /&gt;
# Vergleiche original p-Wert mit kritischem BH und finde den größten p-Wert (&amp;lt;math&amp;gt; p_k &amp;lt;/math&amp;gt;), der kleiner, als der der kritische BH ist.&lt;br /&gt;
# Lehne alle Nullhypothesen &amp;lt;math&amp;gt; H_t&amp;lt;/math&amp;gt; für t= 1 bis k ab.&lt;br /&gt;
&lt;br /&gt;
Benjamini-Hochberg kritischer Wert (BH) = &amp;lt;math&amp;gt;\frac{i}{n} \cdot Q &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
'''Parameter:''' &amp;lt;br&amp;gt;&lt;br /&gt;
n = Anzahl der Tests &amp;lt;br&amp;gt;&lt;br /&gt;
i = Rang &amp;lt;br&amp;gt;&lt;br /&gt;
Q = False Discovery Rate &amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''Beispiel:'''&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot; style=&amp;quot;text-align:center&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Gen !!  p-Wert !! Rang 'i'  !!  BH !! p &amp;lt; BH !! Signifikant für Q = 5 %&lt;br /&gt;
|-&lt;br /&gt;
| HIF1&amp;lt;math&amp;gt;\alpha&amp;lt;/math&amp;gt; || 7,2 x &amp;lt;math&amp;gt;10^{-6}&amp;lt;/math&amp;gt; || 1 || 1 x &amp;lt;math&amp;gt;10^{-5}&amp;lt;/math&amp;gt; || wahr || ja&lt;br /&gt;
|-&lt;br /&gt;
| MDH || 2,5 x &amp;lt;math&amp;gt;10^{-5}&amp;lt;/math&amp;gt; || 2 || 2 x &amp;lt;math&amp;gt;10^{-5}&amp;lt;/math&amp;gt; || falsch ||ja&lt;br /&gt;
|-&lt;br /&gt;
| HK || 2,8 x &amp;lt;math&amp;gt;10^{-5}&amp;lt;/math&amp;gt; || 3 || 3 x &amp;lt;math&amp;gt;10^{-5}&amp;lt;/math&amp;gt; || '''wahr''' || → '''ja'''&lt;br /&gt;
|-&lt;br /&gt;
| LDH || 0,0043 || 4 || 4 x &amp;lt;math&amp;gt;10^{-5}&amp;lt;/math&amp;gt; || falsch || nein&lt;br /&gt;
|-&lt;br /&gt;
| PDH || 0,02 ||5 || 5 x &amp;lt;math&amp;gt;10^{-5}&amp;lt;/math&amp;gt;|| falsch || nein&lt;br /&gt;
|-&lt;br /&gt;
| IDH || 0,129 || 6 || 6 x &amp;lt;math&amp;gt;10^{-5}&amp;lt;/math&amp;gt; || falsch || nein&lt;br /&gt;
|-&lt;br /&gt;
| ...2994 weitere Gene || ... || ... || ... ||... || ...&lt;br /&gt;
|-&lt;br /&gt;
|}&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=7_Multiples_Testen&amp;diff=175</id>
		<title>7 Multiples Testen</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=7_Multiples_Testen&amp;diff=175"/>
		<updated>2019-07-01T19:16:39Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;=Multiples Testen=&lt;br /&gt;
[[File:VL7.png|right|frameless|thumb]] &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
In der Tabelle sind die Werte für 4 Gene dargestellt. Insgesamt wurden 5000 Gene untersucht. &amp;lt;br&amp;gt;&lt;br /&gt;
* K1-3 stellen die Kontrollen dar. &amp;lt;br&amp;gt;&lt;br /&gt;
* T1-3 die getesteten mit dem NAT8L knock-out.&lt;br /&gt;
* Der fold change stellt das Verhältnis von knock-out und Kontrolle dar             → Hoch oder runter regulierte Gene.&lt;br /&gt;
* Die Ergebnisse sind nicht gut vergleichbar, da sie teilweise eine große Streuung zeigen.&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot; style=&amp;quot;text-align:center&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Gen !!  K1 !! K2 !!  K3 !!  T1 !! T2 !! T3 !! &amp;lt;math&amp;gt;\overline{X}&amp;lt;/math&amp;gt; Kontrolle !! &amp;lt;math&amp;gt;\overline{X}&amp;lt;/math&amp;gt; -NAT8L !! fold change !! p-Wert !! pi-Wert&lt;br /&gt;
|-&lt;br /&gt;
| NAT8L || 340 || 348 || 350 || 2 || 0 || 4 || 340 || 2 || 0,0058 || 1,00 x &amp;lt;math&amp;gt;10^{-5}&amp;lt;/math&amp;gt; || 0,05&lt;br /&gt;
|-&lt;br /&gt;
| LDH || 57 || 68 || 34 || 112 || 128 || 105 || 59,7 || 115 || 1,93 || 0,0043 || 21,5&lt;br /&gt;
|-&lt;br /&gt;
| IDH || 215 || 110 || 55 || 158 || 357 || 415 || 126,7 || 310 || 2,44 || 0,129 || 645 &lt;br /&gt;
|-&lt;br /&gt;
| HIF1&amp;lt;math&amp;gt;\alpha&amp;lt;/math&amp;gt; || 57 || 58 || 57 || 564 || 570 || 565 || 57,3 || 566,3 || 9,88 || 7,2 x &amp;lt;math&amp;gt;10^{-6}&amp;lt;/math&amp;gt; || 0,036&lt;br /&gt;
|-&lt;br /&gt;
|}&lt;br /&gt;
== t-Test==&lt;br /&gt;
Der t-Test wird verwendet, um zu bestimmen, ob die Mittelwerte zweier Stichproben sich signifikant voneinander unterscheiden. Dafür wird die Nullhypothese H0 getestet, sie sagt aus, dass Stichprobe und Kontrolle sich nicht signifikant unterscheiden. In diesem Fall also  &amp;lt;math&amp;gt;H_0: \overline{X} Kontrolle = \overline{X}-NAT8L &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Die Gegenhypothese H1 sagt aus, dass sich die Ergebnisse signifikant unterscheiden, also &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt;H_1: \overline{X} Kontrolle \ne \overline{X}-NAT8L &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
Mit Hilfe des t-Tests wird bestimmt, ob die Nullhypothese zutrifft, oder ob sie verworfen wird und die Gegenhypothese angenommen wird. Die Formel zur Berechnung der t-Werte entspricht: &amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;math&amp;gt; t = \frac{\overline{X}_{1} - \overline{X}_{2} }{s_{x} \cdot \surd \frac{1}{n_{1}} + \frac{1}{n_{2}}} &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''Parameter:''' &amp;lt;br&amp;gt;&lt;br /&gt;
* &amp;lt;math&amp;gt;\overline{X}_1 &amp;lt;/math&amp;gt;  = Mittelwert Stichprobe 1&amp;lt;br&amp;gt;&lt;br /&gt;
* &amp;lt;math&amp;gt;\overline{X}_2  &amp;lt;/math&amp;gt; = Mittelwert Stichprobe 2 &amp;lt;br&amp;gt;&lt;br /&gt;
* &amp;lt;math&amp;gt;s_x  &amp;lt;/math&amp;gt; = Standardabweichung&lt;br /&gt;
* n = Größe der Stichprobe&amp;lt;br&amp;gt;&lt;br /&gt;
Nach der Berechnung der t- Werte, Standardabweichung und den Freiheitsgraden werden die t-Werte in die t-Verteilung eingesetzt. Daraus kann mit Hilfe des p-Werts beurteilt werden, ob die Nullhypotese angenommen, oder verworfen wird.&amp;lt;br&amp;gt;&lt;br /&gt;
===P-Wert===&lt;br /&gt;
Der p-Wert &lt;br /&gt;
&lt;br /&gt;
'''Problem:'''&amp;lt;br&amp;gt;&lt;br /&gt;
In diesem Fall wurden 5000 Genexpressionen verglichen (n=5000). Statistisch gesehen werden ca. 250 Gene durch Zufall einen p-Wert von &amp;lt;math&amp;gt;\leq&amp;lt;/math&amp;gt; 0,05 haben. → &amp;lt;math&amp;gt;\alpha&amp;lt;/math&amp;gt;-Fehler (Fehler 1. Art)&lt;br /&gt;
* Fehler 1. Art: Die Nullhypothese wird verworfen, obwohl sie eigentlich zutrifft.&lt;br /&gt;
&lt;br /&gt;
==Lösung 1: Bonferroni-Korrektur==&lt;br /&gt;
* Für jeden p-Wert wird ein neuer p-Wert berechnet.&lt;br /&gt;
* Bestimmter p-Wert wird mit Größe der Stichprobe multipliziert.&lt;br /&gt;
&amp;lt;math&amp;gt;P_i* = P_i \cdot n &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
'''Parameter:'''&amp;lt;br&amp;gt;&lt;br /&gt;
* &amp;lt;math&amp;gt;P_i = &amp;lt;/math&amp;gt; Bestimmter p-Wert für Gen 'i' &amp;lt;br&amp;gt;&lt;br /&gt;
* &amp;lt;math&amp;gt;P_i* = &amp;lt;/math&amp;gt; Korrigierter P-Wert für Gen 'i'&amp;lt;br&amp;gt;&lt;br /&gt;
* n = Größe der Stichprobe&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot; style=&amp;quot;float:left; margin-right:1em&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
!  Gen !! &amp;lt;math&amp;gt;P_i  &amp;lt;/math&amp;gt; !! &amp;lt;math&amp;gt;P_i* =&amp;lt;/math&amp;gt; &lt;br /&gt;
|-&lt;br /&gt;
| NAT8L || 1,00 x &amp;lt;math&amp;gt;10^{-5}&amp;lt;/math&amp;gt; || 0,05 → Signifikant&lt;br /&gt;
|-&lt;br /&gt;
| LDH || 0,0043 || 21,5&lt;br /&gt;
|-&lt;br /&gt;
| IDH || 0,129 || 645&lt;br /&gt;
|-&lt;br /&gt;
|HIF1&amp;lt;math&amp;gt;\alpha&amp;lt;/math&amp;gt; || 7,2 x &amp;lt;math&amp;gt;10^{-6}&amp;lt;/math&amp;gt; || 0,036 → Signifikant&lt;br /&gt;
|}&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot; style=&amp;quot;float:left&amp;quot;&lt;br /&gt;
! Vorteile || Nachteile&lt;br /&gt;
|-&lt;br /&gt;
| -  Statistisch sehr sicher || - Statistisch sehr sicher, aber auch sehr streng &lt;br /&gt;
|-&lt;br /&gt;
| || - Produzuert viele falsch negative Ergebnisse&lt;br /&gt;
|-&lt;br /&gt;
|}&lt;br /&gt;
&amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
==Lösung 2: Benjamini-Hochberg-Prozedur== &lt;br /&gt;
* Eine Alternative zu Bonferroni, die nicht so streng ist. &amp;lt;br&amp;gt;&lt;br /&gt;
* Es wird ein gewisser Prozentsatz bestimmt, der auch falsch akzeptiert wird. &amp;lt;br&amp;gt;&lt;br /&gt;
* Q als Bezeichnung für die False Discovery Rate (FDR).&amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;br&amp;gt;&lt;br /&gt;
# Sortiere alle p-Werte aufsteigend. &amp;lt;br&amp;gt;&lt;br /&gt;
# Weise jedem p-Wert einen Rang 'i' zu. &amp;lt;br&amp;gt;&lt;br /&gt;
# Berechne für jeden p-Wert den Benjamini-Hochberg kritischen Wert. &amp;lt;br&amp;gt;&lt;br /&gt;
# Vergleiche original p-Wert mit kritischem BH und finde den größten p-Wert (&amp;lt;math&amp;gt; p_k &amp;lt;/math&amp;gt;), der kleiner, als der der kritische BH ist.&lt;br /&gt;
# Lehne alle Nullhypothesen &amp;lt;math&amp;gt; H_t&amp;lt;/math&amp;gt; für t= 1 bis k ab.&lt;br /&gt;
&lt;br /&gt;
Benjamini-Hochberg kritischer Wert (BH) = &amp;lt;math&amp;gt;\frac{i}{n} \cdot Q &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
'''Parameter:''' &amp;lt;br&amp;gt;&lt;br /&gt;
n = Anzahl der Tests &amp;lt;br&amp;gt;&lt;br /&gt;
i = Rang &amp;lt;br&amp;gt;&lt;br /&gt;
Q = False Discovery Rate &amp;lt;br&amp;gt;&lt;br /&gt;
'''Bold text''' '''&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=7_Multiples_Testen&amp;diff=169</id>
		<title>7 Multiples Testen</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=7_Multiples_Testen&amp;diff=169"/>
		<updated>2019-07-01T16:05:53Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Multiples Testen==&lt;br /&gt;
[[File:VL7.png|right|frameless|thumb]] &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
In der Tabelle sind die Werte für 4 Gene dargestellt. Insgesamt wurden 5000 Gene untersucht. &amp;lt;br&amp;gt;&lt;br /&gt;
* K1-3 stellen die Kontrollen dar. &amp;lt;br&amp;gt;&lt;br /&gt;
* T1-3 die getesteten mit dem NAT8L knock-out.&lt;br /&gt;
* Der fold change stellt das Verhältnis von knock-out und Kontrolle dar             → Hoch oder runter regulierte Gene.&lt;br /&gt;
* Die Ergebnisse sind nicht gut vergleichbar, da sie teilweise eine große Streuung zeigen.&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot; style=&amp;quot;text-align:center&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Gen !!  K1 !! K2 !!  K3 !!  T1 !! T2 !! T3 !! &amp;lt;math&amp;gt;\overline{X}&amp;lt;/math&amp;gt; Kontrolle !! &amp;lt;math&amp;gt;\overline{X}&amp;lt;/math&amp;gt; -NAT8L !! fold change !! p-Wert !! pi-Wert&lt;br /&gt;
|-&lt;br /&gt;
| NAT8L || 340 || 348 || 350 || 2 || 0 || 4 || 340 || 2 || 0,0058 || 1,00 x &amp;lt;math&amp;gt;10^{-5}&amp;lt;/math&amp;gt; || 0,05&lt;br /&gt;
|-&lt;br /&gt;
| LDH || 57 || 68 || 34 || 112 || 128 || 105 || 59,7 || 115 || 1,93 || 0,0043 || 21,5&lt;br /&gt;
|-&lt;br /&gt;
| IDH || 215 || 110 || 55 || 158 || 357 || 415 || 126,7 || 310 || 2,44 || 0,129 || 64,5 &lt;br /&gt;
|-&lt;br /&gt;
| HIF1&amp;lt;math&amp;gt;\alpha&amp;lt;/math&amp;gt; || 57 || 58 || 57 || 564 || 570 || 565 || 57,3 || 566,3 || 9,88 || 7,2 x &amp;lt;math&amp;gt;10^{-6}&amp;lt;/math&amp;gt; || 0,036&lt;br /&gt;
|-&lt;br /&gt;
|}&lt;br /&gt;
=== t-Test===&lt;br /&gt;
Der t-Test wird verwendet, um zu bestimmen, ob die Mittelwerte zweier Stichproben sich signifikant voneinander unterscheiden. Dafür wird die Nullhypothese H0 getestet, sie sagt aus, dass Stichprobe und Kontrolle sich nicht signifikant unterscheiden. In diesem Fall also  &amp;lt;math&amp;gt;H_0: \overline{X} Kontrolle = \overline{X}-NAT8L &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Die Gegenhypothese H1 sagt aus, dass sich die Ergebnisse signifikant unterscheiden, also &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt;H_1: \overline{X} Kontrolle \ne \overline{X}-NAT8L &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
Mit Hilfe des t-Tests wird bestimmt, ob die Nullhypothese zutrifft, oder ob sie verworfen wird und die Gegenhypothese angenommen wird. Die Formel für den t-Test entspricht: &amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;math&amp;gt; t = \frac{\overline{X}_{1} - \overline{X}_{2} }{s_{x} \cdot \surd \frac{1}{n_{1}} + \frac{1}{n_{2}}} &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Parameter: &amp;lt;br&amp;gt;&lt;br /&gt;
* &amp;lt;math&amp;gt;\overline{X}_1 &amp;lt;/math&amp;gt;  = Mittelwert Stichprobe 1&amp;lt;br&amp;gt;&lt;br /&gt;
* &amp;lt;math&amp;gt;\overline{X}_2  &amp;lt;/math&amp;gt; = Mittelwert Stichprobe 2 &amp;lt;br&amp;gt;&lt;br /&gt;
* &amp;lt;math&amp;gt;s_x  &amp;lt;/math&amp;gt; = Standardabweichung&lt;br /&gt;
* n = Größe der Stichprobe&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=7_Multiples_Testen&amp;diff=168</id>
		<title>7 Multiples Testen</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=7_Multiples_Testen&amp;diff=168"/>
		<updated>2019-07-01T15:16:23Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Multiples Testen==&lt;br /&gt;
[[File:VL7.png|right|frameless|thumb]] &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
In der Tabelle sind die Werte für 4 Gene dargestellt. Insgesamt wurden 5000 Gene untersucht. &amp;lt;br&amp;gt;&lt;br /&gt;
* K1-3 stellen die Kontrollen dar. &amp;lt;br&amp;gt;&lt;br /&gt;
* T1-3 die getesteten mit dem NAT8L knock-out.&lt;br /&gt;
* Der fold change stellt das Verhältnis von knock-out und Kontrolle dar             → Hoch oder runter regulierte Gene.&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot; style=&amp;quot;text-align:center&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Gen !!  K1 !! K2 !!  K3 !!  T1 !! T2 !! T3 !! &amp;lt;math&amp;gt;\overline{X}&amp;lt;/math&amp;gt; Kontrolle !! &amp;lt;math&amp;gt;\overline{X}&amp;lt;/math&amp;gt; -NAT8L !! fold change !! p-Wert !! pi-Wert&lt;br /&gt;
|-&lt;br /&gt;
| NAT8L || 340 || 348 || 350 || 2 || 0 || 4 || 340 || 2 || 0,0058 || 1,00 x &amp;lt;math&amp;gt;10^{-5}&amp;lt;/math&amp;gt; || 0,05&lt;br /&gt;
|-&lt;br /&gt;
| LDH || 57 || 68 || 34 || 112 || 128 || 105 || 59,7 || 115 || 1,93 || 0,0043 || 21,5&lt;br /&gt;
|-&lt;br /&gt;
| IDH || 215 || 110 || 55 || 158 || 357 || 415 || 126,7 || 310 || 2,44 || 0,129 || 64,5 &lt;br /&gt;
|-&lt;br /&gt;
| HIF1&amp;lt;math&amp;gt;\alpha&amp;lt;/math&amp;gt; || 57 || 58 || 57 || 564 || 570 || 565 || 57,3 || 566,3 || 9,88 || 7,2 x &amp;lt;math&amp;gt;10^{-6}&amp;lt;/math&amp;gt; || 0,036&lt;br /&gt;
|-&lt;br /&gt;
|}&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=7_Multiples_Testen&amp;diff=167</id>
		<title>7 Multiples Testen</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=7_Multiples_Testen&amp;diff=167"/>
		<updated>2019-07-01T14:52:56Z</updated>

		<summary type="html">&lt;p&gt;Vero: Created page with &amp;quot;== Multiples Testen== thumb &amp;lt;br&amp;gt; {| class=&amp;quot;wikitable&amp;quot; style=&amp;quot;text-align:center&amp;quot; |- ! Gen !!  C1 !! C2 !!  C3 !!  !! fold change |- | Example |...&amp;quot;&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Multiples Testen==&lt;br /&gt;
[[File:VL7.png|right|frameless|thumb]] &amp;lt;br&amp;gt;&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot; style=&amp;quot;text-align:center&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Gen !!  C1 !! C2 !!  C3 !!  !! fold change&lt;br /&gt;
|-&lt;br /&gt;
| Example || Example || Example || Example || Example || Example || Example || Example || Example&lt;br /&gt;
|-&lt;br /&gt;
| Example || Example || Example || Example || Example || Example || Example || Example || Example&lt;br /&gt;
|-&lt;br /&gt;
| Example || Example || Example || Example || Example || Example || Example || Example || Example&lt;br /&gt;
|}&lt;br /&gt;
&amp;lt;math&amp;gt; \bar{x} &amp;lt;\math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot; style=&amp;quot;text-align:center&amp;quot;&lt;br /&gt;
| A&lt;br /&gt;
| B&lt;br /&gt;
| C&lt;br /&gt;
|-&lt;br /&gt;
|colspan=&amp;quot;3&amp;quot;| eine Zeile&lt;br /&gt;
|}&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=File:VL7.png&amp;diff=166</id>
		<title>File:VL7.png</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=File:VL7.png&amp;diff=166"/>
		<updated>2019-07-01T14:38:39Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Überblick&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=FASTA-Format&amp;diff=164</id>
		<title>FASTA-Format</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=FASTA-Format&amp;diff=164"/>
		<updated>2019-06-06T13:59:47Z</updated>

		<summary type="html">&lt;p&gt;Vero: Created page with &amp;quot;Das FASTA-Format ist ein textbasiertes Format zur Darstellung und Speicherung von Nukleotidsequenzen einer DNA, z.B. nach einer RNASeq. &amp;lt;br&amp;gt;  {| class=&amp;quot;wikitable&amp;quot; ! colspan=&amp;quot;3...&amp;quot;&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Das FASTA-Format ist ein textbasiertes Format zur Darstellung und Speicherung von Nukleotidsequenzen einer DNA, z.B. nach einer RNASeq. &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
! colspan=&amp;quot;3&amp;quot;| Aufbau FASTA-Format&lt;br /&gt;
|-&lt;br /&gt;
| '''Kopfzeile''' ||Bacillus subtilis | &amp;lt;span style=&amp;quot;color:#FF0000&amp;quot;&amp;gt; &amp;gt; &amp;lt;/span&amp;gt;OpuC | Bacillus subtilis | Probe xy&lt;br /&gt;
|-&lt;br /&gt;
| '''Kommentar'''  || &amp;lt;span style=&amp;quot;color:#FF0000&amp;quot;&amp;gt; ; &amp;lt;/span&amp;gt;Optionaler Kommentar&lt;br /&gt;
|-&lt;br /&gt;
| '''Sequenz''' || MTEITAAMVKELRESTGAGMMDCKNALSETNGDFDKAVQLLREKGLG KAAKKADRLAAEGLVSVKVSDDFTIAAMRPSYLSYEDLDMTFVENEYK ALVAELEKENEERRRLKDPNKPEHKIPQFASRKQLSDAILKEAEEKIKEE LKAQGKPEKIWDNIIPGKMNSFIADNSQLDSKLTLMGQFYVMDDKKTVE QVIAEKEKEFGGKIKIVEFICFEVGEGEVAAQLFDKAVQLLREKGLG &lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
*Die Kopfzeile ist die Sequenz-ID und beginnt mit einem '''&amp;gt;''', ohne Leerzeile startet der Text. Dabei handelt es sich um eine genaue Beschreibung der Sequenz, um diese von den anderen Sequenzen unterscheiden zu können.  &lt;br /&gt;
*Die Kommentarzeilen sind optional, dabei kann es eine, oder mehrere Kommentarzeilen geben, eingeleitet werden diese durch ein ''';''' (Semikolon).&lt;br /&gt;
*Nach den oben genannten Zeilen startet die Sequenz in 5' → 3' Richtung, entweder in Form von Nukleinbasen (AGCT), oder Aminosäuren-Codes. Lücken werden durch '''-''' dargestellt.&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=Glossar&amp;diff=163</id>
		<title>Glossar</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=Glossar&amp;diff=163"/>
		<updated>2019-06-06T13:17:56Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== A ==&lt;br /&gt;
[[Alignment]]&amp;lt;br&amp;gt;&lt;br /&gt;
[[Algorithmus]]&amp;lt;br&amp;gt;&lt;br /&gt;
[[Assembly]] &lt;br /&gt;
== B ==&lt;br /&gt;
[[Benjamini-Hochberg-Prozedur]] &amp;lt;br&amp;gt;&lt;br /&gt;
[[Bonferroni-Korrektur]] &amp;lt;br&amp;gt;&lt;br /&gt;
[[Burrows-Wheeler Transformation]]&lt;br /&gt;
== C ==&lt;br /&gt;
[[Contig]]&amp;lt;br&amp;gt;&lt;br /&gt;
[[Coverage]]&lt;br /&gt;
== D ==&lt;br /&gt;
[[Dynamic programming]]&lt;br /&gt;
== E ==&lt;br /&gt;
== F ==&lt;br /&gt;
[[FASTA-Format]]&amp;lt;br&amp;gt;&lt;br /&gt;
[[FASTQ-Format]]&lt;br /&gt;
== G ==&lt;br /&gt;
[[gap penalty]]&lt;br /&gt;
== H ==&lt;br /&gt;
== I ==&lt;br /&gt;
[[Illumina]]&lt;br /&gt;
== J ==&lt;br /&gt;
== K ==&lt;br /&gt;
== L ==&lt;br /&gt;
[[Lander-Waterman-Modell]]&amp;lt;br&amp;gt;&lt;br /&gt;
[[Library]]&lt;br /&gt;
== M ==&lt;br /&gt;
[[Microarrays]]&lt;br /&gt;
== N ==&lt;br /&gt;
[[NGS]] &amp;lt;br&amp;gt;&lt;br /&gt;
[[Nullhypothese]]&lt;br /&gt;
== O ==&lt;br /&gt;
== P ==&lt;br /&gt;
[[p-value]]&lt;br /&gt;
== Q ==&lt;br /&gt;
== R ==&lt;br /&gt;
[[reads]]&amp;lt;br&amp;gt;&lt;br /&gt;
[[RNASeq]] &amp;lt;br&amp;gt;&lt;br /&gt;
[[RPKM]]&lt;br /&gt;
&lt;br /&gt;
== S ==&lt;br /&gt;
[[Scaffold]]&amp;lt;br&amp;gt;&lt;br /&gt;
[[Smith-Waterman Algorithmus]]&lt;br /&gt;
== T ==&lt;br /&gt;
[[t-Test]] &amp;lt;br&amp;gt;&lt;br /&gt;
[[TMM]] &amp;lt;br&amp;gt;&lt;br /&gt;
[[TPM]] &amp;lt;br&amp;gt;&lt;br /&gt;
[[Transkriptom]]&lt;br /&gt;
&lt;br /&gt;
== U ==&lt;br /&gt;
== V ==&lt;br /&gt;
== W ==&lt;br /&gt;
== X ==&lt;br /&gt;
== Y ==&lt;br /&gt;
== Z ==&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=RPKM&amp;diff=162</id>
		<title>RPKM</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=RPKM&amp;diff=162"/>
		<updated>2019-06-06T13:06:54Z</updated>

		<summary type="html">&lt;p&gt;Vero: Created page with &amp;quot;==RPKM== RPKM steht für 'Reads per kilobase of transcript per Million mapped reads' und ist eine Normalisierungsmethode für Expressionsstärken von Genen aus einer Probe. &amp;lt;b...&amp;quot;&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;==RPKM==&lt;br /&gt;
RPKM steht für 'Reads per kilobase of transcript per Million mapped reads' und ist eine Normalisierungsmethode für Expressionsstärken von Genen aus einer Probe. &amp;lt;br&amp;gt;&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Formel               !! Parameter&lt;br /&gt;
|-&lt;br /&gt;
| &amp;lt;math&amp;gt; RPKM =  \frac{ c_\text{i}}{L_\text{i} \cdot N} &amp;lt;/math&amp;gt; || c&amp;lt;sub&amp;gt;i&amp;lt;/sub&amp;gt; = Anzahl an ausrichtbaren reads für ein Transkript 'i'&amp;lt;br&amp;gt;&lt;br /&gt;
L&amp;lt;sub&amp;gt;i&amp;lt;/sub&amp;gt; = Länge des Transkripts/Gens 'i' in kbp &amp;lt;br&amp;gt;&lt;br /&gt;
N = Gesamtanzahl an ausrichtbaren reads in Millionen&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
  &amp;lt;math&amp;gt;   \frac{ c_\text{i}}{L_\text{i}} &amp;lt;/math&amp;gt;  → Normalisierung der Genlänge &amp;lt;br&amp;gt;&lt;br /&gt;
  &amp;lt;math&amp;gt; L_\text{i} \cdot N &amp;lt;/math&amp;gt; → Normalisierung der Sequenziertiefe &amp;lt;br&amp;gt;&lt;br /&gt;
Je höher der RPKM-Wert ist, desto höher ist die Genexpression. &amp;lt;br&amp;gt;&lt;br /&gt;
RPKM-Werte können gut zum Vergleich der Genexpressionen innerhalb einer Probe genutzt werden, jedoch sind sie nicht dafür geeignet mehrere Experimente bzw. Proben miteinander zu vergleichen.&lt;br /&gt;
&lt;br /&gt;
'''Beispiel:'''&lt;br /&gt;
&lt;br /&gt;
[[File:Beispiel Probe.png|Beispiel Probe]] &amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
* &amp;lt;math&amp;gt; RPKM (A) =  \frac{12}{0,6 kbp \cdot 6 \cdot 10^6} = 3,33 \cdot 10^{-6}  &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
* &amp;lt;math&amp;gt; RPKM (B) =  \frac{24}{1,1 kbp \cdot 6 \cdot 10^6} = 3,64  \cdot 10^{-6} &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
* &amp;lt;math&amp;gt; RPKM (C) =  \frac{12}{1,4 kbp \cdot 6 \cdot 10^6} = 1,43  \cdot 10^{-6} &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Durch die Normalisierung der Expressionsstärken können diese nun miteinander vergleichen werden.In diesem Beispiel wird Gen B am stärksten exprimiert und Gen C am schwächsten.&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=TPM&amp;diff=161</id>
		<title>TPM</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=TPM&amp;diff=161"/>
		<updated>2019-06-06T13:05:42Z</updated>

		<summary type="html">&lt;p&gt;Vero: Created page with &amp;quot;==TPM== TPM steht für 'Transcripts per Million' und ist eine Normalisierungsmethode für Expressionsstärken von Genen einer Probe. &amp;lt;br&amp;gt;  {| class=&amp;quot;wikitable&amp;quot; |- ! Formel...&amp;quot;&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;==TPM==&lt;br /&gt;
TPM steht für 'Transcripts per Million' und ist eine Normalisierungsmethode für Expressionsstärken von Genen einer Probe. &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Formel               !! Parameter&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;math&amp;gt;  TPM =  \frac{ c_\text{i}}{L_\text{i}}  \cdot  \dfrac {1}{\sum_\text{n} \dfrac {c_\text{n}}{L_\text{n}}}  \cdot 10^6 &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt; || c&amp;lt;sub&amp;gt;i&amp;lt;/sub&amp;gt; = Anzahl an ausrichtbaren reads für ein Transkript 'i'&amp;lt;br&amp;gt;&lt;br /&gt;
L&amp;lt;sub&amp;gt;i&amp;lt;/sub&amp;gt; = Länge des Transkripts/Gens 'i' in bp &amp;lt;br&amp;gt;&lt;br /&gt;
N = Gesamtanzahl an ausrichtbaren reads in Millionen&lt;br /&gt;
|} &amp;lt;br&amp;gt;&lt;br /&gt;
Wenn 1 Millionen Transkripte sequenziert würden, wäre TPM&amp;lt;sub&amp;gt;i&amp;lt;/sub&amp;gt; die Anzahl an Transkripten des Types 'i'. &amp;lt;br&amp;gt;&lt;br /&gt;
'''Beispiel:''' &amp;lt;br&amp;gt;&lt;br /&gt;
[[File:Beispiel Probe.png|Beispiel Probe]] &amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
*&amp;lt;math&amp;gt;  TPM (A) =  \frac{ 12}{600}  \cdot  \dfrac {1}{ \dfrac {12}{600} +  \dfrac {24}{1100} + \dfrac {11}{1400}}  \cdot 10^6  = 402614 &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
*&amp;lt;math&amp;gt;  TPM (B) =  \frac{ 24}{1100}  \cdot  \dfrac {1}{ \dfrac {12}{600} +  \dfrac {24}{1100} + \dfrac {11}{1400}}  \cdot 10^6  = 439216 &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
*&amp;lt;math&amp;gt;  TPM (C) =  \frac{ 11}{11400}  \cdot  \dfrac {1}{ \dfrac {12}{600} +  \dfrac {24}{1100} + \dfrac {11}{1400}}  \cdot 10^6  = 158170 &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
Nach der Normalisierung ist ein Vergleich der Genexpressionen möglich. Das Ergebnis gibt an, wie viele Transkripte der Gene entstehen würden, wenn 1 Millionen Transkripte sequenziert werden würden. So würde man z.B. für Gen B 429216 Transkripte erhalten und für Gen C 158170 Transkripte, somit wird Gen B stärker exprimiert, als Gen C.&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=TMM&amp;diff=160</id>
		<title>TMM</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=TMM&amp;diff=160"/>
		<updated>2019-06-06T13:03:41Z</updated>

		<summary type="html">&lt;p&gt;Vero: Created page with &amp;quot;TMM steht für 'Trimmed mean of M-values normalization method' und wird verwendet, um Genexpressionen von Genen zwischen Proben miteinander vergleichen zu können, z.B. um zu...&amp;quot;&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;TMM steht für 'Trimmed mean of M-values normalization method' und wird verwendet, um Genexpressionen von Genen zwischen Proben miteinander vergleichen zu können, z.B. um zu vergleichen, ob die Genexpression in normalen und in Krebszellen sich voneinander unterscheidet. &amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
'''Vorgehen:''' &amp;lt;br&amp;gt;&lt;br /&gt;
'''1.''' Der Gewichtungsfaktor für das Expressionsverhältnis für Gen 'g' zwischen Probe 'k' ' und 'k' wird bestimmt. Dabei werden kleinere Werte verstärkt und große abgeschwächt. &amp;lt;br&amp;gt;&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Formel               !! Parameter&lt;br /&gt;
|-&lt;br /&gt;
| &amp;lt;math&amp;gt;  W_\text{gk}^\text{k`} =  \frac{ N_\text{k} - Y_\text{gk}}{N_\text{k} \cdot Y_\text{gk}}  +  \frac{ N_\text{k`} - Y_\text{gk`}}{N_\text{k`} \cdot Y_\text{gk`}} &amp;lt;/math&amp;gt; || Y&amp;lt;sub&amp;gt;gk&amp;lt;/sub&amp;gt; = Beobachtete Anzahl an reads für Gen 'g' und Probe 'k' &amp;lt;br&amp;gt;&lt;br /&gt;
N&amp;lt;sub&amp;gt;k&amp;lt;/sub&amp;gt; = Gesamtanzahl an reads für Probe 'k' &amp;lt;br&amp;gt;&lt;br /&gt;
k' = 2. Probe (Referenz-Bedingung)&lt;br /&gt;
|}&lt;br /&gt;
'''2.''' Der Mittelwert aller Expressionsverhältnisse wird berechnet. &amp;lt;br&amp;gt;&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Formel               !! Parameter&lt;br /&gt;
|-&lt;br /&gt;
| &amp;lt;math&amp;gt; M_\text{gk}^\text{k`} = log_2  \dfrac { \dfrac {Y_\text{gk}}{N_\text{k}}}{ \dfrac {Y_\text{gk`}}{N_\text{k`}}}  &amp;lt;/math&amp;gt; || Y&amp;lt;sub&amp;gt;gk&amp;lt;/sub&amp;gt; = Beobachtete Anzahl an reads für Gen 'g' und Probe 'k' &amp;lt;br&amp;gt;&lt;br /&gt;
N&amp;lt;sub&amp;gt;k&amp;lt;/sub&amp;gt; = Gesamtanzahl an reads für Probe 'k' &amp;lt;br&amp;gt;&lt;br /&gt;
k' = 2. Probe (Referenz-Bedingung)&lt;br /&gt;
|}&lt;br /&gt;
'''3.''' Die gewichteten Mittelwerte aller Expressionsverhältnisse werden berechnet. Einsetzen der in 1. und 2. ermittelten Werte.&amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;div align=&amp;quot;center&amp;quot;&amp;gt; &amp;lt;math&amp;gt; TMM = 2^{log_2 (TMM_\text{k}^\text{k`})} &amp;lt;/math&amp;gt;&amp;lt;/div&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Formel               !! Parameter&lt;br /&gt;
|-&lt;br /&gt;
| &amp;lt;math&amp;gt; log_2 (TMM_\text{k}^\text{k`}) =  \frac{ \underset {g \in G}{\sum}   W_\text{gk}^\text{k´} \cdot M_\text{gk}^\text{k´}} { \sum_{g \in G} W_\text{gk}^\text{k´}} &amp;lt;/math&amp;gt; || &amp;lt;math&amp;gt; M_\text{gk}^\text{k`} = &amp;lt;/math&amp;gt; Mittelwerte aller Expressionsverhältnisse &amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;math&amp;gt;  W_\text{gk}^\text{k`} = &amp;lt;/math&amp;gt; Gewichtungsfaktor der Expressionsverhältnisse &amp;lt;br&amp;gt;&lt;br /&gt;
G = Set aller Gene&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
'''Bedingungen für dieses Verfahren:''' &amp;lt;br&amp;gt;&lt;br /&gt;
* Y&amp;lt;sub&amp;gt;gk&amp;lt;/sub&amp;gt; , Y&amp;lt;sub&amp;gt;gk'&amp;lt;/sub&amp;gt; &amp;gt; 0&lt;br /&gt;
* Die oberen und unteren 30 % der &amp;lt;math&amp;gt; M_\text{gk}^\text{k`} &amp;lt;/math&amp;gt; Werte werden nicht berücksichtigt&lt;br /&gt;
* Die 5 % am höchsten und niedrigsten exprimierten Gene werden nicht berücksichtigt&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=Glossar&amp;diff=159</id>
		<title>Glossar</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=Glossar&amp;diff=159"/>
		<updated>2019-06-06T12:59:40Z</updated>

		<summary type="html">&lt;p&gt;Vero: /* T */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== A ==&lt;br /&gt;
[[Alignment]]&amp;lt;br&amp;gt;&lt;br /&gt;
[[Algorithmus]]&amp;lt;br&amp;gt;&lt;br /&gt;
[[Assembly]] &lt;br /&gt;
== B ==&lt;br /&gt;
== C ==&lt;br /&gt;
[[Contig]]&amp;lt;br&amp;gt;&lt;br /&gt;
[[Coverage]]&lt;br /&gt;
== D ==&lt;br /&gt;
[[Dynamic programming]]&lt;br /&gt;
== E ==&lt;br /&gt;
== F ==&lt;br /&gt;
[[FASTA-Format]]&amp;lt;br&amp;gt;&lt;br /&gt;
[[FASTQ-Format]]&lt;br /&gt;
== G ==&lt;br /&gt;
[[gap penalty]]&lt;br /&gt;
== H ==&lt;br /&gt;
== I ==&lt;br /&gt;
[[Illumina]]&lt;br /&gt;
== J ==&lt;br /&gt;
== K ==&lt;br /&gt;
== L ==&lt;br /&gt;
[[Lander-Waterman-Modell]]&amp;lt;br&amp;gt;&lt;br /&gt;
[[Library]]&lt;br /&gt;
== M ==&lt;br /&gt;
[[Microarrays]]&lt;br /&gt;
== N ==&lt;br /&gt;
[[NGS]]&lt;br /&gt;
== O ==&lt;br /&gt;
== P ==&lt;br /&gt;
== Q ==&lt;br /&gt;
== R ==&lt;br /&gt;
[[reads]]&amp;lt;br&amp;gt;&lt;br /&gt;
[[RNASeq]] &amp;lt;br&amp;gt;&lt;br /&gt;
[[RPKM]]&lt;br /&gt;
&lt;br /&gt;
== S ==&lt;br /&gt;
[[Scaffold]]&amp;lt;br&amp;gt;&lt;br /&gt;
[[Smith-Waterman Algorithmus]]&lt;br /&gt;
== T ==&lt;br /&gt;
[[TMM]] &amp;lt;br&amp;gt;&lt;br /&gt;
[[TPM]] &amp;lt;br&amp;gt;&lt;br /&gt;
[[Transkriptom]]&lt;br /&gt;
&lt;br /&gt;
== U ==&lt;br /&gt;
== V ==&lt;br /&gt;
== W ==&lt;br /&gt;
== X ==&lt;br /&gt;
== Y ==&lt;br /&gt;
== Z ==&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=Glossar&amp;diff=158</id>
		<title>Glossar</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=Glossar&amp;diff=158"/>
		<updated>2019-06-06T12:58:47Z</updated>

		<summary type="html">&lt;p&gt;Vero: /* R */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== A ==&lt;br /&gt;
[[Alignment]]&amp;lt;br&amp;gt;&lt;br /&gt;
[[Algorithmus]]&amp;lt;br&amp;gt;&lt;br /&gt;
[[Assembly]] &lt;br /&gt;
== B ==&lt;br /&gt;
== C ==&lt;br /&gt;
[[Contig]]&amp;lt;br&amp;gt;&lt;br /&gt;
[[Coverage]]&lt;br /&gt;
== D ==&lt;br /&gt;
[[Dynamic programming]]&lt;br /&gt;
== E ==&lt;br /&gt;
== F ==&lt;br /&gt;
[[FASTA-Format]]&amp;lt;br&amp;gt;&lt;br /&gt;
[[FASTQ-Format]]&lt;br /&gt;
== G ==&lt;br /&gt;
[[gap penalty]]&lt;br /&gt;
== H ==&lt;br /&gt;
== I ==&lt;br /&gt;
[[Illumina]]&lt;br /&gt;
== J ==&lt;br /&gt;
== K ==&lt;br /&gt;
== L ==&lt;br /&gt;
[[Lander-Waterman-Modell]]&amp;lt;br&amp;gt;&lt;br /&gt;
[[Library]]&lt;br /&gt;
== M ==&lt;br /&gt;
[[Microarrays]]&lt;br /&gt;
== N ==&lt;br /&gt;
[[NGS]]&lt;br /&gt;
== O ==&lt;br /&gt;
== P ==&lt;br /&gt;
== Q ==&lt;br /&gt;
== R ==&lt;br /&gt;
[[reads]]&amp;lt;br&amp;gt;&lt;br /&gt;
[[RNASeq]] &amp;lt;br&amp;gt;&lt;br /&gt;
[[RPKM]]&lt;br /&gt;
&lt;br /&gt;
== S ==&lt;br /&gt;
[[Scaffold]]&amp;lt;br&amp;gt;&lt;br /&gt;
[[Smith-Waterman Algorithmus]]&lt;br /&gt;
== T ==&lt;br /&gt;
&lt;br /&gt;
[[Transkriptom]]&lt;br /&gt;
&lt;br /&gt;
== U ==&lt;br /&gt;
== V ==&lt;br /&gt;
== W ==&lt;br /&gt;
== X ==&lt;br /&gt;
== Y ==&lt;br /&gt;
== Z ==&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=6.Normalisierungen&amp;diff=157</id>
		<title>6.Normalisierungen</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=6.Normalisierungen&amp;diff=157"/>
		<updated>2019-06-06T12:51:13Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;==Aufgabe 1: Grundlagen== &lt;br /&gt;
===a.  Warum ist es notwendig RNASeq Daten zu normalisieren?=== &lt;br /&gt;
Die Normalisierung von RNASeq Daten ist notwendig, um die Genexpression quantifizieren zu können und diese von verschiedenen Genen miteinander vergleichen zu können. Da die erhaltenen Daten meist sehr unterschiedlich sind, aufgrund verschiedener Genlängen und Sequenziertiefen etc., müssen diese erst durch die Normalisierungen aneinander angeglichen werden, um einen aussagekräftigen Vergleich möglich zu machen. &amp;lt;br&amp;gt;&lt;br /&gt;
===b. Rolle der Sequenziertiefe und Genlänge===&lt;br /&gt;
Die Sequenziertiefen und Genlängen müssen normalisiert werden, um die erhaltenen RNASeq Daten miteinander vergleichen zu können, da diese oft sehr unterschiedlich sind und das die Auswertung beeinflussen kann. So erhält man für längere Gene möglicherweise mehr reads, als für kürzere Gene, obwohl die Genexpression gleich ist, würde man da fälschlicherweise annehmen, dass das längere Gen stärker exprimiert wird. Bei einer hohen Sequenziertiefe erhält man mehr reads, als bei einer niedrigen Sequenziertiefe, dabei muss das Verhältnis der erhaltenen reads für ein Gen, zu der Gesamtzahl an reads einer Sequenzierung beachtet werden, dies ist durch Normalisierungen möglich.&lt;br /&gt;
==Aufgabe 2: RPKM und TPM==&lt;br /&gt;
{| class=&amp;quot;wikitable center&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Gen &amp;amp; Genlänge (L) !! Counts (c) Replikat 1 !! Counts (c) Replikat 2&lt;br /&gt;
|-&lt;br /&gt;
| A (7 kb) || 5 || 16&lt;br /&gt;
|-&lt;br /&gt;
| B (12 kb) || 10 || 36&lt;br /&gt;
|-&lt;br /&gt;
| C (0,5 kb) || 2 || 8&lt;br /&gt;
|-&lt;br /&gt;
| D (25 kb) || 1 || 0&lt;br /&gt;
|}&lt;br /&gt;
===a. Normalisierung mit RPKM===&lt;br /&gt;
* RPKM steht für 'Reads per kilobase of transcript per Million mapped reads' &lt;br /&gt;
* Für die Normalisierung wird die Formel &amp;lt;math&amp;gt; RPKM =  \frac{ c_\text{i}}{L_\text{i} \cdot N} &amp;lt;/math&amp;gt; verwendet.&lt;br /&gt;
'''Parameter:''' &amp;lt;br&amp;gt;&lt;br /&gt;
c&amp;lt;sub&amp;gt;i&amp;lt;/sub&amp;gt; = Anzahl an ausrichtbaren reads für ein Transkript 'i'&amp;lt;br&amp;gt;&lt;br /&gt;
L&amp;lt;sub&amp;gt;i&amp;lt;/sub&amp;gt; = Länge des Transkripts/Gens 'i' in kbp &amp;lt;br&amp;gt;&lt;br /&gt;
N = Gesamtanzahl an ausrichtbaren reads in Millionen&lt;br /&gt;
&lt;br /&gt;
  &amp;lt;math&amp;gt;   \frac{ c_\text{i}}{L_\text{i}} &amp;lt;/math&amp;gt;  → Normalisierung der Genlänge &amp;lt;br&amp;gt;&lt;br /&gt;
  &amp;lt;math&amp;gt; L_\text{i} \cdot N &amp;lt;/math&amp;gt; → Normalisierung der Sequenziertiefe &amp;lt;br&amp;gt;&lt;br /&gt;
'''In dieser Aufgabe:'''&amp;lt;br&amp;gt;&lt;br /&gt;
c = siehe Tabelle &amp;lt;br&amp;gt;&lt;br /&gt;
L = siehe Tabelle &amp;lt;br&amp;gt;&lt;br /&gt;
N (Replikat 1) = 18 | N (Replikat 2) = 60 &amp;lt;br&amp;gt;&lt;br /&gt;
'''Beispiel Gen A, Replikat 1:''' &amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;math&amp;gt; RPKM (A1) =  \frac{ 5}{7 kb \cdot 18} = 0,0397 &amp;lt;/math&amp;gt;&lt;br /&gt;
{| class=&amp;quot;wikitable center&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Gen !! RPKM Replikat 1 !! RPKM Replikat 2&lt;br /&gt;
|-&lt;br /&gt;
| A || 0,0397 || 0,0381&lt;br /&gt;
|-&lt;br /&gt;
| B || 0,0463 || 0,05&lt;br /&gt;
|-&lt;br /&gt;
| C || 0,2222 || 0,2667&lt;br /&gt;
|-&lt;br /&gt;
| D || 0,0022 || 0&lt;br /&gt;
|}&lt;br /&gt;
* Ein hoher RPKM Wert, sagt aus, dass die Genexpression stärker ist, als bei einem niedrigeren RPKM Wert.&lt;br /&gt;
* Zum Vergleich der Genexpression innerhalb einer Probe, können die RPKM Werte gut genutzt werden, sie sind jedoch nicht dafür geeignet Genexpressionen von Genen verschiedener Proben miteinander zu vergleichen, da die Bedingungen meist sehr unterschiedlich sind und falsche Aussagen über die Genexpressionen gemacht werden können. &lt;br /&gt;
===b. Normalisierung mit TPM===&lt;br /&gt;
* TPM steht für 'Transcripts per Million. &lt;br /&gt;
* Wenn 1 Millionen Transkripte sequenziert werden würden, wäre TPMi die Anzahl an Transkripten des Typs 'i'.&lt;br /&gt;
* Im gegensatz zu RPKM wird L in Basenpaaren, statt in Kilobasenpaaren, angegeben. &amp;lt;br&amp;gt;&lt;br /&gt;
* Anders, als bei der Normalisierung mit RPKM wird erst die Genlänge und dann die Sequenziertiefe normalisiert. &lt;br /&gt;
* Für die Normalisierung wird die Formel &amp;lt;math&amp;gt;  TPM =  \frac{ c_\text{i}}{L_\text{i}}  \cdot  \dfrac {1}{\sum_\text{n} \dfrac {c_\text{n}}{L_\text{n}}}  \cdot 10^6 &amp;lt;/math&amp;gt; verwendet.&lt;br /&gt;
'''Parameter:''' &amp;lt;br&amp;gt;&lt;br /&gt;
c&amp;lt;sub&amp;gt;i&amp;lt;/sub&amp;gt; = Anzahl an ausrichtbaren reads für ein Transkript 'i'&amp;lt;br&amp;gt;&lt;br /&gt;
L&amp;lt;sub&amp;gt;i&amp;lt;/sub&amp;gt; = Länge des Transkripts/Gens 'i' in kbp &amp;lt;br&amp;gt;&lt;br /&gt;
N = Gesamtanzahl an ausrichtbaren reads in Millionen &amp;lt;br&amp;gt;&lt;br /&gt;
'''Beispiel Gen A, Replikat 1:''' &amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;math&amp;gt;  TPM (A1) =  \frac{ 5}{7000}  \cdot  \dfrac {1}{ \dfrac {5}{7000} +  \dfrac {10}{12000} +  \dfrac {2}{500} + \dfrac {1}{25000}}  \cdot 10^6  = 127834 &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
{| class=&amp;quot;wikitable center&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Gen !! TPM Replikat 1 !! TPM Replikat 2&lt;br /&gt;
|-&lt;br /&gt;
| A || 127834 || 107383&lt;br /&gt;
|-&lt;br /&gt;
| B || 149139 || 140940&lt;br /&gt;
|-&lt;br /&gt;
| C || 715868 || 751678&lt;br /&gt;
|-&lt;br /&gt;
| D || 7159 || 0&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
===c. Anwendungsbereich===&lt;br /&gt;
RPKM und TPM werden genutzt um die Expression verschiedener Gene, aus der gleichen Probe, einer RNA Sequenzierung miteinander zu vergleichen.&lt;br /&gt;
==Aufgabe 3: Normalisierung zwischen Proben==&lt;br /&gt;
==a. Normalisierungsmethode==&lt;br /&gt;
Für die Normalisierung zwischen Proben wird TMM eingesetzt. TMM steht für 'Trimmed mean of M – Values normalization method'.&lt;br /&gt;
==b. Wieso wird die Normalisierung bei RNASeq-Proben angewendet?==&lt;br /&gt;
TMM wird für die Normalisierung von RNASeq-Daten angewendet, um die Expression eines Gens unter verschiedenen Bedingungen zu vergleichen, z.B. ob es in Krebszellen stärker, oder schwächer exprimiert wird, als in gesunden Zellen.&lt;br /&gt;
==c. Normalisierung mit TMM==&lt;br /&gt;
'''1.''' Der Gewichtungsfaktor für das Expressionsverhältnis für Gen 'g' zwischen Probe 'k' ' und 'k' wird bestimmt. Dabei werden kleinere Werte verstärkt und große abgeschwächt. &amp;lt;br&amp;gt;&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Formel               !! Parameter&lt;br /&gt;
|-&lt;br /&gt;
| &amp;lt;math&amp;gt;  W_\text{gk}^\text{k`} =  \frac{ N_\text{k} - Y_\text{gk}}{N_\text{k} \cdot Y_\text{gk}}  +  \frac{ N_\text{k`} - Y_\text{gk`}}{N_\text{k`} \cdot Y_\text{gk`}} &amp;lt;/math&amp;gt; || Y&amp;lt;sub&amp;gt;gk&amp;lt;/sub&amp;gt; = Beobachtete Anzahl an reads für Gen 'g' und Probe 'k' &amp;lt;br&amp;gt;&lt;br /&gt;
N&amp;lt;sub&amp;gt;k&amp;lt;/sub&amp;gt; = Gesamtanzahl an reads für Probe 'k' &amp;lt;br&amp;gt;&lt;br /&gt;
k' = 2. Probe (Referenz-Bedingung)&lt;br /&gt;
|}&lt;br /&gt;
'''2.''' Der Mittelwert aller Expressionsverhältnisse wird berechnet. &amp;lt;br&amp;gt;&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Formel               !! Parameter&lt;br /&gt;
|-&lt;br /&gt;
| &amp;lt;math&amp;gt; M_\text{gk}^\text{k`} = log_2  \dfrac { \dfrac {Y_\text{gk}}{N_\text{k}}}{ \dfrac {Y_\text{gk`}}{N_\text{k`}}}  &amp;lt;/math&amp;gt; || Y&amp;lt;sub&amp;gt;gk&amp;lt;/sub&amp;gt; = Beobachtete Anzahl an reads für Gen 'g' und Probe 'k' &amp;lt;br&amp;gt;&lt;br /&gt;
N&amp;lt;sub&amp;gt;k&amp;lt;/sub&amp;gt; = Gesamtanzahl an reads für Probe 'k' &amp;lt;br&amp;gt;&lt;br /&gt;
k' = 2. Probe (Referenz-Bedingung)&lt;br /&gt;
|}&lt;br /&gt;
'''3.''' Die gewichteten Mittelwerte aller Expressionsverhältnisse werden berechnet. Einsetzen der in 1. und 2. ermittelten Werte.&amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;div align=&amp;quot;center&amp;quot;&amp;gt; &amp;lt;math&amp;gt; TMM = 2^{log_2 (TMM_\text{k}^\text{k`})} &amp;lt;/math&amp;gt;&amp;lt;/div&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Formel               !! Parameter&lt;br /&gt;
|-&lt;br /&gt;
| &amp;lt;math&amp;gt; log_2 (TMM_\text{k}^\text{k`}) =  \frac{ \underset {g \in G}{\sum}   W_\text{gk}^\text{k´} \cdot M_\text{gk}^\text{k´}} { \sum_{g \in G} W_\text{gk}^\text{k´}} &amp;lt;/math&amp;gt; || &amp;lt;math&amp;gt; M_\text{gk}^\text{k`} = &amp;lt;/math&amp;gt; Mittelwerte aller Expressionsverhältnisse &amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;math&amp;gt;  W_\text{gk}^\text{k`} = &amp;lt;/math&amp;gt; Gewichtungsfaktor der Expressionsverhältnisse &amp;lt;br&amp;gt;&lt;br /&gt;
G = Set aller Gene&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
'''Bedingungen für dieses Verfahren:''' &amp;lt;br&amp;gt;&lt;br /&gt;
* Y&amp;lt;sub&amp;gt;gk&amp;lt;/sub&amp;gt; , Y&amp;lt;sub&amp;gt;gk'&amp;lt;/sub&amp;gt; &amp;gt; 0&lt;br /&gt;
* Die oberen und unteren 30 % der &amp;lt;math&amp;gt; M_\text{gk}^\text{k`} &amp;lt;/math&amp;gt; Werte werden nicht berücksichtigt&lt;br /&gt;
* Die 5 % am höchsten und niedrigsten exprimierten Gene werden nicht berücksichtigt&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=6.Normalisierungen&amp;diff=151</id>
		<title>6.Normalisierungen</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=6.Normalisierungen&amp;diff=151"/>
		<updated>2019-06-05T11:29:02Z</updated>

		<summary type="html">&lt;p&gt;Vero: Created page with &amp;quot;==Aufgabe 1: Grundlagen==  ===a.  Warum ist es notwendig RNASeq Daten zu normalisieren?===  Die Normalisierung von RNASeq Daten ist notwendig, um die Genexpression quantifizie...&amp;quot;&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;==Aufgabe 1: Grundlagen== &lt;br /&gt;
===a.  Warum ist es notwendig RNASeq Daten zu normalisieren?=== &lt;br /&gt;
Die Normalisierung von RNASeq Daten ist notwendig, um die Genexpression quantifizieren zu können und diese von verschiedenen Genen miteinander vergleichen zu können. Da die erhaltenen Daten meist sehr unterschiedlich sind, aufgrund verschiedener Genlängen und Sequenziertiefen etc., müssen diese erst durch die Normalisierungen aneinander angeglichen werden, um einen aussagekräftigen Vergleich möglich zu machen. &amp;lt;br&amp;gt;&lt;br /&gt;
===b. Rolle der Sequenziertiefe und Genlänge===&lt;br /&gt;
Die Sequenziertiefen und Genlängen müssen normalisiert werden, um die erhaltenen RNASeq Daten miteinander vergleichen zu können, da diese oft sehr unterschiedlich sind und das die Auswertung beeinflussen kann. So erhält man für längere Gene möglicherweise mehr reads, als für kürzere Gene, obwohl die Genexpression gleich ist, würde man da fälschlicherweise annehmen, dass das längere Gen stärker exprimiert wird. Bei einer hohen Sequenziertiefe erhält man mehr reads, als bei einer niedrigen Sequenziertiefe, dabei muss das Verhältnis der erhaltenen reads für ein Gen, zu der Gesamtzahl an reads einer Sequenzierung beachtet werden, dies ist durch Normalisierungen möglich.&lt;br /&gt;
==Aufgabe 2: RPKM und TPM==&lt;br /&gt;
{| class=&amp;quot;wikitable center&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Gen &amp;amp; Genlänge (L) !! Counts (c) Replikat 1 !! Counts (c) Replikat 2&lt;br /&gt;
|-&lt;br /&gt;
| A (7 kb) || 5 || 16&lt;br /&gt;
|-&lt;br /&gt;
| B (12 kb) || 10 || 36&lt;br /&gt;
|-&lt;br /&gt;
| C (0,5 kb) || 2 || 8&lt;br /&gt;
|-&lt;br /&gt;
| D (25 kb) || 1 || 0&lt;br /&gt;
|}&lt;br /&gt;
===a. Normalisierung mit RPKM===&lt;br /&gt;
* RPKM steht für 'Reads per kilobase of transcript per Million mapped reads' &lt;br /&gt;
* Für die Normalisierung wird die Formel &amp;lt;math&amp;gt; RPKM =  \frac{ c_\text{i}}{L_\text{i} \cdot N} &amp;lt;/math&amp;gt; verwendet.&lt;br /&gt;
'''Parameter:''' &amp;lt;br&amp;gt;&lt;br /&gt;
c&amp;lt;sub&amp;gt;i&amp;lt;/sub&amp;gt; = Anzahl an ausrichtbaren reads für ein Transkript 'i'&amp;lt;br&amp;gt;&lt;br /&gt;
L&amp;lt;sub&amp;gt;i&amp;lt;/sub&amp;gt; = Länge des Transkripts/Gens 'i' in kbp &amp;lt;br&amp;gt;&lt;br /&gt;
N = Gesamtanzahl an ausrichtbaren reads in Millionen&lt;br /&gt;
&lt;br /&gt;
  &amp;lt;math&amp;gt;   \frac{ c_\text{i}}{L_\text{i}} &amp;lt;/math&amp;gt;  → Normalisierung der Genlänge &amp;lt;br&amp;gt;&lt;br /&gt;
  &amp;lt;math&amp;gt; L_\text{i} \cdot N &amp;lt;/math&amp;gt; → Normalisierung der Sequenziertiefe &amp;lt;br&amp;gt;&lt;br /&gt;
'''In dieser Aufgabe:'''&amp;lt;br&amp;gt;&lt;br /&gt;
c = siehe Tabelle &amp;lt;br&amp;gt;&lt;br /&gt;
L = siehe Tabelle &amp;lt;br&amp;gt;&lt;br /&gt;
N (Replikat 1) = 18 | N (Replikat 2) = 60&lt;br /&gt;
===b. Normalisierung mit TPM===&lt;br /&gt;
===c Anwendungsbereich===&lt;br /&gt;
==Aufgabe 3: Normalisierung zwischen Proben==&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=6_Normalisierungen&amp;diff=149</id>
		<title>6 Normalisierungen</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=6_Normalisierungen&amp;diff=149"/>
		<updated>2019-06-03T21:25:17Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Auf dieser Seite sind die Themen zusammengeführt, die in Vorlesung 5 am 16.05.2019 behandelt wurden.&lt;br /&gt;
&lt;br /&gt;
=Normalisierungen=&lt;br /&gt;
Normalisierungen der RNASeq-Daten sind notwendig, um diese vergleichbar machen zu können und die tatsächliche Genexpression quantifizieren zu können. &lt;br /&gt;
==RPKM==&lt;br /&gt;
RPKM steht für 'Reads per kilobase of transcript per Million mapped reads' und ist eine Normalisierungsmethode für Expressionsstärken. &amp;lt;br&amp;gt;&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Formel               !! Parameter&lt;br /&gt;
|-&lt;br /&gt;
| &amp;lt;math&amp;gt; RPKM =  \frac{ c_\text{i}}{L_\text{i} \cdot N} &amp;lt;/math&amp;gt; || c&amp;lt;sub&amp;gt;i&amp;lt;/sub&amp;gt; = Anzahl an ausrichtbaren reads für ein Transkript 'i'&amp;lt;br&amp;gt;&lt;br /&gt;
L&amp;lt;sub&amp;gt;i&amp;lt;/sub&amp;gt; = Länge des Transkripts/Gens 'i' in kbp &amp;lt;br&amp;gt;&lt;br /&gt;
N = Gesamtanzahl an ausrichtbaren reads in Millionen&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
  &amp;lt;math&amp;gt;   \frac{ c_\text{i}}{L_\text{i}} &amp;lt;/math&amp;gt;  → Normalisierung der Genlänge &amp;lt;br&amp;gt;&lt;br /&gt;
  &amp;lt;math&amp;gt; L_\text{i} \cdot N &amp;lt;/math&amp;gt; → Normalisierung der Sequenziertiefe &amp;lt;br&amp;gt;&lt;br /&gt;
Je höher der RPKM-Wert ist, desto höher ist die Genexpression. &amp;lt;br&amp;gt;&lt;br /&gt;
RPKM-Werte können gut zum Vergleich der Genexpressionen innerhalb einer Probe genutzt werden, jedoch sind sie nicht dafür geeignet mehrere Experimente bzw. Proben miteinander zu vergleichen.&lt;br /&gt;
&lt;br /&gt;
'''Beispiel:'''&lt;br /&gt;
&lt;br /&gt;
[[File:Beispiel Probe.png|Beispiel Probe]] &amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
* &amp;lt;math&amp;gt; RPKM (A) =  \frac{12}{0,6 kbp \cdot 6 \cdot 10^6} = 3,33 \cdot 10^{-6}  &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
* &amp;lt;math&amp;gt; RPKM (B) =  \frac{24}{1,1 kbp \cdot 6 \cdot 10^6} = 3,64  \cdot 10^{-6} &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
* &amp;lt;math&amp;gt; RPKM (C) =  \frac{12}{1,4 kbp \cdot 6 \cdot 10^6} = 1,43  \cdot 10^{-6} &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Durch die Normalisierung der Expressionsstärken können diese nun miteinander vergleichen werden.In diesem Beispiel wird Gen B am stärksten exprimiert und Gen C am schwächsten.&lt;br /&gt;
&lt;br /&gt;
==TPM==&lt;br /&gt;
TPM steht für 'Transcripts per Million' und ist eine Normalisierungsmethode für Expressionsstärken. &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Formel               !! Parameter&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;math&amp;gt;  TPM =  \frac{ c_\text{i}}{L_\text{i}}  \cdot  \dfrac {1}{\sum_\text{n} \dfrac {c_\text{n}}{L_\text{n}}}  \cdot 10^6 &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt; || c&amp;lt;sub&amp;gt;i&amp;lt;/sub&amp;gt; = Anzahl an ausrichtbaren reads für ein Transkript 'i'&amp;lt;br&amp;gt;&lt;br /&gt;
L&amp;lt;sub&amp;gt;i&amp;lt;/sub&amp;gt; = Länge des Transkripts/Gens 'i' in bp &amp;lt;br&amp;gt;&lt;br /&gt;
N = Gesamtanzahl an ausrichtbaren reads in Millionen&lt;br /&gt;
|} &amp;lt;br&amp;gt;&lt;br /&gt;
Wenn 1 Millionen Transkripte sequenziert würden, wäre TPM&amp;lt;sub&amp;gt;i&amp;lt;/sub&amp;gt; die Anzahl an Transkripten des Types 'i'. &amp;lt;br&amp;gt;&lt;br /&gt;
'''Beispiel:''' &amp;lt;br&amp;gt;&lt;br /&gt;
[[File:Beispiel Probe.png|Beispiel Probe]] &amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
*&amp;lt;math&amp;gt;  TPM (A) =  \frac{ 12}{600}  \cdot  \dfrac {1}{ \dfrac {12}{600} +  \dfrac {24}{1100} + \dfrac {11}{1400}}  \cdot 10^6  = 402614 &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
*&amp;lt;math&amp;gt;  TPM (B) =  \frac{ 24}{1100}  \cdot  \dfrac {1}{ \dfrac {12}{600} +  \dfrac {24}{1100} + \dfrac {11}{1400}}  \cdot 10^6  = 439216 &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
*&amp;lt;math&amp;gt;  TPM (C) =  \frac{ 11}{11400}  \cdot  \dfrac {1}{ \dfrac {12}{600} +  \dfrac {24}{1100} + \dfrac {11}{1400}}  \cdot 10^6  = 158170 &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
Nach der Normalisierung ist ein Vergleich der Genexpressionen möglich. Das Ergebnis gibt an, wie viele Transkripte der Gene entstehen würden, wenn 1 Millionen Transkripte sequenziert werden würden. So würde man z.B. für Gen B 429216 Transkripte erhalten und für Gen C 158170 Transkripte, somit wird Gen B stärker exprimiert, als Gen C.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
==TMM==&lt;br /&gt;
TMM steht für 'Trimmed mean of M-values normalization method'.&amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''Probleme von RPKM und TPM:''' &amp;lt;br&amp;gt;&lt;br /&gt;
# Sie sind nur gut geeignet, um Expressionswerte bzw. Expressionslevel innerhalb einer Probe zu vergleichen. &amp;lt;br&amp;gt;&lt;br /&gt;
# Von sehr heterologen Expressionsprofilen zwischen zwei Proben können identische Genexpressionen fälschlicherweise als unterschiedlich erkannt werden.&amp;lt;br&amp;gt;&lt;br /&gt;
'''Lösung:''' &amp;lt;br&amp;gt;&lt;br /&gt;
→ TMM als Normalisierungsmethode zwischen Proben &amp;lt;br&amp;gt;&lt;br /&gt;
*Gesamtexpressionsstärke pro Probe wird bestimmt, um einzelne Genexpressionen zu bestimmen. &amp;lt;br&amp;gt;&lt;br /&gt;
*Das Expressionsverhältnis zwischen zwei Bedingungen für ein Gen 'g' wird bestimmt.&lt;br /&gt;
*Genexpressionen von zwei Proben mit unterschiedlichen Bedingungen (z.B. krank und gesund) können miteinander verglichen werden.&amp;lt;br&amp;gt;&lt;br /&gt;
'''1.''' Bestimmung des '''Gewichtungsfaktors''' für das Expressionsverhältnis für Gen 'g' zwischen Probe 'k' ' und 'k'. Dabei werden kleinere Werte verstärkt und große abgeschwächt. &amp;lt;br&amp;gt;&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Formel               !! Parameter&lt;br /&gt;
|-&lt;br /&gt;
| &amp;lt;math&amp;gt;  W_\text{gk}^\text{k`} =  \frac{ N_\text{k} - Y_\text{gk}}{N_\text{k} \cdot Y_\text{gk}}  +  \frac{ N_\text{k`} - Y_\text{gk`}}{N_\text{k`} \cdot Y_\text{gk`}} &amp;lt;/math&amp;gt; || Y&amp;lt;sub&amp;gt;gk&amp;lt;/sub&amp;gt; = Beobachtete Anzahl an reads für Gen 'g' und Probe 'k' &amp;lt;br&amp;gt;&lt;br /&gt;
N&amp;lt;sub&amp;gt;k&amp;lt;/sub&amp;gt; = Gesamtanzahl an reads für Probe 'k' &amp;lt;br&amp;gt;&lt;br /&gt;
k' = 2. Probe (Referenz-Bedingung)&lt;br /&gt;
|}&lt;br /&gt;
'''2. Mittelwert aller Expressionsverhältnisse'''  wird berechnet. &amp;lt;br&amp;gt;&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Formel               !! Parameter&lt;br /&gt;
|-&lt;br /&gt;
| &amp;lt;math&amp;gt; M_\text{gk}^\text{k`} = log_2  \dfrac { \dfrac {Y_\text{gk}}{N_\text{k}}}{ \dfrac {Y_\text{gk`}}{N_\text{k`}}}  &amp;lt;/math&amp;gt; || Y&amp;lt;sub&amp;gt;gk&amp;lt;/sub&amp;gt; = Beobachtete Anzahl an reads für Gen 'g' und Probe 'k' &amp;lt;br&amp;gt;&lt;br /&gt;
N&amp;lt;sub&amp;gt;k&amp;lt;/sub&amp;gt; = Gesamtanzahl an reads für Probe 'k' &amp;lt;br&amp;gt;&lt;br /&gt;
k' = 2. Probe (Referenz-Bedingung)&lt;br /&gt;
|}&lt;br /&gt;
'''3. Gewichtete Mittelwerte aller Expressionsverhältnisse''' können berechnet werden. Einsetzen der in 1. und 2. ermittelten Werte.&amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;div align=&amp;quot;center&amp;quot;&amp;gt; &amp;lt;math&amp;gt; TMM = 2^{log_2 (TMM_\text{k}^\text{k`})} &amp;lt;/math&amp;gt;&amp;lt;/div&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Formel               !! Parameter&lt;br /&gt;
|-&lt;br /&gt;
| &amp;lt;math&amp;gt; log_2 (TMM_\text{k}^\text{k`}) =  \frac{ \underset {g \in G}{\sum}   W_\text{gk}^\text{k´} \cdot M_\text{gk}^\text{k´}} { \sum_{g \in G} W_\text{gk}^\text{k´}} &amp;lt;/math&amp;gt; || &amp;lt;math&amp;gt; M_\text{gk}^\text{k`} = &amp;lt;/math&amp;gt; Mittelwerte aller Expressionsverhältnisse &amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;math&amp;gt;  W_\text{gk}^\text{k`} = &amp;lt;/math&amp;gt; Gewichtungsfaktor der Expressionsverhältnisse &amp;lt;br&amp;gt;&lt;br /&gt;
G = Set aller Gene&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
'''Bedingungen für dieses Verfahren:''' &amp;lt;br&amp;gt;&lt;br /&gt;
* Y&amp;lt;sub&amp;gt;gk&amp;lt;/sub&amp;gt; , Y&amp;lt;sub&amp;gt;gk'&amp;lt;/sub&amp;gt; &amp;gt; 0&lt;br /&gt;
* Die oberen und unteren 30 % der &amp;lt;math&amp;gt; M_\text{gk}^\text{k`} &amp;lt;/math&amp;gt; Werte werden nicht berücksichtigt&lt;br /&gt;
* Die 5 % am höchsten und niedrigsten exprimierten Gene werden nicht berücksichtigt&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=6_Normalisierungen&amp;diff=148</id>
		<title>6 Normalisierungen</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=6_Normalisierungen&amp;diff=148"/>
		<updated>2019-06-03T20:29:16Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Auf dieser Seite sind die Themen zusammengeführt, die in Vorlesung 5 am 16.05.2019 behandelt wurden.&lt;br /&gt;
&lt;br /&gt;
=Normalisierungen=&lt;br /&gt;
Normalisierungen der RNASeq-Daten sind notwendig, um diese vergleichbar machen zu können und die tatsächliche Genexpression quantifizieren zu können. &lt;br /&gt;
==RPKM==&lt;br /&gt;
RPKM steht für 'Reads per kilobase of transcript per Million mapped reads' und ist eine Normalisierungsmethode für Expressionsstärken. &amp;lt;br&amp;gt;&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Formel               !! Parameter&lt;br /&gt;
|-&lt;br /&gt;
| &amp;lt;math&amp;gt; RPKM =  \frac{ c_\text{i}}{L_\text{i} \cdot N} &amp;lt;/math&amp;gt; || c&amp;lt;sub&amp;gt;i&amp;lt;/sub&amp;gt; = Anzahl an ausrichtbaren reads für ein Transkript 'i'&amp;lt;br&amp;gt;&lt;br /&gt;
L&amp;lt;sub&amp;gt;i&amp;lt;/sub&amp;gt; = Länge des Transkripts/Gens 'i' in kbp &amp;lt;br&amp;gt;&lt;br /&gt;
N = Gesamtanzahl an ausrichtbaren reads in Millionen&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
  &amp;lt;math&amp;gt;   \frac{ c_\text{i}}{L_\text{i}} &amp;lt;/math&amp;gt;  → Normalisierung der Genlänge &amp;lt;br&amp;gt;&lt;br /&gt;
  &amp;lt;math&amp;gt; L_\text{i} \cdot N &amp;lt;/math&amp;gt; → Normalisierung der Sequenziertiefe &amp;lt;br&amp;gt;&lt;br /&gt;
Je höher der RPKM-Wert ist, desto höher ist die Genexpression. &amp;lt;br&amp;gt;&lt;br /&gt;
RPKM-Werte können gut zum Vergleich der Genexpressionen innerhalb einer Probe genutzt werden, jedoch sind sie nicht dafür geeignet mehrere Experimente bzw. Proben miteinander zu vergleichen.&lt;br /&gt;
&lt;br /&gt;
'''Beispiel:'''&lt;br /&gt;
&lt;br /&gt;
[[File:Beispiel Probe.png|Beispiel Probe]] &amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
* &amp;lt;math&amp;gt; RPKM (A) =  \frac{12}{0,6 kbp \cdot 6 \cdot 10^6} = 3,33 \cdot 10^{-6}  &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
* &amp;lt;math&amp;gt; RPKM (B) =  \frac{24}{1,1 kbp \cdot 6 \cdot 10^6} = 3,64  \cdot 10^{-6} &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
* &amp;lt;math&amp;gt; RPKM (C) =  \frac{12}{1,4 kbp \cdot 6 \cdot 10^6} = 1,43  \cdot 10^{-6} &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Durch die Normalisierung der Expressionsstärken können diese nun miteinander vergleichen werden.In diesem Beispiel wird Gen B am stärksten exprimiert und Gen C am schwächsten.&lt;br /&gt;
&lt;br /&gt;
==TPM==&lt;br /&gt;
TPM steht für 'Transcripts per Million' und ist eine Normalisierungsmethode für Expressionsstärken. &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Formel               !! Parameter&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;math&amp;gt;  TPM =  \frac{ c_\text{i}}{L_\text{i}}  \cdot  \dfrac {1}{\sum_\text{n} \dfrac {c_\text{n}}{L_\text{n}}}  \cdot 10^6 &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt; || c&amp;lt;sub&amp;gt;i&amp;lt;/sub&amp;gt; = Anzahl an ausrichtbaren reads für ein Transkript 'i'&amp;lt;br&amp;gt;&lt;br /&gt;
L&amp;lt;sub&amp;gt;i&amp;lt;/sub&amp;gt; = Länge des Transkripts/Gens 'i' in bp &amp;lt;br&amp;gt;&lt;br /&gt;
N = Gesamtanzahl an ausrichtbaren reads in Millionen&lt;br /&gt;
|} &amp;lt;br&amp;gt;&lt;br /&gt;
Wenn 1 Millionen Transkripte sequenziert würden, wäre TPM&amp;lt;sub&amp;gt;i&amp;lt;/sub&amp;gt; die Anzahl an Transkripten des Types 'i'. &amp;lt;br&amp;gt;&lt;br /&gt;
'''Beispiel:''' &amp;lt;br&amp;gt;&lt;br /&gt;
[[File:Beispiel Probe.png|Beispiel Probe]] &amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
*&amp;lt;math&amp;gt;  TPM (A) =  \frac{ 12}{600}  \cdot  \dfrac {1}{ \dfrac {12}{600} +  \dfrac {24}{1100} + \dfrac {11}{1400}}  \cdot 10^6  = 402614 &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
*&amp;lt;math&amp;gt;  TPM (B) =  \frac{ 24}{1100}  \cdot  \dfrac {1}{ \dfrac {12}{600} +  \dfrac {24}{1100} + \dfrac {11}{1400}}  \cdot 10^6  = 439216 &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
*&amp;lt;math&amp;gt;  TPM (C) =  \frac{ 11}{11400}  \cdot  \dfrac {1}{ \dfrac {12}{600} +  \dfrac {24}{1100} + \dfrac {11}{1400}}  \cdot 10^6  = 158170 &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
Nach der Normalisierung ist ein Vergleich der Genexpressionen möglich. Das Ergebnis gibt an, wie viele Transkripte der Gene entstehen würden, wenn 1 Millionen Transkripte sequenziert werden würden. So würde man z.B. für Gen B 429216 Transkripte erhalten und für Gen C 158170 Transkripte, somit wird Gen B stärker exprimiert, als Gen C.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
==TMM==&lt;br /&gt;
TMM steht für 'Trimmed mean of M-values normalization method'.&amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''Probleme von RPKM und TPM:''' &amp;lt;br&amp;gt;&lt;br /&gt;
# Sie sind nur gut geeignet, um Expressionswerte bzw. Expressionslevel innerhalb einer Probe zu vergleichen. &amp;lt;br&amp;gt;&lt;br /&gt;
# Von sehr heterologen Expressionsprofilen zwischen zwei Proben können identische Genexpressionen fälschlicherweise als unterschiedlich erkannt werden.&amp;lt;br&amp;gt;&lt;br /&gt;
'''Lösung:''' &amp;lt;br&amp;gt;&lt;br /&gt;
→ TMM als Normalisierungsmethode zwischen Proben &amp;lt;br&amp;gt;&lt;br /&gt;
*Gesamtexpressionsstärke pro Probe wird bestimmt, um einzelne Genexpressionen zu bestimmen. &amp;lt;br&amp;gt;&lt;br /&gt;
*Das Expressionsverhältnis zwischen zwei Bedingungen für ein Gen 'g' wird bestimmt.&lt;br /&gt;
*Genexpressionen von zwei Proben können miteinander verglichen werden.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt; M_\text{gk}^\text{k`} = log_2  \dfrac { \dfrac {Y_\text{gk}}{N_\text{k}}}{ \dfrac {Y_\text{gk`}}{N_\text{k`}}}  &amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt; log_2 (TMM_\text{k}^\text{k`}) =  \frac{ \underset {g \in G}{\sum}   W_\text{gk}^\text{k´} \cdot M_\text{gk}^\text{k´}} { \sum_{g \in G} W_\text{gk}^\text{k´}} &amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt;  W_\text{gk}^\text{k`} =  \frac{ N_\text{k} - Y_\text{gk}}{N_\text{k} \cdot Y_\text{gk}}  +  \frac{ N_\text{k`} - Y_\text{gk`}}{N_\text{k`} \cdot Y_\text{gk`}} &amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
'''Der Spaß hier wird morgen erweitert, hab mich nur mit den Formeln vertraut gemacht :D ''' _ Vero&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=6_Normalisierungen&amp;diff=147</id>
		<title>6 Normalisierungen</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=6_Normalisierungen&amp;diff=147"/>
		<updated>2019-06-03T19:49:18Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Auf dieser Seite sind die Themen zusammengeführt, die in Vorlesung 5 am 16.05.2019 behandelt wurden.&lt;br /&gt;
&lt;br /&gt;
=Normalisierungen=&lt;br /&gt;
Normalisierungen der RNASeq-Daten sind notwendig, um diese vergleichbar machen zu können und die tatsächliche Genexpression quantifizieren zu können. &lt;br /&gt;
==RPKM==&lt;br /&gt;
RPKM steht für 'Reads per kilobase of transcript per Million mapped reads' und ist eine Normalisierungsmethode für Expressionsstärken. &amp;lt;br&amp;gt;&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Formel               !! Parameter&lt;br /&gt;
|-&lt;br /&gt;
| &amp;lt;math&amp;gt; RPKM =  \frac{ c_\text{i}}{L_\text{i} \cdot N} &amp;lt;/math&amp;gt; || c&amp;lt;sub&amp;gt;i&amp;lt;/sub&amp;gt; = Anzahl an ausrichtbaren reads für ein Transkript 'i'&amp;lt;br&amp;gt;&lt;br /&gt;
L&amp;lt;sub&amp;gt;i&amp;lt;/sub&amp;gt; = Länge des Transkripts/Gens 'i' in kbp &amp;lt;br&amp;gt;&lt;br /&gt;
N = Gesamtanzahl an ausrichtbaren reads in Millionen&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
  &amp;lt;math&amp;gt;   \frac{ c_\text{i}}{L_\text{i}} &amp;lt;/math&amp;gt;  → Normalisierung der Genlänge &amp;lt;br&amp;gt;&lt;br /&gt;
  &amp;lt;math&amp;gt; L_\text{i} \cdot N &amp;lt;/math&amp;gt; → Normalisierung der Sequenziertiefe &amp;lt;br&amp;gt;&lt;br /&gt;
Je höher der RPKM-Wert ist, desto höher ist die Genexpression. &amp;lt;br&amp;gt;&lt;br /&gt;
RPKM-Werte können gut zum Vergleich der Genexpressionen innerhalb einer Probe genutzt werden, jedoch sind sie nicht dafür geeignet mehrere Experimente bzw. Proben miteinander zu vergleichen.&lt;br /&gt;
&lt;br /&gt;
'''Beispiel:'''&lt;br /&gt;
&lt;br /&gt;
[[File:Beispiel Probe.png|Beispiel Probe]] &amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
* &amp;lt;math&amp;gt; RPKM (A) =  \frac{12}{0,6 kbp \cdot 6 \cdot 10^6} = 3,33 \cdot 10^{-6}  &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
* &amp;lt;math&amp;gt; RPKM (B) =  \frac{24}{1,1 kbp \cdot 6 \cdot 10^6} = 3,64  \cdot 10^{-6} &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
* &amp;lt;math&amp;gt; RPKM (C) =  \frac{12}{1,4 kbp \cdot 6 \cdot 10^6} = 1,43  \cdot 10^{-6} &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Durch die Normalisierung der Expressionsstärken können diese nun miteinander vergleichen werden.In diesem Beispiel wird Gen B am stärksten exprimiert und Gen C am schwächsten.&lt;br /&gt;
&lt;br /&gt;
==TPM==&lt;br /&gt;
TPM steht für 'Transcripts per Million' und ist eine Normalisierungsmethode für Expressionsstärken. &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Formel               !! Parameter&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;math&amp;gt;  TPM =  \frac{ c_\text{i}}{L_\text{i}}  \cdot  \dfrac {1}{\sum_\text{n} \dfrac {c_\text{n}}{L_\text{n}}}  \cdot 10^6 &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt; || c&amp;lt;sub&amp;gt;i&amp;lt;/sub&amp;gt; = Anzahl an ausrichtbaren reads für ein Transkript 'i'&amp;lt;br&amp;gt;&lt;br /&gt;
L&amp;lt;sub&amp;gt;i&amp;lt;/sub&amp;gt; = Länge des Transkripts/Gens 'i' in kbp &amp;lt;br&amp;gt;&lt;br /&gt;
N = Gesamtanzahl an ausrichtbaren reads in Millionen&lt;br /&gt;
|} &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
==TMM==&lt;br /&gt;
TMM steht für 'Trimmed mean of M-values normalization method'.&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt; M_\text{gk}^\text{k`} = log_2  \dfrac { \dfrac {Y_\text{gk}}{N_\text{k}}}{ \dfrac {Y_\text{gk`}}{N_\text{k`}}}  &amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt; log_2 (TMM_\text{k}^\text{k`}) =  \frac{ \underset {g \in G}{\sum}   W_\text{gk}^\text{k´} \cdot M_\text{gk}^\text{k´}} { \sum_{g \in G} W_\text{gk}^\text{k´}} &amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt;  W_\text{gk}^\text{k`} =  \frac{ N_\text{k} - Y_\text{gk}}{N_\text{k} \cdot Y_\text{gk}}  +  \frac{ N_\text{k`} - Y_\text{gk`}}{N_\text{k`} \cdot Y_\text{gk`}} &amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
'''Der Spaß hier wird morgen erweitert, hab mich nur mit den Formeln vertraut gemacht :D ''' _ Vero&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=6_Normalisierungen&amp;diff=143</id>
		<title>6 Normalisierungen</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=6_Normalisierungen&amp;diff=143"/>
		<updated>2019-06-03T17:02:48Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Auf dieser Seite sind die Themen zusammengeführt, die in Vorlesung 5 am 16.05.2019 behandelt wurden.&lt;br /&gt;
&lt;br /&gt;
=Normalisierungen=&lt;br /&gt;
Normalisierungen der RNASeq-Daten sind notwendig, um diese vergleichbar machen zu können und die tatsächliche Genexpression quantifizieren zu können. &lt;br /&gt;
==RPKM==&lt;br /&gt;
RPKM steht für 'Reads per kilobase of transcript per Million mapped reads' und ist eine Normalisierungsmethode für Expressionsstärken. &amp;lt;br&amp;gt;&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Formel               !! Parameter&lt;br /&gt;
|-&lt;br /&gt;
| &amp;lt;math&amp;gt; RPKM =  \frac{ c_\text{i}}{L_\text{i} \cdot N} &amp;lt;/math&amp;gt; || c&amp;lt;sub&amp;gt;i&amp;lt;/sub&amp;gt; = Anzahl an ausrichtbaren reads für ein Transkript 'i'&amp;lt;br&amp;gt;&lt;br /&gt;
L&amp;lt;sub&amp;gt;i&amp;lt;/sub&amp;gt; = Länge des Transkripts/Gens 'i' in kbp &amp;lt;br&amp;gt;&lt;br /&gt;
N = Gesamtanzahl an ausrichtbaren reads in Millionen&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
  &amp;lt;math&amp;gt;   \frac{ c_\text{i}}{L_\text{i}} &amp;lt;/math&amp;gt;  → Normalisierung der Genlänge &amp;lt;br&amp;gt;&lt;br /&gt;
  &amp;lt;math&amp;gt; L_\text{i} \cdot N &amp;lt;/math&amp;gt; → Normalisierung der Sequenziertiefe &amp;lt;br&amp;gt;&lt;br /&gt;
Je höher der RPKM-Wert ist, desto höher ist die Genexpression. &amp;lt;br&amp;gt;&lt;br /&gt;
RPKM-Werte können gut zum Vergleich der Genexpressionen innerhalb einer Probe genutzt werden, jedoch sind sie nicht dafür geeignet mehrere Experimente bzw. Proben miteinander zu vergleichen.&lt;br /&gt;
&lt;br /&gt;
'''Beispiel:'''&lt;br /&gt;
&lt;br /&gt;
[[File:Beispiel Probe.png|Beispiel Probe]] &amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
* &amp;lt;math&amp;gt; RPKM (A) =  \frac{12}{0,6 kbp \cdot 6} = 3,33  &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
* &amp;lt;math&amp;gt; RPKM (B) =  \frac{24}{1,1 kbp \cdot 6} = 3,64  &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&lt;br /&gt;
* &amp;lt;math&amp;gt; RPKM (C) =  \frac{12}{1,4 kbp \cdot 6} = 1,43  &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Durch die Normalisierung der Expressionsstärken können diese nun miteinander vergleichen werden.In diesem Beispiel wird Gen B am stärksten exprimiert und Gen C am schwächsten.&lt;br /&gt;
&lt;br /&gt;
==TPM==&lt;br /&gt;
TPM steht für 'Transcripts per Million' und ist eine Normalisierungsmethode für Expressionsstärken. &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Formel               !! Parameter&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;math&amp;gt;  TPM =  \frac{ c_\text{i}}{L_\text{i}}  \cdot  \dfrac {1}{\sum_\text{n} \dfrac {c_\text{n}}{L_\text{n}}}  \cdot 10^6 &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt; || c&amp;lt;sub&amp;gt;i&amp;lt;/sub&amp;gt; = Anzahl an ausrichtbaren reads für ein Transkript 'i'&amp;lt;br&amp;gt;&lt;br /&gt;
L&amp;lt;sub&amp;gt;i&amp;lt;/sub&amp;gt; = Länge des Transkripts/Gens 'i' in kbp &amp;lt;br&amp;gt;&lt;br /&gt;
N = Gesamtanzahl an ausrichtbaren reads in Millionen&lt;br /&gt;
|} &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
==TMM==&lt;br /&gt;
TMM steht für 'Trimmed mean of M-values normalization method'.&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt; M_\text{gk}^\text{k`} = log_2  \dfrac { \dfrac {Y_\text{gk}}{N_\text{k}}}{ \dfrac {Y_\text{gk`}}{N_\text{k`}}}  &amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt; log_2 (TMM_\text{k}^\text{k`}) =  \frac{ \underset {g \in G}{\sum}   W_\text{gk}^\text{k´} \cdot M_\text{gk}^\text{k´}} { \sum_{g \in G} W_\text{gk}^\text{k´}} &amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt;  W_\text{gk}^\text{k`} =  \frac{ N_\text{k} - Y_\text{gk}}{N_\text{k} \cdot Y_\text{gk}}  +  \frac{ N_\text{k`} - Y_\text{gk`}}{N_\text{k`} \cdot Y_\text{gk`}} &amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
'''Der Spaß hier wird morgen erweitert, hab mich nur mit den Formeln vertraut gemacht :D ''' _ Vero&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=6_Normalisierungen&amp;diff=142</id>
		<title>6 Normalisierungen</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=6_Normalisierungen&amp;diff=142"/>
		<updated>2019-06-03T16:23:01Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Auf dieser Seite sind die Themen zusammengeführt, die in Vorlesung 5 am 16.05.2019 behandelt wurden.&lt;br /&gt;
&lt;br /&gt;
=Normalisierungen=&lt;br /&gt;
Normalisierungen der RNASeq-Daten sind notwendig, um diese vergleichbar machen zu können und die tatsächliche Genexpression quantifizieren zu können. &lt;br /&gt;
==RPKM==&lt;br /&gt;
RPKM steht für 'Reads per kilobase of transcript per Million mapped reads'. &amp;lt;br&amp;gt;&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Formel               !! Parameter&lt;br /&gt;
|-&lt;br /&gt;
| &amp;lt;math&amp;gt; RPKM =  \frac{ c_\text{i}}{L_\text{i} \cdot N} &amp;lt;/math&amp;gt; || c&amp;lt;sub&amp;gt;i&amp;lt;/sub&amp;gt; = Anzahl an ausrichtbaren reads für ein Transkript 'i'&amp;lt;br&amp;gt;&lt;br /&gt;
L&amp;lt;sub&amp;gt;i&amp;lt;/sub&amp;gt; = Länge des Transkripts/Gens 'i' in Kbp &amp;lt;br&amp;gt;&lt;br /&gt;
N = Gesamtanzahl an ausrichtbaren reads in Millionen&lt;br /&gt;
|} &amp;lt;br&amp;gt;&lt;br /&gt;
Beispiel: &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
[[File:Beispiel Probe.png|Beispiel Probe]] &amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
==TPM==&lt;br /&gt;
TPM steht für 'Transcripts per Million'. &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|-&lt;br /&gt;
! Formel               !! Parameter&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;math&amp;gt;  TPM =  \frac{ c_\text{i}}{L_\text{i}}  \cdot  \dfrac {1}{\sum_\text{n} \dfrac {c_\text{n}}{L_\text{n}}}  \cdot 10^6 &amp;lt;/math&amp;gt; &amp;lt;br&amp;gt; || c&amp;lt;sub&amp;gt;i&amp;lt;/sub&amp;gt; = Anzahl an ausrichtbaren reads für ein Transkript 'i'&amp;lt;br&amp;gt;&lt;br /&gt;
L&amp;lt;sub&amp;gt;i&amp;lt;/sub&amp;gt; = Länge des Transkripts/Gens 'i' in Kbp &amp;lt;br&amp;gt;&lt;br /&gt;
N = Gesamtanzahl an ausrichtbaren reads in Millionen&lt;br /&gt;
|} &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
==TMM==&lt;br /&gt;
TMM steht für 'Trimmed mean of M-values normalization method'.&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt; M_\text{gk}^\text{k`} = log_2  \dfrac { \dfrac {Y_\text{gk}}{N_\text{k}}}{ \dfrac {Y_\text{gk`}}{N_\text{k`}}}  &amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt; log_2 (TMM_\text{k}^\text{k`}) =  \frac{ \underset {g \in G}{\sum}   W_\text{gk}^\text{k´} \cdot M_\text{gk}^\text{k´}} { \sum_{g \in G} W_\text{gk}^\text{k´}} &amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt;  W_\text{gk}^\text{k`} =  \frac{ N_\text{k} - Y_\text{gk}}{N_\text{k} \cdot Y_\text{gk}}  +  \frac{ N_\text{k`} - Y_\text{gk`}}{N_\text{k`} \cdot Y_\text{gk`}} &amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
'''Der Spaß hier wird morgen erweitert, hab mich nur mit den Formeln vertraut gemacht :D ''' _ Vero&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=File:Beispiel_Probe.png&amp;diff=141</id>
		<title>File:Beispiel Probe.png</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=File:Beispiel_Probe.png&amp;diff=141"/>
		<updated>2019-06-03T16:12:55Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Probe mit Genlängen und Alignment der reads&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=6_Normalisierungen&amp;diff=140</id>
		<title>6 Normalisierungen</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=6_Normalisierungen&amp;diff=140"/>
		<updated>2019-06-03T14:27:25Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Auf dieser Seite sind die Themen zusammengeführt, die in Vorlesung 5 am 16.05.2019 behandelt wurden.&lt;br /&gt;
&lt;br /&gt;
=Normalisierungen=&lt;br /&gt;
Normalisierungen der RNASeq-Daten sind notwendig, um diese vergleichbar machen zu können und die tatsächliche Genexpression quantifizieren zu können. &lt;br /&gt;
==RPKM==&lt;br /&gt;
RPKM steht für 'Reads per kilobase of transcript per Million mapped reads' &amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;math&amp;gt; RPKM =  \frac{ c_\text{i}}{L_\text{i} \cdot N} &amp;lt;/math&amp;gt;&lt;br /&gt;
==TPM==&lt;br /&gt;
TPM steht für 'Transcripts per Million' &amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;math&amp;gt;  TPM =  \frac{ c_\text{i}}{L_\text{i}}  \cdot  \dfrac {1}{\sum_\text{n} \dfrac {c_\text{n}}{L_\text{n}}}  \cdot 10^6 &amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
==TMM==&lt;br /&gt;
TMM steht für 'Trimmed mean of M-values normalization method'&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt; M_\text{gk}^\text{k`} = log_2  \dfrac { \dfrac {Y_\text{gk}}{N_\text{k}}}{ \dfrac {Y_\text{gk`}}{N_\text{k`}}}  &amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt; log_2 (TMM_\text{k}^\text{k`}) =  \frac{ \underset {g \in G}{\sum}   W_\text{gk}^\text{k´} \cdot M_\text{gk}^\text{k´}} { \sum_{g \in G} W_\text{gk}^\text{k´}} &amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt;  W_\text{gk}^\text{k`} =  \frac{ N_\text{k} - Y_\text{gk}}{N_\text{k} \cdot Y_\text{gk}}  +  \frac{ N_\text{k`} - Y_\text{gk`}}{N_\text{k`} \cdot Y_\text{gk`}} &amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
'''Der Spaß hier wird morgen erweitert, hab mich nur mit den Formeln vertraut gemacht :D ''' _ Vero&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=6_Normalisierungen&amp;diff=130</id>
		<title>6 Normalisierungen</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=6_Normalisierungen&amp;diff=130"/>
		<updated>2019-05-29T22:47:59Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Auf dieser Seite sind die Themen zusammengeführt, die in Vorlesung 5 am 16.05.2019 behandelt wurden.&lt;br /&gt;
&lt;br /&gt;
=Normalisierungen=&lt;br /&gt;
Normalisierungen der RNASeq-Daten sind notwendig, um diese vergleichbar machen zu können und die tatsächliche Genexpression quantifizieren zu können. &lt;br /&gt;
==RPKM==&lt;br /&gt;
RPKM steht für 'Reads per kilobase of transcript per Million mapped reads'&lt;br /&gt;
==TPM==&lt;br /&gt;
TPM steht für 'Transcripts per Million'&lt;br /&gt;
==TMM==&lt;br /&gt;
TMM steht für 'Trimmed mean of M-values normalization method'&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt; M_\text{gk}^\text{k`} = log_2  \dfrac { \dfrac {Y_\text{gk}}{N_\text{k}}}{ \dfrac {Y_\text{gk`}}{N_\text{k`}}}  &amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt; log_2 (TMM_\text{k}^\text{k`}) =  \frac{ \underset {g \in G}{\sum}   W_\text{gk}^\text{k´} \cdot M_\text{gk}^\text{k´}} { \sum_{g \in G} W_\text{gk}^\text{k´}} &amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt;  W_\text{gk}^\text{k`} =  \frac{ N_\text{k} - Y_\text{gk}}{N_\text{k} \cdot Y_\text{gk}}  +  \frac{ N_\text{k`} - Y_\text{gk`}}{N_\text{k`} \cdot Y_\text{gk`}} &amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
'''Der Spaß hier wird morgen erweitert, hab mich nur mit den Formeln vertraut gemacht :D ''' _ Vero&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=6_Normalisierungen&amp;diff=129</id>
		<title>6 Normalisierungen</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=6_Normalisierungen&amp;diff=129"/>
		<updated>2019-05-29T22:04:15Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Auf dieser Seite sind die Themen zusammengeführt, die in Vorlesung 5 am 16.05.2019 behandelt wurden.&lt;br /&gt;
&lt;br /&gt;
=Normalisierungen=&lt;br /&gt;
Normalisierungen der RNASeq-Daten sind notwendig, um diese vergleichbar machen zu können und die tatsächliche Genexpression quantifizieren zu können. &lt;br /&gt;
==RPKM==&lt;br /&gt;
RPKM steht für 'Reads per kilobase of transcript per Million mapped reads'&lt;br /&gt;
==TPM==&lt;br /&gt;
TPM steht für 'Transcripts per Million'&lt;br /&gt;
==TMM==&lt;br /&gt;
TMM steht für 'Trimmed mean of M-values normalization method'&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt; M_\text{gk}^\text{k`} = log_2  \dfrac { \dfrac {Y_\text{gk}}{N_\text{k}}}{ \dfrac {Y_\text{gk`}}{N_\text{k`}}}  &amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
'''Der Spaß hier wird morgen erweitert, hab mich nur mit den Formeln vertraut gemacht :D ''' _ Vero&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=6_Normalisierungen&amp;diff=128</id>
		<title>6 Normalisierungen</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=6_Normalisierungen&amp;diff=128"/>
		<updated>2019-05-29T21:59:59Z</updated>

		<summary type="html">&lt;p&gt;Vero: Created page with &amp;quot;Auf dieser Seite sind die Themen zusammengeführt, die in Vorlesung 5 am 16.05.2019 behandelt wurden.  =Normalisierungen= Normalisierungen der RNASeq-Daten sind notwendig, um...&amp;quot;&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Auf dieser Seite sind die Themen zusammengeführt, die in Vorlesung 5 am 16.05.2019 behandelt wurden.&lt;br /&gt;
&lt;br /&gt;
=Normalisierungen=&lt;br /&gt;
Normalisierungen der RNASeq-Daten sind notwendig, um diese vergleichbar machen zu können und die tatsächliche Genexpression quantifizieren zu können. &lt;br /&gt;
==RPKM==&lt;br /&gt;
RPKM steht für 'Reads per kilobase of transcript per Million mapped reads'&lt;br /&gt;
==TPM==&lt;br /&gt;
TPM steht für 'Transcripts per Million'&lt;br /&gt;
==TMM==&lt;br /&gt;
TMM steht für 'Trimmed mean auf M-values normalization method'&lt;br /&gt;
&lt;br /&gt;
&amp;lt;math&amp;gt; M_\text{gk}^\text{k`} = log_2  \dfrac { \dfrac {Y_\text{gk}}{N_\text{k}}}{ \dfrac {Y_\text{gk`}}{N_\text{k`}}}  &amp;lt;/math&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
'''Der Spaß hier wird morgen erweitert, hab mich nur mit den Formeln vertraut gemacht :D ''' _ Vero&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=Main_Page&amp;diff=127</id>
		<title>Main Page</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=Main_Page&amp;diff=127"/>
		<updated>2019-05-29T20:28:16Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= Aktuelles Semester (SS2019) =&lt;br /&gt;
Übersicht [[SS2019|SS2019]]&lt;br /&gt;
&lt;br /&gt;
[[Vorlesung 1]] | [[Vorlesung 2]] | [[Vorlesung 3]] | [[Vorlesung 4]] | [[Vorlesung 5]] | [[Vorlesung 6]] | [[Vorlesung 7]] | [[Vorlesung 8]] | [[Vorlesung 9]] | [[Vorlesung 10]] | [[Vorlesung 11]]&lt;br /&gt;
&lt;br /&gt;
[[Übung 1]] | [[Übung 2]] | [[Übung 3]] | [[Übung 4]] | [[Übung 5]] | [[Übung 6]] | [[Übung 7]] | [[Übung 8 ]] | [[Übung 9]] | [[Übung 10]] | [[Übung 11]]&lt;br /&gt;
&lt;br /&gt;
[[Glossar]]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
== Semester Archive ==&lt;br /&gt;
''None''&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=4_Burrows-Wheeler&amp;diff=118</id>
		<title>4 Burrows-Wheeler</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=4_Burrows-Wheeler&amp;diff=118"/>
		<updated>2019-05-15T23:37:29Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Auf dieser Seite sind die Themen zusammengeführt, die in Vorlesung 4 am 02.05.2019 behandelt wurden.&lt;br /&gt;
&amp;lt;br&amp;gt;&lt;br /&gt;
== Burrows-Wheeler Transformation ==&lt;br /&gt;
Die Burrows-Wheeler Induzierung wurde in der Informatik ursprünglich zur Optimierung von Daten-Kompression entwickelt.&amp;lt;br&amp;gt;&lt;br /&gt;
Sie eignet sich auch gut zur effizienten Suche großer Texte und somit zur Suche eines optimalen Alignments.&amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;br&amp;gt;&lt;br /&gt;
'''Vorteile'''&amp;lt;br&amp;gt;&lt;br /&gt;
* Sehr schnell und verbraucht wenig Speicher&amp;lt;br&amp;gt;&lt;br /&gt;
* Eine Rücktransformation ist Möglich &amp;lt;br&amp;gt;&lt;br /&gt;
* Kein Informationsverlust beim Sortieren&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Transformation === &lt;br /&gt;
Beispiel an der Sequenz T = ACAACG$&amp;lt;br&amp;gt;&lt;br /&gt;
'''1. Generierung aller cyclischen Verschiebungen von T'''&amp;lt;br&amp;gt;&lt;br /&gt;
Die Sequenz wird cyklisch um eine Stelle verschoben, bis die ursprüngliche Sequenz wieder erreicht ist.&amp;lt;br&amp;gt;&lt;br /&gt;
[[File:BWT.png|thumb|center|Cyklische Rotation]]&lt;br /&gt;
In rot ist der 'Suffix-Array' dargestellt.&lt;br /&gt;
&lt;br /&gt;
'''2. Sortierung'''&amp;lt;br&amp;gt;&lt;br /&gt;
Die cyklische Rotation von 'T' wird alphabetisch sortiert, dabei hat das Sonderzeichen (in diesem Fall $) den niedrigsten Wert.&amp;lt;br&amp;gt;&lt;br /&gt;
[[File:Bwt sortierung.png|thumb|center|Alphabetische Sortierung]]&lt;br /&gt;
Die letzte Spalte wird als '''Burrows-Wheeler Transformation''' (BWT) bezeichnet.&amp;lt;br&amp;gt;&lt;br /&gt;
ACAACG$ → CC$AAAC&amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''Eigenschaften der BWT :'''&amp;lt;br&amp;gt;&lt;br /&gt;
* Hat die gleiche Länge, wie die Originalsequenz &amp;lt;br&amp;gt;&lt;br /&gt;
* Originalsequenz T kann direkt aus BWT regeneriert werden&lt;br /&gt;
'''3. 'Last-First Zuordnung'''' &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Die 'i'te Position des Buchstaben x in der letzten Spalte (Transformation) entspricht der 'i'ten Position in der 1. Spalte&amp;lt;br&amp;gt;&lt;br /&gt;
Benötigt werden nur die erste und letzte Spalte nach der cyklischen Rotation.&amp;lt;br&amp;gt;&lt;br /&gt;
Begonnen wird mit dem ersten Zeichen der BWT, in diesem Fall 'G', dieses stellt das letzte Zeichen der Originalsequenz dar. Da es das 1. 'G' in der Spalte ist, wird auch das 1. 'G' in der ersten Spalte gesucht, das entsprehende Zeichen der letzten Spalte in der gleichen Zeile, ist das vorletzte Zeichen der Originalsequenz. In diesem Fall ist es ''C'.&lt;br /&gt;
[[File:Erster_schritt.png|thumb|center|Last-First Zuordnung]]&lt;br /&gt;
Da das 'C' das letzte in dieser Spalte ist, wird auch nach dem letzten 'C' in der ersten Spalte gesucht und somit nach dem entsprechenden Zeichen in dieser Zeile. In diesem Fall ist es ein 'A' und dies ist das nächste Zeichen in der Originalsequenz.&lt;br /&gt;
[[File:2._Schritt.png|thumb|center|Last-First Zuordnung]]&lt;br /&gt;
Nach diesem Schema wird so lange weiter gearbeitet, bis das Sonderzeichen erreicht und die Originalsequenz rekonstruiert ist.&amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''4. Suche nach einer Sequenz in T''' &amp;lt;br&amp;gt;&lt;br /&gt;
In diesem Beispielt wird nach der Sequenz 'AAC' in der Originalsequenz T gesucht. Dafür werden wieder nur die erste und letzte Spalte der alphabetischen Sortierung benötigt. &amp;lt;br&amp;gt;&lt;br /&gt;
Begonnen wird mit der Suche des ersten Zeichens der gesuchten Sequenz 'C', in der ersten Spalte. Das Intervall wird auf die letzte Spalte, der gleichen Zeilen übertragen. &lt;br /&gt;
[[File:Suche.png|thumb|center|Suche einer Sequenz]]&lt;br /&gt;
Das nächste gesuchte Zeichen ist ein 'A', beide Zeichen des Intervalls stimmen damit überein. Da es das 2. und 3. 'A' in dieser Spalte sind, wird wieder in der ersten Spalte nach den entsprechenden Zeichen gesucht. Das nächste Zeichen der gesuchten Sequenz ist ein 'A', da dieses in den entsprechenden Zeilen nur ein mal vorkommt, wird das Intervall verkleinert und somit so angepasst, dass nur die gesuchten Zeichen darin vorkommen.&lt;br /&gt;
[[File:Suche2.png|thumb|center|Suche einer Sequenz]]&lt;br /&gt;
Das 'A' ist das 1. 'A' in dieser Spalte, also wird wieder das entsprechende 'A' in der ersten Spalte gesucht, da das Zeichen in der entsprechenden Zeile nicht mehr mit der gesuchten Sequenz übereinstimmt, ist die Suche an dieser Stelle beendet.&lt;br /&gt;
[[File:Suche3.png|thumb|center|Suche einer Sequenz]]&lt;br /&gt;
&lt;br /&gt;
Der Suffix-Array an dieser Position ist '2'. Zu diesem wird der Wert 1 zugezählt und ergibt somit 3. Demzufolge beginnt die gesuchte Sequenz an der 3. Position in der Originalsequenz.&lt;br /&gt;
[[File:Suche4.png|thumb|center|Suche einer Sequenz]]&lt;br /&gt;
&lt;br /&gt;
Diese Burrows-Wheeler Transformation kann mit jeder beliebigen Sequenz durchgeführt werden und ermöglicht eine effiktive Suche nach einem lokalen Alignment.&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=4_Burrows-Wheeler&amp;diff=117</id>
		<title>4 Burrows-Wheeler</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=4_Burrows-Wheeler&amp;diff=117"/>
		<updated>2019-05-15T23:32:11Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Auf dieser Seite sind die Themen zusammengeführt, die in Vorlesung 4 am 02.05.2019 behandelt wurden.&lt;br /&gt;
&amp;lt;br&amp;gt;&lt;br /&gt;
== Burrows-Wheeler Transformation ==&lt;br /&gt;
Die Burrows-Wheeler Induzierung wurde in der Informatik ursprünglich zur Optimierung von Daten-Kompression entwickelt.&amp;lt;br&amp;gt;&lt;br /&gt;
Sie eignet sich auch gut zur effizienten Suche großer Texte und somit zur Suche eines optimalen Alignments.&amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;br&amp;gt;&lt;br /&gt;
'''Vorteile'''&amp;lt;br&amp;gt;&lt;br /&gt;
* Sehr schnell und verbraucht wenig Speicher&amp;lt;br&amp;gt;&lt;br /&gt;
* Eine Rücktransformation ist Möglich &amp;lt;br&amp;gt;&lt;br /&gt;
* Kein Informationsverlust beim Sortieren&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Transformation === &lt;br /&gt;
Beispiel an der Sequenz T = ACAACG$&amp;lt;br&amp;gt;&lt;br /&gt;
'''1. Generierung aller cyclischen Verschiebungen von T'''&amp;lt;br&amp;gt;&lt;br /&gt;
Die Sequenz wird cyklisch um eine Stelle verschoben, bis die ursprüngliche Sequenz wieder erreicht ist.&amp;lt;br&amp;gt;&lt;br /&gt;
[[File:BWT.png|thumb|center|Cyklische Rotation]]&lt;br /&gt;
In rot ist die 'Suffix-Array' dargestellt.&lt;br /&gt;
&lt;br /&gt;
'''2. Sortierung'''&amp;lt;br&amp;gt;&lt;br /&gt;
Die cyklische Rotation von 'T' wird alphabetisch sortiert, dabei hat das Sonderzeichen (in diesem Fall $) den niedrigsten Wert.&amp;lt;br&amp;gt;&lt;br /&gt;
[[File:Bwt sortierung.png|thumb|center|Alphabetische Sortierung]]&lt;br /&gt;
Die letzte Spalte wird als '''Burrows-Wheeler Transformation''' (BWT) bezeichnet.&amp;lt;br&amp;gt;&lt;br /&gt;
ACAACG$ → CC$AAAC&amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''Eigenschaften der BWT :'''&amp;lt;br&amp;gt;&lt;br /&gt;
* Hat die gleiche Länge, wie die Originalsequenz &amp;lt;br&amp;gt;&lt;br /&gt;
* Originalsequenz T kann direkt aus BWT regeneriert werden&lt;br /&gt;
''''3. Last-First Zuordnung'''' &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Die 'i'te Position des Buchstaben x in der letzten Spalte (Transformation) entspricht der 'i'ten Position in der 1. Spalte&amp;lt;br&amp;gt;&lt;br /&gt;
Benötigt werden nur die erste und letzte Spalte nach der cyklischen Rotation.&amp;lt;br&amp;gt;&lt;br /&gt;
Begonnen wird mit dem ersten Zeichen der BWT, in diesem Fall 'G', dieses stellt das letzte Zeichen der Originalsequenz dar. Da es das 1. 'G' in der Spalte ist, wird auch das 1. 'G' in der ersten Spalte gesucht, das entsprehende Zeichen der letzten Spalte in der gleichen Zeile, ist das vorletzte Zeichen der Originalsequenz. In diesem Fall ist es ''C'.&lt;br /&gt;
[[File:Erster_schritt.png|thumb|center|Last-First Zuordnung]]&lt;br /&gt;
Da das 'C' das letzte in dieser Spalte ist, wird auch nach dem letzten 'C' in der ersten Spalte gesucht und somit nach dem entsprechenden Zeichen in dieser Zeile. In diesem Fall ist es ein 'A' und dies ist das nächste Zeichen in der Originalsequenz.&lt;br /&gt;
[[File:2._Schritt.png|thumb|center|Last-First Zuordnung]]&lt;br /&gt;
Nach diesem Schema wird so lange weiter gearbeitet, bis das Sonderzeichen erreicht und die Originalsequenz rekonstruiert ist.&amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''4. Suche nach einer Sequenz in T''' &amp;lt;br&amp;gt;&lt;br /&gt;
In diesem Beispielt wird nach der Sequenz 'AAC' in der Originalsequenz T gesucht. Dafür werden wieder nur die erste und letzte Spalte der alphabetischen Sortierung benötigt. &amp;lt;br&amp;gt;&lt;br /&gt;
Begonnen wird mit der Suche des ersten Zeichens der gesuchten Sequenz 'C', in der ersten Spalte. Das Intervall wird auf die letzte Spalte, der gleichen Zeile übertragen. &lt;br /&gt;
[[File:Suche.png|thumb|center|Suche einer Sequenz]]&lt;br /&gt;
Das nächste gesuchte Zeichen ist ein 'A', beide Zeichen des Intervalls stimmen damit überein, da es das 2. und 3. 'A' in dieser Spalte sind, wird wieder in der ersten Spalte nach den entsprechenden Zahlen gesucht. Das nächste Zeichen der gesuchten Sequenz ist ein 'A', da dieses in den entsprechenden Zeilen nur ein mal vorkommt, wird das Intervall verkleinert und somit angepasst.&lt;br /&gt;
[[File:Suche2.png|thumb|center|Suche einer Sequenz]]&lt;br /&gt;
Das 'A' ist das 1. 'A' in dieser Spalte, also wird wieder das entsprechende 'A' in der ersten Spalte gesucht, da das Zeichen in der entsprechenden Zeile nicht mehr mit der gesuchten Sequenz übereinstimmt, ist die Suche an dieser Stelle beendet.&lt;br /&gt;
[[File:Suche3.png|thumb|center|Suche einer Sequenz]]&lt;br /&gt;
&lt;br /&gt;
Der Suffix-Array an dieser Position ist '2'. Zu diesem wird der Wert 1 zugezählt und ergibt somit 3. Demzufolge beginnt die gesuchte Sequenz an der 3. Position in der Originalsequenz.&lt;br /&gt;
[[File:Suche4.png|thumb|center|Suche einer Sequenz]]&lt;br /&gt;
&lt;br /&gt;
Diese Burrows-Wheeler Transformation kann mit jeder beliebigen Sequenz durchgeführt werden und ermöglicht eine effiktive Suche nach einem lokalen Alignment.&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=4_Burrows-Wheeler&amp;diff=115</id>
		<title>4 Burrows-Wheeler</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=4_Burrows-Wheeler&amp;diff=115"/>
		<updated>2019-05-15T23:02:22Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Auf dieser Seite sind die Themen zusammengeführt, die in Vorlesung 4 am 02.05.2019 behandelt wurden.&lt;br /&gt;
&amp;lt;br&amp;gt;&lt;br /&gt;
== Burrows-Wheeler Transformation ==&lt;br /&gt;
Die Burrows-Wheeler Induzierung wurde in der Informatik ursprünglich zur Optimierung von Daten-Kompression entwickelt.&amp;lt;br&amp;gt;&lt;br /&gt;
Sie eignet sich auch gut zur effizienten Suche großer Texte und somit zur Suche eines optimalen Alignments.&amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;br&amp;gt;&lt;br /&gt;
'''Vorteile'''&amp;lt;br&amp;gt;&lt;br /&gt;
* Sehr schnell und verbraucht wenig Speicher&amp;lt;br&amp;gt;&lt;br /&gt;
* Eine Rücktransformation ist Möglich &amp;lt;br&amp;gt;&lt;br /&gt;
* Kein Informationsverlust beim Sortieren&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Transformation === &lt;br /&gt;
Beispiel an der Sequenz T = ACAACG$&amp;lt;br&amp;gt;&lt;br /&gt;
'''1. Generierung aller cyclischen Verschiebungen von T'''&amp;lt;br&amp;gt;&lt;br /&gt;
Die Sequenz wird cyklisch um eine Stelle verschoben, bis die ursprüngliche Sequenz wieder erreicht ist.&amp;lt;br&amp;gt;&lt;br /&gt;
[[File:BWT.png|thumb|center|Cyklische Rotation]]&lt;br /&gt;
In rot ist die 'Suffix-Array' dargestellt.&lt;br /&gt;
&lt;br /&gt;
'''2. Sortierung'''&amp;lt;br&amp;gt;&lt;br /&gt;
Die cyklische Rotation von 'T' wird alphabetisch sortiert, dabei hat das Sonderzeichen (in diesem Fall $) den niedrigsten Wert.&amp;lt;br&amp;gt;&lt;br /&gt;
[[File:Bwt sortierung.png|thumb|center|Alphabetische Sortierung]]&lt;br /&gt;
Die letzte Spalte wird als '''Burrows-Wheeler Transformation''' (BWT) bezeichnet.&amp;lt;br&amp;gt;&lt;br /&gt;
ACAACG$ → CC$AAAC&amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''Eigenschaften der BWT :'''&amp;lt;br&amp;gt;&lt;br /&gt;
* Hat die gleiche Länge, wie die Originalsequenz &amp;lt;br&amp;gt;&lt;br /&gt;
* Originalsequenz T kann direkt aus BWT regeneriert werden&lt;br /&gt;
''''3. Last-First Zuordnung'''' &amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Die 'i'te Position des Buchstaben x in der letzten Spalte (Transformation) entspricht der 'i'ten Position in der 1. Spalte&amp;lt;br&amp;gt;&lt;br /&gt;
Benötigt werden nur die erste und letzte Spalte nach der cyklischen Rotation.&amp;lt;br&amp;gt;&lt;br /&gt;
Begonnen wird mit dem ersten Zeichen der BWT, in diesem Fall 'G', dieses stellt das letzte Zeichen der Originalsequenz dar. Da es das 1. 'G' in der Spalte ist, wird auch das 1. 'G' in der ersten Spalte gesucht, das entsprehende Zeichen der letzten Spalte in der gleichen Zeile, ist das vorletzte Zeichen der Originalsequenz. In diesem Fall ist es ''C'.&lt;br /&gt;
[[File:Erster_schritt.png|thumb|center|Last-First Zuordnung]]&lt;br /&gt;
Da das 'C' das letzte in dieser Spalte ist, wird auch nach dem letzten 'C' in der ersten Spalte gesucht und somit nach dem entsprechenden Zeichen in dieser Zeile. In diesem Fall ist es ein 'A' und dies ist das nächste Zeichen in der Originalsequenz.&lt;br /&gt;
[[File:2._Schritt.png|thumb|center|Last-First Zuordnung]]&lt;br /&gt;
Nach diesem Schema wird so lange weiter gearbeitet, bis das Sonderzeichen erreicht und die Originalsequenz rekonstruiert ist.&amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''4. Suche nach einer Sequenz in T''' &amp;lt;br&amp;gt;&lt;br /&gt;
In diesem Beispielt wird nach der Sequenz 'AAC' in der Originalsequenz T gesucht. Dafür werden wieder nur die erste und letzte Spalte der alphabetischen Sortierung benötigt.&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=4_Burrows-Wheeler&amp;diff=111</id>
		<title>4 Burrows-Wheeler</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=4_Burrows-Wheeler&amp;diff=111"/>
		<updated>2019-05-15T22:41:30Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Auf dieser Seite sind die Themen zusammengeführt, die in Vorlesung 4 am 02.05.2019 behandelt wurden.&lt;br /&gt;
&amp;lt;br&amp;gt;&lt;br /&gt;
== Burrows-Wheeler Transformation ==&lt;br /&gt;
Die Burrows-Wheeler Induzierung wurde in der Informatik ursprünglich zur Optimierung von Daten-Kompression entwickelt.&amp;lt;br&amp;gt;&lt;br /&gt;
Sie eignet sich auch gut zur effizienten Suche großer Texte und somit zur Suche eines optimalen Alignments.&amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;br&amp;gt;&lt;br /&gt;
'''Vorteile'''&amp;lt;br&amp;gt;&lt;br /&gt;
* Sehr schnell und verbraucht wenig Speicher&amp;lt;br&amp;gt;&lt;br /&gt;
* Eine Rücktransformation ist Möglich &amp;lt;br&amp;gt;&lt;br /&gt;
* Kein Informationsverlust beim Sortieren&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Transformation === &lt;br /&gt;
Beispiel an der Sequenz T = ACAACG$&amp;lt;br&amp;gt;&lt;br /&gt;
'''1. Generierung aller cyclischen Verschiebungen von T'''&amp;lt;br&amp;gt;&lt;br /&gt;
Die Sequenz wird cyklisch um eine Stelle verschoben, bis die ursprüngliche Sequenz wieder erreicht ist.&amp;lt;br&amp;gt;&lt;br /&gt;
[[File:BWT.png|thumb|center|Cyklische Rotation]]&lt;br /&gt;
In rot ist die 'Suffix-Array' dargestellt.&lt;br /&gt;
&lt;br /&gt;
'''2. Sortierung'''&amp;lt;br&amp;gt;&lt;br /&gt;
Die Verschiebung von 'T' wird alphabetisch sortiert, dabei hat das Sonderzeichen (in diesem Fall $) den niedrigsten Wert.&amp;lt;br&amp;gt;&lt;br /&gt;
[[File:Bwt sortierung.png|thumb|center|Alphabetische Sortierung]]&lt;br /&gt;
Die letzte Spalte wird als '''Burrows-Wheeler Transformation''' (BWT) bezeichnet.&amp;lt;br&amp;gt;&lt;br /&gt;
ACAACG$ → CC$AAAC&amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''Eigenschaften der BWT :'''&amp;lt;br&amp;gt;&lt;br /&gt;
* Hat die gleiche Länge, wie die Originalsequenz &amp;lt;br&amp;gt;&lt;br /&gt;
* Originalsequenz T kann direkt aus BWT regeneriert werden&lt;br /&gt;
''''Last-First Zuordnung''''&amp;lt;br&amp;gt;&lt;br /&gt;
Die 'i'te Position des Buchstaben x in der letzten Spalte (Transformation) entspricht der 'i'ten Position in der 1. Spalte&amp;lt;br&amp;gt;&lt;br /&gt;
Benötigt werden nur die erste und letzte Spalte nach der cyklischen Verschiebung.&amp;lt;br&amp;gt;&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=4_Burrows-Wheeler&amp;diff=110</id>
		<title>4 Burrows-Wheeler</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=4_Burrows-Wheeler&amp;diff=110"/>
		<updated>2019-05-15T22:39:15Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Auf dieser Seite sind die Themen zusammengeführt, die in Vorlesung 4 am 02.05.2019 behandelt wurden.&lt;br /&gt;
&amp;lt;br&amp;gt;&lt;br /&gt;
== Burrows-Wheeler Transformation ==&lt;br /&gt;
Die Burrows-Wheeler Induzierung wurde in der Informatik ursprünglich zur Optimierung von Daten-Kompression entwickelt.&amp;lt;br&amp;gt;&lt;br /&gt;
Sie eignet sich auch gut zur effizienten Suche großer Texte und somit zur Suche eines optimalen Alignments.&amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;br&amp;gt;&lt;br /&gt;
'''Vorteile'''&amp;lt;br&amp;gt;&lt;br /&gt;
* Sehr schnell und verbraucht wenig Speicher&amp;lt;br&amp;gt;&lt;br /&gt;
* Eine Rücktransformation ist Möglich &amp;lt;br&amp;gt;&lt;br /&gt;
* Kein Informationsverlust beim Sortieren&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Transformation === &lt;br /&gt;
Beispiel an der Sequenz T = ACAACG$&amp;lt;br&amp;gt;&lt;br /&gt;
'''1. Generierung aller cyclischen Verschiebungen von T'''&amp;lt;br&amp;gt;&lt;br /&gt;
Die Sequenz wird cyklisch um eine Stelle verschoben, bis die ursprüngliche Sequenz wieder erreicht ist.&amp;lt;br&amp;gt;&lt;br /&gt;
[[File:Bwt.png|thumb|center|Cyklische Rotation]]&lt;br /&gt;
In rot ist die 'Suffix-Array' dargestellt.&lt;br /&gt;
&lt;br /&gt;
'''2. Sortierung'''&amp;lt;br&amp;gt;&lt;br /&gt;
Die Verschiebung von 'T' wird alphabetisch sortiert, dabei hat das Sonderzeichen (in diesem Fall $) den niedrigsten Wert.&amp;lt;br&amp;gt;&lt;br /&gt;
[[File:Bwt sortierung.png|thumb|center|Alphabetische Sortierung]]&lt;br /&gt;
Die letzte Spalte wird als '''Burrows-Wheeler Transformation''' (BWT) bezeichnet.&amp;lt;br&amp;gt;&lt;br /&gt;
ACAACG$ → CC$AAAC&amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''Eigenschaften der BWT :'''&amp;lt;br&amp;gt;&lt;br /&gt;
* Hat die gleiche Länge, wie die Originalsequenz &amp;lt;br&amp;gt;&lt;br /&gt;
* Originalsequenz T kann direkt aus BWT regeneriert werden&lt;br /&gt;
''''Last-First Zuordnung''''&amp;lt;br&amp;gt;&lt;br /&gt;
Die 'i'te Position des Buchstaben x in der letzten Spalte (Transformation) entspricht der 'i'ten Position in der 1. Spalte&amp;lt;br&amp;gt;&lt;br /&gt;
Benötigt werden nur die erste und letzte Spalte nach der cyklischen Verschiebung.&amp;lt;br&amp;gt;&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=File:BWT.png&amp;diff=109</id>
		<title>File:BWT.png</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=File:BWT.png&amp;diff=109"/>
		<updated>2019-05-15T22:29:44Z</updated>

		<summary type="html">&lt;p&gt;Vero: Vero uploaded a new version of File:BWT.png&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Cyklische Verschiebung von T&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=4_Burrows-Wheeler&amp;diff=108</id>
		<title>4 Burrows-Wheeler</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=4_Burrows-Wheeler&amp;diff=108"/>
		<updated>2019-05-15T22:29:18Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Auf dieser Seite sind die Themen zusammengeführt, die in Vorlesung 4 am 02.05.2019 behandelt wurden.&lt;br /&gt;
&amp;lt;br&amp;gt;&lt;br /&gt;
== Burrows-Wheeler Transformation ==&lt;br /&gt;
Die Burrows-Wheeler Induzierung wurde in der Informatik ursprünglich zur Optimierung von Daten-Kompression entwickelt.&amp;lt;br&amp;gt;&lt;br /&gt;
Sie eignet sich auch gut zur effizienten Suche großer Texte und somit zur Suche eines optimalen Alignments.&amp;lt;br&amp;gt;&lt;br /&gt;
&amp;lt;br&amp;gt;&lt;br /&gt;
'''Vorteile'''&amp;lt;br&amp;gt;&lt;br /&gt;
* Sehr schnell und verbraucht wenig Speicher&amp;lt;br&amp;gt;&lt;br /&gt;
* Eine Rücktransformation ist Möglich &amp;lt;br&amp;gt;&lt;br /&gt;
* Kein Informationsverlust beim Sortieren&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Transformation === &lt;br /&gt;
Beispiel an der Sequenz T = ACAACG$&amp;lt;br&amp;gt;&lt;br /&gt;
'''1. Generierung aller cyclischen Verschiebungen von T'''&amp;lt;br&amp;gt;&lt;br /&gt;
Die Sequenz wird cyklisch um eine Stelle verschoben, bis die ursprüngliche Sequenz wieder erreicht ist.&amp;lt;br&amp;gt;&lt;br /&gt;
[[File:BWT|thumb|center|Cyklische Rotation]]&lt;br /&gt;
In rot ist die 'Suffix-Array' dargestellt.&lt;br /&gt;
&lt;br /&gt;
'''2. Sortierung'''&amp;lt;br&amp;gt;&lt;br /&gt;
Die Verschiebung von 'T' wird alphabetisch sortiert, dabei hat das Sonderzeichen (in diesem Fall $) den niedrigsten Wert.&amp;lt;br&amp;gt;&lt;br /&gt;
[[File:Bwt sortierung.png|thumb|center|Alphabetische Sortierung]]&lt;br /&gt;
Die letzte Spalte wird als '''Burrows-Wheeler Transformation''' (BWT) bezeichnet.&amp;lt;br&amp;gt;&lt;br /&gt;
ACAACG$ → CC$AAAC&amp;lt;br&amp;gt;&amp;lt;br&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''Eigenschaften der BWT :'''&amp;lt;br&amp;gt;&lt;br /&gt;
* Hat die gleiche Länge, wie die Originalsequenz &amp;lt;br&amp;gt;&lt;br /&gt;
* Originalsequenz T kann direkt aus BWT regeneriert werden&lt;br /&gt;
''''Last-First Zuordnung''''&amp;lt;br&amp;gt;&lt;br /&gt;
Die 'i'te Position des Buchstaben x in der letzten Spalte (Transformation) entspricht der 'i'ten Position in der 1. Spalte&amp;lt;br&amp;gt;&lt;br /&gt;
Benötigt werden nur die erste und letzte Spalte nach der cyklischen Verschiebung.&amp;lt;br&amp;gt;&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=File:Bwt_Cyklische_rotation.png&amp;diff=107</id>
		<title>File:Bwt Cyklische rotation.png</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=File:Bwt_Cyklische_rotation.png&amp;diff=107"/>
		<updated>2019-05-15T22:22:26Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=File:Suche4.png&amp;diff=104</id>
		<title>File:Suche4.png</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=File:Suche4.png&amp;diff=104"/>
		<updated>2019-05-15T21:31:57Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Suche einer Sequenz&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=File:Suche3.png&amp;diff=103</id>
		<title>File:Suche3.png</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=File:Suche3.png&amp;diff=103"/>
		<updated>2019-05-15T21:23:15Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Suche einer Sequenz&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=File:Suche2.png&amp;diff=102</id>
		<title>File:Suche2.png</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=File:Suche2.png&amp;diff=102"/>
		<updated>2019-05-15T21:15:38Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Suche einer Sequenz&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=File:Suche.png&amp;diff=101</id>
		<title>File:Suche.png</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=File:Suche.png&amp;diff=101"/>
		<updated>2019-05-15T21:06:24Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Suche einer Sequenz&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=File:2._Schritt.png&amp;diff=100</id>
		<title>File:2. Schritt.png</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=File:2._Schritt.png&amp;diff=100"/>
		<updated>2019-05-15T20:48:10Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Last-First Zuordnung&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
	<entry>
		<id>http://wiki.bioinfo.nat.tu-bs.de/index.php?title=File:Erster_schritt.png&amp;diff=99</id>
		<title>File:Erster schritt.png</title>
		<link rel="alternate" type="text/html" href="http://wiki.bioinfo.nat.tu-bs.de/index.php?title=File:Erster_schritt.png&amp;diff=99"/>
		<updated>2019-05-15T20:42:59Z</updated>

		<summary type="html">&lt;p&gt;Vero: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Last-First Zuordnung&lt;/div&gt;</summary>
		<author><name>Vero</name></author>
	</entry>
</feed>