9 Biomarker: Difference between revisions
No edit summary |
No edit summary |
||
Line 67: | Line 67: | ||
{| class="wikitable" | {| class="wikitable" | ||
| || || colspan="5" style="text-align:center"| Treshold | | || || || colspan="5" style="text-align:center"| Treshold | ||
|- | |- | ||
! Zustand !! Ausgabe Modell !! 0 !! 0,25 !! 0,45 !! 0,55 !! 0,75 | ! Zustand !! Ausgabe Modell !! 0 !! 0,25 !! 0,45 !! 0,55 !! 0,75 | ||
Line 88: | Line 88: | ||
|} | |} | ||
*Treshold 0 = hohe Sensitivität <br> | *Treshold 0 = hohe Sensitivität <br> | ||
*Treshold 0,75 = hohe Spezifität | *Treshold 0,75 = hohe Spezifität <br> | ||
==Area Under the Curve== | |||
{| class="wikitable" | |||
| || || colspan="5" style="text-align:center"| Treshold | |||
|- | |||
! !! !! 0 !! 0,25 !! 0,45 !! 0,55 !! 0,75 | |||
|- | |||
| Sensitivitätt || <math>\frac{\text{TP}}{\text{TP + FN}} </math> || style="background:#FFAA00 | 1 || style="background:#FFFF40 | 0,75 || style="background:#B3B7FF | 0,75 || style="background:#FFCBCB| 0,5 || style="background:#B9FFC5 "| 0 | |||
|- | |||
| Spezifität || <math>\frac{\text{TN}}{\text{ FP + TN}} </math> || style="background:#FFAA00 | 0 || style="background:#FFFF40 |0,5 || style="background:#B3B7FF | 0,75 || style="background:#FFCBCB| 1 || style="background:#B9FFC5 "| 1 | |||
|} | |||
[[File:VL8 AUC.png|mini|500px]] | |||
*1 = optimal <br> | |||
*0 = auch gut, positiv und negativ müssen nur umgedreht werden <br> | |||
*0,5 = schlecht, da die Bestimmung des Systems durch Zufall erfolgt |
Revision as of 01:29, 2 July 2019
Biomarker
Medizinische Biomarker
- Ein Biomarker ist ein messbarer Parameter biologischer Prozesse, der prognostische, oder diagnostische Aussagekraft hat und somit ein Indikator für Krankheiten, oder Umwelteinflüsse ist.
- Charakteristische biologische Merkmale, die objektiv gemessen werden können und auf einen normalen biologischen, oder krankhaften Prozess im Körper hinweisen können.
- Es können Zellen, Gene, Genprodukte, Enzyme, oder Hormone sein.
Wie in der Abbildung oben dargestellt, kann über Einzelwerte keine Aussage getroffen werden, ob der Patient krank oder gesund ist.
→ deswegen bedarf es mehrerer Biomarker
Frage:
Wie kann für einen TPM-Wert vorhergesagt werden, ob es sich um 'Krebs' oder 'gesund' handelt?
Logistische Funktion
[math]\displaystyle{ y = \beta_1 \cdot TPM_{HIF1\alpha} + \beta_0 }[/math]
[math]\displaystyle{ logit_{(P)} = log \frac{P}{1-P} }[/math]
- Damit wird die Wahrscheinlichkeit, dass jemand z.B. Krebs bekommt durch Gegenwahrscheinlichkeit bestimmt.
Biomarkersignatur
Erweiterung für mehrere Gene:
[math]\displaystyle{ P(x) = \frac{1}{e^{-((\beta)_1 \cdot x_1) + ((\beta)_2 \cdot x_1) + .... + (\beta)_n \cdot x_n) + \beta_0)}} }[/math]
Mashine learning
- Ein Modell muss zunächst von einem System erlent werden, dann kann das System eine Aussage treffen, ob z.B. 'krank' oder 'gesund'.
- Parameter [math]\displaystyle{ \beta_1 }[/math] und [math]\displaystyle{ \beta_0 }[/math] können nicht berechnet werden. → Müssen mit Hilfe eines Algorithmus geschätzt werden.
Maximum-Likelihood:
- Schätzung zur Parameterbestimmung.
- Training: Lerndaten sind bekannte Werte zur Aussage 'krank' oder 'gesund'
→ Algorithmus bestimmt einen genauen Wert für [math]\displaystyle{ \beta_1 }[/math], um krank (1) und gesund (0) zu bestimmen.
→ Danach kann mit dem Modell bestimmt werden, ob es gut oder schlecht ist.
- Problem: System versucht einen optimalen Wert zu finden
→ Overfitting: Zu genaue Beschreibung des Modells.
Frage: Wie gut ist die Qualität des Modells?
Receiver Operation Characteristic (ROC)
Wird genutzt um zu prüfen, ob das Modell gut ist.
→ Wie viele falsch positive, falsch negative, aber auch richtig positive und richtig negative Aussagen trifft das Modell?
Mensch | ||||
Krebs | Gesund | |||
Modellvorhersage | Krebs | TP | FP | |
Gesund | FN | TN |
Beispiel 'Krebs' = positiv, 'geund' = negativ
- TP: True Positive (richtig positiv) → Modell sagt 'Krebs' richtig voraus.
- TN: True Negative (richtig negativ) → Modell sagt 'gesund' richtig voraus.
- FP: False Positive (falsch positiv) → Modell sagt der Patient hat Krebs, obwohl er gesund ist.
- FN: False Negative (falsch negativ) → Modell sagt 'gesund', obwohl der Patient Krebs hat.
Testen auf Sensitivität
Möglichst viele 'Kranke' sollen richtig bestimmt werden.
[math]\displaystyle{ \text{Sensitivität} = \frac{\text{TP}}{\text{TP + FN}} }[/math]
- Bei einem perfekten Modell gibt dieses keine falsch negativen Ergebnisse aus.
- Ausgabe 1 = Perfektes Modell, erkennt alle mit Krebs.
- Ausgabe 0 = Schlechtes Modell, erkennt keine mit Krebs.
Testen auf Spezifität
Möglichst viele 'Gesunde' sollen richtig bestimmt werden.
[math]\displaystyle{ \text{Spezifität} = \frac{\text{TN}}{\text{ FP + TN}} }[/math]
- Entweder hohe Sensitivität oder hohe Spezifität.
- Was besser ist kommt auf die Fragestellung an.
Treshold:
Cutoff-Wert der als Grenzwert festgelegt wird nach dem beurteilt wird, ob der zu bewertende Wert 'krank', oder 'gesund' zugeordnet wird.
Beispiel zur Bestimmung des optimalen Treshold
Treshold | |||||||
Zustand | Ausgabe Modell | 0 | 0,25 | 0,45 | 0,55 | 0,75 | |
---|---|---|---|---|---|---|---|
krank | 0,5 | TP | TP | TP | FN | FN | |
krank | 0,6 | TP | TP | TP | TP | FN | |
krank | 0,2 | TP | FN | FN | FN | FN | |
krank | 0,56 | TP | TP | TP | TP | FN | |
gesund | 0,5 | FP | FP | FP | FP | TN | |
gesund | 0,1 | FP | TN | TN | TN | TN | |
gesund | 0,2 | FP | TN | TN | TN | TN | |
gesund | 0,4 | FP | FP | TN | TN | TN |
- Treshold 0 = hohe Sensitivität
- Treshold 0,75 = hohe Spezifität
Area Under the Curve
Treshold | ||||||
0 | 0,25 | 0,45 | 0,55 | 0,75 | ||
---|---|---|---|---|---|---|
Sensitivitätt | [math]\displaystyle{ \frac{\text{TP}}{\text{TP + FN}} }[/math] | 1 | 0,75 | 0,75 | 0,5 | 0 |
Spezifität | [math]\displaystyle{ \frac{\text{TN}}{\text{ FP + TN}} }[/math] | 0 | 0,5 | 0,75 | 1 | 1 |
- 1 = optimal
- 0 = auch gut, positiv und negativ müssen nur umgedreht werden
- 0,5 = schlecht, da die Bestimmung des Systems durch Zufall erfolgt