9 Biomarker: Difference between revisions
No edit summary |
No edit summary |
||
Line 50: | Line 50: | ||
*<span style="background:#FFCBCB"> FP</span>: False Positive (falsch positiv) → Modell sagt der Patient hat Krebs, obwohl er gesund ist. <br> | *<span style="background:#FFCBCB"> FP</span>: False Positive (falsch positiv) → Modell sagt der Patient hat Krebs, obwohl er gesund ist. <br> | ||
*<span style="background:#FFCBCB"> FN</span>: False Negative (falsch negativ) → Modell sagt 'gesund', obwohl der Patient Krebs hat. <br> | *<span style="background:#FFCBCB"> FN</span>: False Negative (falsch negativ) → Modell sagt 'gesund', obwohl der Patient Krebs hat. <br> | ||
==Testen auf Sensitivität== | |||
Möglichst viele 'Kranke' sollen richtig bestimmt werden. <br> | |||
<math> \text{Sensitivität} = \frac{\text{TP}}{\text{TP + FN}} </math> | |||
* Bei einem perfekten Modell gibt dieses keine falsch negativen Ergebnisse aus. <br> | |||
* Ausgabe 1 = Perfektes Modell, erkennt alle mit Krebs. <br> | |||
* Ausgabe 0 = Schlechtes Modell, erkennt keine mit Krebs. <br> | |||
==Testen auf Spezifität== | |||
Möglichst viele 'Gesunde' sollen richtig bestimmt werden. <br> | |||
<math> \text{Spezifität} = \frac{\text{TN}}{\text{ FP + TN}} </math> | |||
*Entweder hohe Sensitivität oder hohe Spezifität. <br> | |||
* Was besser ist kommt auf die Fragestellung an. <br> | |||
'''Treshold''': <br> | |||
Cutoff-Wert der als Grenzwert festgelegt wird nach dem beurteilt wird, ob der zu bewertende Wert 'krank', oder 'gesund' zugeordnet wird. <br> | |||
'''Beispiel zur Bestimmung des optimalen Treshold''' <br> <br> | |||
{| class="wikitable" | |||
| || || colspan="5" style="text-align:center"| Treshold | |||
|- | |||
! Zustand !! Ausgabe Modell !! 0 !! 0,25 !! 0,45 !! 0,55 !! 0,75 | |||
|- | |||
| krank || 0,5 || style="background:#B9FFC5 " |TP || style="background:#B9FFC5 " |TP || style="background:#B9FFC5 " |TP|| style="background:#FFCBCB| FN || style="background:#FFCBCB| FN | |||
|- | |||
| krank || 0,6 || style="background:#B9FFC5 " | TP || style="background:#B9FFC5 " | TP || style="background:#B9FFC5 " | TP || style="background:#B9FFC5 " | TP|| style="background:#FFCBCB| FN | |||
|- | |||
| krank || 0,2 || style="background:#B9FFC5 " | TP || style="background:#FFCBCB| FN || style="background:#FFCBCB| FN || style="background:#FFCBCB| FN || style="background:#FFCBCB| FN | |||
|- | |||
| krank || 0,56 || style="background:#B9FFC5 " | TP || style="background:#B9FFC5 " | TP|| style="background:#B9FFC5 " | TP || style="background:#B9FFC5 " | TP || style="background:#FFCBCB| FN | |||
|- | |||
| gesund || 0,5 || style="background:#FFCBCB| FP || style="background:#FFCBCB| FP || style="background:#FFCBCB| FP || style="background:#FFCBCB| FP || style="background:#B9FFC5 " | TN | |||
|- | |||
| gesund || 0,1 || style="background:#FFCBCB| FP || style="background:#B9FFC5 " | TN || style="background:#B9FFC5 " | TN || style="background:#B9FFC5 " | TN || style="background:#B9FFC5 " | TN | |||
|- | |||
| gesund || 0,2 || style="background:#FFCBCB| FP || style="background:#B9FFC5 " | TN || style="background:#B9FFC5 " | TN || style="background:#B9FFC5 " | TN || style="background:#B9FFC5 " | TN | |||
|- | |||
| gesund || 0,4 || style="background:#FFCBCB| FP || style="background:#FFCBCB| FP || style="background:#B9FFC5 " | TN || style="background:#B9FFC5 " | TN || style="background:#B9FFC5 " | TN | |||
|} | |||
*Treshold 0 = hohe Sensitivität <br> | |||
*Treshold 0,75 = hohe Spezifität |
Revision as of 00:42, 2 July 2019
Biomarker
Medizinische Biomarker
- Ein Biomarker ist ein messbarer Parameter biologischer Prozesse, der prognostische, oder diagnostische Aussagekraft hat und somit ein Indikator für Krankheiten, oder Umwelteinflüsse ist.
- Charakteristische biologische Merkmale, die objektiv gemessen werden können und auf einen normalen biologischen, oder krankhaften Prozess im Körper hinweisen können.
- Es können Zellen, Gene, Genprodukte, Enzyme, oder Hormone sein.
Wie in der Abbildung oben dargestellt, kann über Einzelwerte keine Aussage getroffen werden, ob der Patient krank oder gesund ist.
→ deswegen bedarf es mehrerer Biomarker
Frage:
Wie kann für einen TPM-Wert vorhergesagt werden, ob es sich um 'Krebs' oder 'gesund' handelt?
Logistische Funktion
[math]\displaystyle{ y = \beta_1 \cdot TPM_{HIF1\alpha} + \beta_0 }[/math]
[math]\displaystyle{ logit_{(P)} = log \frac{P}{1-P} }[/math]
- Damit wird die Wahrscheinlichkeit, dass jemand z.B. Krebs bekommt durch Gegenwahrscheinlichkeit bestimmt.
Biomarkersignatur
Erweiterung für mehrere Gene:
[math]\displaystyle{ P(x) = \frac{1}{e^{-((\beta)_1 \cdot x_1) + ((\beta)_2 \cdot x_1) + .... + (\beta)_n \cdot x_n) + \beta_0)}} }[/math]
Mashine learning
- Ein Modell muss zunächst von einem System erlent werden, dann kann das System eine Aussage treffen, ob z.B. 'krank' oder 'gesund'.
- Parameter [math]\displaystyle{ \beta_1 }[/math] und [math]\displaystyle{ \beta_0 }[/math] können nicht berechnet werden. → Müssen mit Hilfe eines Algorithmus geschätzt werden.
Maximum-Likelihood:
- Schätzung zur Parameterbestimmung.
- Training: Lerndaten sind bekannte Werte zur Aussage 'krank' oder 'gesund'
→ Algorithmus bestimmt einen genauen Wert für [math]\displaystyle{ \beta_1 }[/math], um krank (1) und gesund (0) zu bestimmen.
→ Danach kann mit dem Modell bestimmt werden, ob es gut oder schlecht ist.
- Problem: System versucht einen optimalen Wert zu finden
→ Overfitting: Zu genaue Beschreibung des Modells.
Frage: Wie gut ist die Qualität des Modells?
Receiver Operation Characteristic (ROC)
Wird genutzt um zu prüfen, ob das Modell gut ist.
→ Wie viele falsch positive, falsch negative, aber auch richtig positive und richtig negative Aussagen trifft das Modell?
Mensch | ||||
Krebs | Gesund | |||
Modellvorhersage | Krebs | TP | FP | |
Gesund | FN | TN |
Beispiel 'Krebs' = positiv, 'geund' = negativ
- TP: True Positive (richtig positiv) → Modell sagt 'Krebs' richtig voraus.
- TN: True Negative (richtig negativ) → Modell sagt 'gesund' richtig voraus.
- FP: False Positive (falsch positiv) → Modell sagt der Patient hat Krebs, obwohl er gesund ist.
- FN: False Negative (falsch negativ) → Modell sagt 'gesund', obwohl der Patient Krebs hat.
Testen auf Sensitivität
Möglichst viele 'Kranke' sollen richtig bestimmt werden.
[math]\displaystyle{ \text{Sensitivität} = \frac{\text{TP}}{\text{TP + FN}} }[/math]
- Bei einem perfekten Modell gibt dieses keine falsch negativen Ergebnisse aus.
- Ausgabe 1 = Perfektes Modell, erkennt alle mit Krebs.
- Ausgabe 0 = Schlechtes Modell, erkennt keine mit Krebs.
Testen auf Spezifität
Möglichst viele 'Gesunde' sollen richtig bestimmt werden.
[math]\displaystyle{ \text{Spezifität} = \frac{\text{TN}}{\text{ FP + TN}} }[/math]
- Entweder hohe Sensitivität oder hohe Spezifität.
- Was besser ist kommt auf die Fragestellung an.
Treshold:
Cutoff-Wert der als Grenzwert festgelegt wird nach dem beurteilt wird, ob der zu bewertende Wert 'krank', oder 'gesund' zugeordnet wird.
Beispiel zur Bestimmung des optimalen Treshold
Treshold | ||||||
Zustand | Ausgabe Modell | 0 | 0,25 | 0,45 | 0,55 | 0,75 |
---|---|---|---|---|---|---|
krank | 0,5 | TP | TP | TP | FN | FN |
krank | 0,6 | TP | TP | TP | TP | FN |
krank | 0,2 | TP | FN | FN | FN | FN |
krank | 0,56 | TP | TP | TP | TP | FN |
gesund | 0,5 | FP | FP | FP | FP | TN |
gesund | 0,1 | FP | TN | TN | TN | TN |
gesund | 0,2 | FP | TN | TN | TN | TN |
gesund | 0,4 | FP | FP | TN | TN | TN |
- Treshold 0 = hohe Sensitivität
- Treshold 0,75 = hohe Spezifität