9 Biomarker: Difference between revisions

From Bioinformatik Wiki
No edit summary
No edit summary
Line 50: Line 50:
*<span style="background:#FFCBCB"> FP</span>: False Positive (falsch positiv) → Modell sagt der Patient hat Krebs, obwohl er gesund ist. <br>
*<span style="background:#FFCBCB"> FP</span>: False Positive (falsch positiv) → Modell sagt der Patient hat Krebs, obwohl er gesund ist. <br>
*<span style="background:#FFCBCB"> FN</span>: False Negative (falsch negativ) → Modell sagt 'gesund', obwohl der Patient Krebs hat. <br>
*<span style="background:#FFCBCB"> FN</span>: False Negative (falsch negativ) → Modell sagt 'gesund', obwohl der Patient Krebs hat. <br>
==Testen auf Sensitivität==
Möglichst viele 'Kranke' sollen richtig bestimmt werden. <br>
<math> \text{Sensitivität} = \frac{\text{TP}}{\text{TP + FN}} </math>
* Bei einem perfekten Modell gibt dieses keine falsch negativen Ergebnisse aus. <br>
* Ausgabe 1 = Perfektes Modell, erkennt alle mit Krebs. <br>
* Ausgabe 0 = Schlechtes Modell, erkennt keine mit Krebs. <br>
==Testen auf Spezifität==
Möglichst viele 'Gesunde' sollen richtig bestimmt werden. <br>
<math> \text{Spezifität} = \frac{\text{TN}}{\text{ FP + TN}} </math>
*Entweder hohe Sensitivität oder hohe Spezifität. <br>
* Was besser ist kommt auf die Fragestellung an. <br>
'''Treshold''': <br>
Cutoff-Wert der als Grenzwert festgelegt wird nach dem beurteilt wird, ob der zu bewertende Wert 'krank', oder 'gesund' zugeordnet wird. <br>
'''Beispiel zur Bestimmung des optimalen Treshold''' <br> <br>
{| class="wikitable"
| || || colspan="5" style="text-align:center"| Treshold
|-
!  Zustand !!  Ausgabe Modell !! 0 !! 0,25 !! 0,45 !! 0,55 !! 0,75
|-
| krank || 0,5 || style="background:#B9FFC5 " |TP || style="background:#B9FFC5 " |TP || style="background:#B9FFC5 " |TP|| style="background:#FFCBCB| FN || style="background:#FFCBCB| FN
|-
| krank || 0,6 || style="background:#B9FFC5 " | TP || style="background:#B9FFC5 " | TP || style="background:#B9FFC5 " | TP || style="background:#B9FFC5 " | TP|| style="background:#FFCBCB| FN
|-
| krank || 0,2 || style="background:#B9FFC5 " | TP || style="background:#FFCBCB| FN || style="background:#FFCBCB| FN || style="background:#FFCBCB| FN || style="background:#FFCBCB| FN
|-
| krank || 0,56 || style="background:#B9FFC5 " | TP || style="background:#B9FFC5 " | TP|| style="background:#B9FFC5 " | TP || style="background:#B9FFC5 " | TP || style="background:#FFCBCB|  FN
|-
| gesund || 0,5 || style="background:#FFCBCB|  FP || style="background:#FFCBCB| FP || style="background:#FFCBCB|  FP || style="background:#FFCBCB|  FP || style="background:#B9FFC5 " | TN
|-
| gesund || 0,1 || style="background:#FFCBCB| FP || style="background:#B9FFC5 " | TN || style="background:#B9FFC5 " | TN || style="background:#B9FFC5 " | TN || style="background:#B9FFC5 " | TN
|-
| gesund || 0,2 || style="background:#FFCBCB| FP || style="background:#B9FFC5 " | TN || style="background:#B9FFC5 " | TN || style="background:#B9FFC5 " | TN || style="background:#B9FFC5 " | TN
|-
| gesund || 0,4 || style="background:#FFCBCB| FP || style="background:#FFCBCB|  FP || style="background:#B9FFC5 " | TN || style="background:#B9FFC5 " | TN  || style="background:#B9FFC5 " | TN
|}
*Treshold 0 = hohe Sensitivität <br>
*Treshold 0,75 = hohe Spezifität

Revision as of 01:42, 2 July 2019

Biomarker

Medizinische Biomarker

  • Ein Biomarker ist ein messbarer Parameter biologischer Prozesse, der prognostische, oder diagnostische Aussagekraft hat und somit ein Indikator für Krankheiten, oder Umwelteinflüsse ist.
  • Charakteristische biologische Merkmale, die objektiv gemessen werden können und auf einen normalen biologischen, oder krankhaften Prozess im Körper hinweisen können.
  • Es können Zellen, Gene, Genprodukte, Enzyme, oder Hormone sein.

mini Wie in der Abbildung oben dargestellt, kann über Einzelwerte keine Aussage getroffen werden, ob der Patient krank oder gesund ist.
→ deswegen bedarf es mehrerer Biomarker

Frage:
Wie kann für einen TPM-Wert vorhergesagt werden, ob es sich um 'Krebs' oder 'gesund' handelt?

Logistische Funktion

[math]\displaystyle{ y = \beta_1 \cdot TPM_{HIF1\alpha} + \beta_0 }[/math]

[math]\displaystyle{ logit_{(P)} = log \frac{P}{1-P} }[/math]

  • Damit wird die Wahrscheinlichkeit, dass jemand z.B. Krebs bekommt durch Gegenwahrscheinlichkeit bestimmt.

Biomarkersignatur

Erweiterung für mehrere Gene:

[math]\displaystyle{ P(x) = \frac{1}{e^{-((\beta)_1 \cdot x_1) + ((\beta)_2 \cdot x_1) + .... + (\beta)_n \cdot x_n) + \beta_0)}} }[/math]
Mashine learning

  • Ein Modell muss zunächst von einem System erlent werden, dann kann das System eine Aussage treffen, ob z.B. 'krank' oder 'gesund'.
  • Parameter [math]\displaystyle{ \beta_1 }[/math] und [math]\displaystyle{ \beta_0 }[/math] können nicht berechnet werden. → Müssen mit Hilfe eines Algorithmus geschätzt werden.

Maximum-Likelihood:

  • Schätzung zur Parameterbestimmung.
  • Training: Lerndaten sind bekannte Werte zur Aussage 'krank' oder 'gesund'

→ Algorithmus bestimmt einen genauen Wert für [math]\displaystyle{ \beta_1 }[/math], um krank (1) und gesund (0) zu bestimmen.
→ Danach kann mit dem Modell bestimmt werden, ob es gut oder schlecht ist.

  • Problem: System versucht einen optimalen Wert zu finden

Overfitting: Zu genaue Beschreibung des Modells.

Frage: Wie gut ist die Qualität des Modells?

Receiver Operation Characteristic (ROC)

Wird genutzt um zu prüfen, ob das Modell gut ist.
→ Wie viele falsch positive, falsch negative, aber auch richtig positive und richtig negative Aussagen trifft das Modell?

Mensch
Krebs Gesund
Modellvorhersage Krebs TP FP
Gesund FN TN

Beispiel 'Krebs' = positiv, 'geund' = negativ

  • TP: True Positive (richtig positiv) → Modell sagt 'Krebs' richtig voraus.
  • TN: True Negative (richtig negativ) → Modell sagt 'gesund' richtig voraus.
  • FP: False Positive (falsch positiv) → Modell sagt der Patient hat Krebs, obwohl er gesund ist.
  • FN: False Negative (falsch negativ) → Modell sagt 'gesund', obwohl der Patient Krebs hat.

Testen auf Sensitivität

Möglichst viele 'Kranke' sollen richtig bestimmt werden.
[math]\displaystyle{ \text{Sensitivität} = \frac{\text{TP}}{\text{TP + FN}} }[/math]

  • Bei einem perfekten Modell gibt dieses keine falsch negativen Ergebnisse aus.
  • Ausgabe 1 = Perfektes Modell, erkennt alle mit Krebs.
  • Ausgabe 0 = Schlechtes Modell, erkennt keine mit Krebs.

Testen auf Spezifität

Möglichst viele 'Gesunde' sollen richtig bestimmt werden.
[math]\displaystyle{ \text{Spezifität} = \frac{\text{TN}}{\text{ FP + TN}} }[/math]

  • Entweder hohe Sensitivität oder hohe Spezifität.
  • Was besser ist kommt auf die Fragestellung an.

Treshold:
Cutoff-Wert der als Grenzwert festgelegt wird nach dem beurteilt wird, ob der zu bewertende Wert 'krank', oder 'gesund' zugeordnet wird.
Beispiel zur Bestimmung des optimalen Treshold

Treshold
Zustand Ausgabe Modell 0 0,25 0,45 0,55 0,75
krank 0,5 TP TP TP FN FN
krank 0,6 TP TP TP TP FN
krank 0,2 TP FN FN FN FN
krank 0,56 TP TP TP TP FN
gesund 0,5 FP FP FP FP TN
gesund 0,1 FP TN TN TN TN
gesund 0,2 FP TN TN TN TN
gesund 0,4 FP FP TN TN TN
  • Treshold 0 = hohe Sensitivität
  • Treshold 0,75 = hohe Spezifität