9 Biomarker

From Bioinformatik Wiki
Revision as of 02:31, 2 July 2019 by Vero (talk | contribs)

Biomarker

Medizinische Biomarker

  • Ein Biomarker ist ein messbarer Parameter biologischer Prozesse, der prognostische, oder diagnostische Aussagekraft hat und somit ein Indikator für Krankheiten, oder Umwelteinflüsse ist.
  • Charakteristische biologische Merkmale, die objektiv gemessen werden können und auf einen normalen biologischen, oder krankhaften Prozess im Körper hinweisen können.
  • Es können Zellen, Gene, Genprodukte, Enzyme, oder Hormone sein.

mini Wie in der Abbildung oben dargestellt, kann über Einzelwerte keine Aussage getroffen werden, ob der Patient krank oder gesund ist.
→ deswegen bedarf es mehrerer Biomarker

Frage:
Wie kann für einen TPM-Wert vorhergesagt werden, ob es sich um 'Krebs' oder 'gesund' handelt?

Logistische Funktion

[math]\displaystyle{ y = \beta_1 \cdot TPM_{HIF1\alpha} + \beta_0 }[/math]

[math]\displaystyle{ logit_{(P)} = log \frac{P}{1-P} }[/math]

  • Damit wird die Wahrscheinlichkeit, dass jemand z.B. Krebs bekommt durch Gegenwahrscheinlichkeit bestimmt.

WIRD NOCH FERTIG GEMACHT

Biomarkersignatur

Erweiterung für mehrere Gene:

[math]\displaystyle{ P(x) = \frac{1}{e^{-((\beta)_1 \cdot x_1) + ((\beta)_2 \cdot x_1) + .... + (\beta)_n \cdot x_n) + \beta_0)}} }[/math]
Mashine learning

  • Ein Modell muss zunächst von einem System erlent werden, dann kann das System eine Aussage treffen, ob z.B. 'krank' oder 'gesund'.
  • Parameter [math]\displaystyle{ \beta_1 }[/math] und [math]\displaystyle{ \beta_0 }[/math] können nicht berechnet werden. → Müssen mit Hilfe eines Algorithmus geschätzt werden.

Maximum-Likelihood:

  • Schätzung zur Parameterbestimmung.
  • Training: Lerndaten sind bekannte Werte zur Aussage 'krank' oder 'gesund'

→ Algorithmus bestimmt einen genauen Wert für [math]\displaystyle{ \beta_1 }[/math], um krank (1) und gesund (0) zu bestimmen.
→ Danach kann mit dem Modell bestimmt werden, ob es gut oder schlecht ist.

  • Problem: System versucht einen optimalen Wert zu finden

Overfitting: Zu genaue Beschreibung des Modells.

Frage: Wie gut ist die Qualität des Modells?

Receiver Operation Characteristic (ROC)

Wird genutzt um zu prüfen, ob das Modell gut ist.
→ Wie viele falsch positive, falsch negative, aber auch richtig positive und richtig negative Aussagen trifft das Modell?

Mensch
Krebs Gesund
Modellvorhersage Krebs TP FP
Gesund FN TN

Beispiel 'Krebs' = positiv, 'geund' = negativ

  • TP: True Positive (richtig positiv) → Modell sagt 'Krebs' richtig voraus.
  • TN: True Negative (richtig negativ) → Modell sagt 'gesund' richtig voraus.
  • FP: False Positive (falsch positiv) → Modell sagt der Patient hat Krebs, obwohl er gesund ist.
  • FN: False Negative (falsch negativ) → Modell sagt 'gesund', obwohl der Patient Krebs hat.

Testen auf Sensitivität

Möglichst viele 'Kranke' sollen richtig bestimmt werden.
[math]\displaystyle{ \text{Sensitivität} = \frac{\text{TP}}{\text{TP + FN}} }[/math]

  • Bei einem perfekten Modell gibt dieses keine falsch negativen Ergebnisse aus.
  • Ausgabe 1 = Perfektes Modell, erkennt alle mit Krebs.
  • Ausgabe 0 = Schlechtes Modell, erkennt keine mit Krebs.

Testen auf Spezifität

Möglichst viele 'Gesunde' sollen richtig bestimmt werden.
[math]\displaystyle{ \text{Spezifität} = \frac{\text{TN}}{\text{ FP + TN}} }[/math]

  • Entweder hohe Sensitivität oder hohe Spezifität.
  • Was besser ist kommt auf die Fragestellung an.

Treshold:
Cutoff-Wert der als Grenzwert festgelegt wird nach dem beurteilt wird, ob der zu bewertende Wert 'krank', oder 'gesund' zugeordnet wird.
Beispiel zur Bestimmung des optimalen Treshold

Treshold
Zustand Ausgabe Modell 0 0,25 0,45 0,55 0,75
krank 0,5 TP TP TP FN FN
krank 0,6 TP TP TP TP FN
krank 0,2 TP FN FN FN FN
krank 0,56 TP TP TP TP FN
gesund 0,5 FP FP FP FP TN
gesund 0,1 FP TN TN TN TN
gesund 0,2 FP TN TN TN TN
gesund 0,4 FP FP TN TN TN
  • Treshold 0 = hohe Sensitivität
  • Treshold 0,75 = hohe Spezifität

Area Under the Curve

Treshold
0 0,25 0,45 0,55 0,75
Sensitivitätt [math]\displaystyle{ \frac{\text{TP}}{\text{TP + FN}} }[/math] 1 0,75 0,75 0,5 0
Spezifität [math]\displaystyle{ \frac{\text{TN}}{\text{ FP + TN}} }[/math] 0 0,5 0,75 1 1

mini

  • 1 = optimal
  • 0 = auch gut, positiv und negativ müssen nur umgedreht werden
  • 0,5 = schlecht, da die Bestimmung des Systems durch Zufall erfolgt