11 BLAST II: Difference between revisions

From Bioinformatik Wiki
Line 38: Line 38:
  S'=Bitscore
  S'=Bitscore
  <math>
  <math>
       P = {2^-S'}   
       P = {2^{-S'}}   
</math>
</math>

Revision as of 02:02, 5 October 2020

Protein - Protein - BLAST: Liefert eher Ergebnisse, die im Hinblick auf Funktionsebene interessant sind

Dabei wird stets ein E-value zusammen mit dem Ergebnis rausgegeben. Dieses liefert einen Hinweis auf zufälliges Hintergrundrauschen der Suche. Je niedriger de E-value, desto signifikanter ist das Suchergebnis.

Doch wie können nun Ergebnisse einer BLAST Analyse verglichen werden?

Zum Nachlesen von 'E-value' ist das FAQ der BLAST Domain hilfreich: What is the Expect (E) value? https://blast.ncbi.nlm.nih.gov/Blast.cgi?CMD=Web&PAGE_TYPE=BlastDocs&DOC_TYPE=FAQ#expect

Bewertung von BLAST Ergebnissen

Score 'S'

     L  A  S  V  -  E            BLOSUM62 gap penalty = -4     
     L  T  S  L  A  Q
S = +4  0 +4 +1 -4 +2 = 7

Score hängt von der Sequenzlänge, Substitutionsmatrix und 'gap penalty' ab und kann daher nicht direkt verglichen werden

  • Lösung: Bit score
  • log_2 skalierte Version des normalisierten Scores
  • Beschreibt die Größe des Such-Raumes, der zufällig einen Treffer mit gleichem oder besseren Score enthält
Ein Bit score von 20 würde bedeuten, dass ein Such-Raum der Größe 2^20 durchsucht werden müsste, um den Score zufällig zu finden. (2^20 = 1.048.576)

[File:BLAST3.jpeg|200px|center|thumb]]
λ und k sind Karlin-Altschul-Paramter und ergeben sich aus der Scoring-Funktion.

N = n * m 
n = Länge der ’query’ Sequenz und m = Länge der Datenbank


Bsp: n=125        m=10.000          N=1.250.000
In diesem Fall würde ein Bit Score von 20 auch durch Zufall gefunden werden


P-Value

P-Value: Wahrscheinlichkeit, dass ein Ergebnis durch Zufall eintritt

S'=Bitscore
[math]\displaystyle{ 
       P = {2^{-S'}}  
 }[/math]