11 BLAST II: Difference between revisions
Line 40: | Line 40: | ||
P = {2^{-S'}} | P = {2^{-S'}} | ||
</math> | </math> | ||
Bitscore = 20 --> <math> P = {1/1.048.576} </math> |
Revision as of 02:03, 5 October 2020
Protein - Protein - BLAST: Liefert eher Ergebnisse, die im Hinblick auf Funktionsebene interessant sind
Dabei wird stets ein E-value zusammen mit dem Ergebnis rausgegeben. Dieses liefert einen Hinweis auf zufälliges Hintergrundrauschen der Suche. Je niedriger de E-value, desto signifikanter ist das Suchergebnis.
Doch wie können nun Ergebnisse einer BLAST Analyse verglichen werden?
Zum Nachlesen von 'E-value' ist das FAQ der BLAST Domain hilfreich: What is the Expect (E) value? https://blast.ncbi.nlm.nih.gov/Blast.cgi?CMD=Web&PAGE_TYPE=BlastDocs&DOC_TYPE=FAQ#expect
Bewertung von BLAST Ergebnissen
Score 'S'
L A S V - E BLOSUM62 gap penalty = -4 L T S L A Q S = +4 0 +4 +1 -4 +2 = 7
Score hängt von der Sequenzlänge, Substitutionsmatrix und 'gap penalty' ab und kann daher nicht direkt verglichen werden
- Lösung: Bit score
- log_2 skalierte Version des normalisierten Scores
- Beschreibt die Größe des Such-Raumes, der zufällig einen Treffer mit gleichem oder besseren Score enthält
Ein Bit score von 20 würde bedeuten, dass ein Such-Raum der Größe 2^20 durchsucht werden müsste, um den Score zufällig zu finden. (2^20 = 1.048.576)
[File:BLAST3.jpeg|200px|center|thumb]]
λ und k sind Karlin-Altschul-Paramter und ergeben sich aus der Scoring-Funktion.
N = n * m
n = Länge der ’query’ Sequenz und m = Länge der Datenbank
Bsp: n=125 m=10.000 N=1.250.000 In diesem Fall würde ein Bit Score von 20 auch durch Zufall gefunden werden
P-Value
P-Value: Wahrscheinlichkeit, dass ein Ergebnis durch Zufall eintritt
S'=Bitscore
[math]\displaystyle{
P = {2^{-S'}}
}[/math]
Bitscore = 20 --> [math]\displaystyle{ P = {1/1.048.576} }[/math]