10 BLAST

From Bioinformatik Wiki
Revision as of 00:15, 5 October 2020 by Pge (talk | contribs)

Suche nach homologen Sequencen in Datenbanken

Biologische Fragestellung: Eine humane Aminosäuresequenz (416 AS) mit bislang unbekannter Funktion soll mit dem E. Coli Proteom verglichen werden, um eventuell Schlussfolgerungen auf Aufbau und Funktion ziehen zu können.

Das E. Coli Proteom besteht aus 4300 Proteinen, die jeweils ca. 300 AS lang sind

Matrixgröße für Smith-Waterman : 4300 * 300 * 416 = 536164000000 (5,4 * 10^11)
mit 4 Byte --> 2.1 GB Speicher (Also sehr datenlastig und rechenintensiv)


Vorteil: Weniger Rechenintensiv und deswegen können auch zwangsläufig größere Datenmengen durchsucht werden
Nachteil: Produziert nicht nur optimale Ergebnisse, da zwangsläufig Kompromisse & Vereinfachungen bei den Parametern eingegangen werden müssen, da das Ergebnis der Suche naturgemäß nicht bekannt sein kann

Substitutionsmatritzen

Eine Sustitutionsmatrix basiert auf der Annahme, dass eine relative Rate gibt, in der eine Aminosäure im Laufe der Evolution in eine andere mutiert. So können innerhalb eines Proteins viele Aminosäuren ausgetauscht werden, ohne dass sich dadurch die Eigenschaften des Proteins ändert. Die ist vor allem deswegen erklärbar, weil viele Aminosäuren ähnliche chemische Eigenschaften, funktionelle Gruppen etc. besitzen. Umgekehrt kann eine einzige mutierte Aminosäure, wenn sie erheblich andere Eigenschaften hat, das ganze Protein verändern (Wie es im Negativbeispiel bei Erbkrankheiten oft der Fall ist) .

Es ist nun also möglich hier Annahmen zu treffen wie wahrscheinlich eine Austausch ist. Dabei wird der Score jetzt nun nicht mehr nur match/mismatch entschieden, sondern um eine Interpretationsebene erweitert, indem bei der Score je nach AS-Kombination festgelegt wird. Durch die Verwendung unterschiedlicher Matrizen und Parameter können damit Kompromisse und Vereinfachungen eingegangen werden.

Nachlesen Substitutionsmatrix: https://de.wikipedia.org/wiki/Substitutionsmatrix

Beispiele Aminosäuren

BLOSUM62 MATRIX.png