3 Alignments: Difference between revisions

From Bioinformatik Wiki
Line 1: Line 1:


= Alignments =
= Sequenzalignment =
Das optimale „Aneinander ausrichten“ von Sequenzen, sodass z.B. reads aus einer Sequenzierung an ein Referenzgenom ausgerichtet werden können.
Das optimale „Aneinander ausrichten“ von Sequenzen, sodass z.B. reads aus einer Sequenzierung an ein Referenzgenom ausgerichtet werden können. <br>
Es gibt enorm viele Möglichkeiten eine Sequenz an eine andere zu Assemblieren. Deshalb benötigt man speziell Algorithmen, die die besten Möglichkeiten finden. Um zu bestimmen welches Alignment das beste ist, wird ein Bewertungsschema, der sogenannte Score, angewandt. So kann die Übereinstimmung zweier Sequenzen miteinander quantitativ (mit Zahlen) verglichen werden. Zudem ermöglicht das Sequenzalignment die Erkennung ähnlicher Domänen und erfordert das Einfügen von gaps (s. Smith-Waterman).  


→ Für ein Alignment werden spezielle Algorithmen benötigt.
Man unterscheidet zwei verschiedenen Arten beim Sequenzalignment:
<br>
<br>
<u>Sequenz Alignments</u>
* Ähnlichkeit quantitativ bestimmbar
* Erkennung ähnlicher Domänen
* erfordert das Einfügen von "gaps"


== Globales Alignment ==
== Globales Alignment ==
* Ausrichtung auf die gleiche Länge
* Alignment zwischen zwei Sequenzen, die ähnlich lang sind und bei denen starke Sequenzhomologien erwartet werden
* Vergleich von Gesamtsequenzen
* alle Symbole werden berücksichtigt
* alle Symbole werden berücksichtigt
* Vergleich ähnlicher Sequenzen mit ähnlicher Länge
* zur Berechnung des optimalen Alignment Scores wird häufig der Needle-Wunsch Algorithmus benutzt
 
 
<br>
<br>
'''Beispiel''':<br>
'''Beispiel''':<br>
Line 45: Line 43:
* Alignment von Teilsequenzen
* Alignment von Teilsequenzen
* Vergleich zweier sehr unterschiedlicher Sequenzen, die aber gleiche Motive besitzen
* Vergleich zweier sehr unterschiedlicher Sequenzen, die aber gleiche Motive besitzen
*Suche einer Gensequenz im Genom
* z.B. die Suche einer Gensequenz im Genom
<br>
<br>
Beispiel:<br>
Beispiel:<br>

Revision as of 18:41, 21 September 2021

Sequenzalignment

Das optimale „Aneinander ausrichten“ von Sequenzen, sodass z.B. reads aus einer Sequenzierung an ein Referenzgenom ausgerichtet werden können.
Es gibt enorm viele Möglichkeiten eine Sequenz an eine andere zu Assemblieren. Deshalb benötigt man speziell Algorithmen, die die besten Möglichkeiten finden. Um zu bestimmen welches Alignment das beste ist, wird ein Bewertungsschema, der sogenannte Score, angewandt. So kann die Übereinstimmung zweier Sequenzen miteinander quantitativ (mit Zahlen) verglichen werden. Zudem ermöglicht das Sequenzalignment die Erkennung ähnlicher Domänen und erfordert das Einfügen von gaps (s. Smith-Waterman).

Man unterscheidet zwei verschiedenen Arten beim Sequenzalignment:

Globales Alignment

  • Alignment zwischen zwei Sequenzen, die ähnlich lang sind und bei denen starke Sequenzhomologien erwartet werden
  • Vergleich von Gesamtsequenzen
  • alle Symbole werden berücksichtigt
  • zur Berechnung des optimalen Alignment Scores wird häufig der Needle-Wunsch Algorithmus benutzt



Beispiel:

H A U S   K L A U S
H - A U S   - H A U S
K L A U S   K L A U S
Score 8   Score 8


Bewertungsschema:

S(a,b)={3 a=b match ;0 a≠b mismatch

gaps: S(a,-)=-1 Deletion
  S(-,b)=-1 Insertion

Lokales Alignment

  • Alignment von Teilsequenzen
  • Vergleich zweier sehr unterschiedlicher Sequenzen, die aber gleiche Motive besitzen
  • z.B. die Suche einer Gensequenz im Genom


Beispiel:

A T G C A T T A C
      C T T T A  

Smith-Waterman Algorithmus

Dynamic programming: "divide and conquer", Aufteilen des Problems in Subprobleme

M0,0=0
M0,j=0
Mk,0=0
Smith Waterman Algorithmus.jpg

Das Alignment beginnt bei dem höchsten erzielten Score in der Matrix

Score: Match: +3 | Mismatch: 0 | Gap: -1

Smith Waterman.jpg