Glossar
A
Alignment: optimales "aneinander Ausrichten" von Sequenzen
Algorithmus: Verarbeitungsvorschrift, die aus einer endlichen Folge von eindeutig ausführbaren Anweisungen besteht, mit der man eine Vielzahl gleichartiger Aufgaben lösen kann
Assembly: Bioinformatisches Verfahren, bei dem überlappende reads erst zu Contings und anschließend zu Scaffolds zusammengesetzt werden.
B
Benjamini-Hochberg-Prozedur
Bonferroni-Korrektur
Burrows-Wheeler Transformation
C
Contiq: Zusammenhängender Abschnitt einer genomischen Sequenz, die aus überlappenden reads gebildet wird. Zwischen ihnen befinden sich noch Lücken
Coverage: Die Anzahl der reads an einer beliebigen Stelle der Sequenz, die diese abdecken
D
Dynamic programming: Zerlegung eines Problems in viele Unterprobleme, die nacheinander gelöst werden
E
F
FASTA-Format: Allgemeines Format der Sequenzdaten (Protein oder DNA) in Textform gespeichert, festgelegter Aufbau
FASTQ-Format: Textbasierte Methode zur Speicherung einer Sequenz (DNA/RNA). Dabei wird auch die Qualität der sequenzierten Base jeweils in einem ASCII Symbol vermerkt
G
gap penalty: Bewertung von Lücken, die in einem Alignment eingefügt werden
H
I
J
K
L
Lander-Waterman-Modell
Library: Pool von DNA-Fragmenten, der aus einer Probe generiert wurde
M
N
NGS: Next Generation Sequencing, Sammelbegriff für neuartige Sequenziermethoden, die einen höhere Durchsatz besitzen als die klassische Sangermethode. Dies ist möglich, da die Sequenzierungen parallel durchgeführt werden können
Nullhypothese
O
P
Q
R
reads: Aus der RNA-Seq. erhaltene Fragmente sequenzierter RNA. Diese können anschließend einem Refernezgenom zugeordnet werden.
RNASeq: Sequenzierung des gesamten Transkriptoms einer Zelle durch NGS-Methoden. Dazu muss die mRNA durch Reverse Transkriptase in cDNA umgeschrieben werden.
RPKM: Reads per kilobase of transcript per Million mapped reads
S
Scaffold: Einheit von Contiqs und Lücken (auch Supercontiqs genannt), die die Reihenfolge, Orientierung und Größe der Lücken zwischen den Contiqs definiert.
Smith-Waterman Algorithmus
Sequenziertiefe: gibt an, wie oft ein bestimmter Abschnitt eines Genoms sequenziert wurde und bestimmt damit die Empfindlichkeit und Genauigkeit einer Sequenzierung