Glossar

From Bioinformatik Wiki

A

Alignment: optimales "aneinander Ausrichten" von Sequenzen
Algorithmus: Verarbeitungsvorschrift, die aus einer endlichen Folge von eindeutig ausführbaren Anweisungen besteht, mit der man eine Vielzahl gleichartiger Aufgaben lösen kann
Assembly: Bioinformatisches Verfahren, bei dem überlappende reads erst zu Contings und anschließend zu Scaffolds zusammengesetzt werden.

B

Benjamini-Hochberg-Prozedur
Bonferroni-Korrektur
Burrows-Wheeler Transformation

C

Contiq: Zusammenhängender Abschnitt einer genomischen Sequenz, die aus überlappenden reads gebildet wird. Zwischen ihnen befinden sich noch Lücken
Coverage: Die Anzahl der reads an einer beliebigen Stelle der Sequenz, die diese abdecken

D

Dynamic programming: Zerlegung eines Problems in viele Unterprobleme, die nacheinander gelöst werden

E

F

FASTA-Format: Allgemeines Format der Sequenzdaten (Protein oder DNA) in Textform gespeichert, festgelegter Aufbau
FASTQ-Format: Textbasierte Methode zur Speicherung einer Sequenz (DNA/RNA). Dabei wird auch die Qualität der sequenzierten Base jeweils in einem ASCII Symbol vermerkt

G

gap penalty: Bewertung von Lücken, die in einem Alignment eingefügt werden

H

I

Illumina

J

K

L

Lander-Waterman-Modell
Library: Pool von DNA-Fragmenten, der aus einer Probe generiert wurde

M

Microarrays

N

NGS: Next Generation Sequencing, Sammelbegriff für neuartige Sequenziermethoden, die einen höhere Durchsatz besitzen als die klassische Sangermethode. Dies ist möglich, da die Sequenzierungen parallel durchgeführt werden können
Nullhypothese

O

P

p-value

Q

R

reads: Aus der RNA-Seq. erhaltene Fragmente sequenzierter RNA. Diese können anschließend einem Refernezgenom zugeordnet werden.
RNASeq: Sequenzierung des gesamten Transkriptoms einer Zelle durch NGS-Methoden. Dazu muss die mRNA durch Reverse Transkriptase in cDNA umgeschrieben werden.
ROC: steht für Receiver Operating Characteristik. Es ist ein statistisches Verfahren, mit dem die Aussagekraft von Laborparametern optimiert und verglichen werden kann. Dabei wird durch die Bestimmung der Sensitivität und Spezifität der optimale Threshold bestimmt. Dies geschieht mittels der Grenzwertoptimierungskurve (ROC- Kurve).
RPKM: Reads per kilobase of transcript per Million mapped reads

S

Scaffold: Einheit von Contiqs und Lücken (auch Supercontiqs genannt), die die Reihenfolge, Orientierung und Größe der Lücken zwischen den Contiqs definiert.
Smith-Waterman Algorithmus
Sequenziertiefe: gibt an, wie oft ein bestimmter Abschnitt eines Genoms sequenziert wurde und bestimmt damit die Empfindlichkeit und Genauigkeit einer Sequenzierung

T

t-Test
TMM
TPM
Transkriptom

U

V

W

X

Y

Z