1 Datenbanken

From Bioinformatik Wiki


Biologisches Problem

Das Biologische Problem wurde hierbei am Beispiel des Gens NAT8L, welches im Krebsmetabolismus eine Rolle spielt, bearbeitet. In diesem Beispiel kann man Tumorzellen charakterisieren indem man ihr NAT8L-Expressionslevel durch eine Tranksriptomanalyse herausfindet. Dafür kann man Methoden wie RNAseq oder Microarrays verwenden. Alternativ kann man in diesem Beispiel auch in einer Datenbank nach Expressionsdaten in Tumorgewebe dieser Art nachschlagen und somit das Experiment umgehen.

Microarrays

Die Methode der Microarrays wurde als Möglichkeit vorgestellt die Transkriptomaktivität zweier Proben zu bestimmen.

RNAseq

Die RNAseq wurde als weitere Methode zur Transkriptomsbestimmung vorgestellt.

Vergleich RNAseq - Microarrays

Vor- und Nachteile von Microarrays und RNAseq wurden gegeneinander abgewogen um die Methoden besser kennenzulernen.

Datenbanken

Verschiedene Datenbanken wurden als Ressourcen vorgestellt, welche zum Vergleich und zur Vorhersage von Daten verwendet werden können.

Dabei wird zwischen primären und sekundären Datenbanken unterschieden:

Primäre Datenbanken enthalten experimentell ermittelte Daten, die als Rohdaten von Forschern zur Verfügung gestellt werden (archival database) z.B. ENA, Genbank, ArrayExpress, Uniprot/Swissprot
Sekundäre Datenbanken enthalten hingegen abgeleitete oder vorhergesagte Daten, die das Ergebnis von Analysen und Literaturrecherchen sind. Es handelt sich hierbei oft um interpretierte Daten aus primären Datenbanken (curated database; knowledgebase) z.B. Expression Atlas, Uniprot/ TrEMBL

FASTA

Allgemeines Format zur Übertragung biologischer Daten (Aminosäure- oder Nukleotidsequenzen)

Aufbau:

1. Zeile: >Beschreibung der Sequenz

2. Zeile: Sequenz (IUPAC standard)

Weiterführendes

Überblick über biologische Datenbanken und die open-access Philosophie der Hauptanbieter:

https://www.ebi.ac.uk/training-beta/online/courses/bioinformatics-terrified/the-role-of-public-databases/