1 Datenbanken

From Bioinformatik Wiki

Man unterscheidet zwei Arten von Datenbanken: Primär- und Sekundärdatenbanken.

Primärdatenbanken

  • Primärdatenbanken enthalten experimentell ermittelte Daten
  • man unterscheidet zwischen zwei Konzepten:

1. Datenbanken in die nach minimaler Konsistenzprüfung Sequenzdaten hochgeladen werden können z.B. EMBL und DDB

  • Vorteil: schnelle öffentliche Verfügbarkeit der Sequenzen
  • Nachteil: fehlende Qualitätsprüfung

2. curated Datenbanken sind Datenbanken in der jeder Eintrag geprüft wird z.B. PIR

  • Vorteil: Qualitätssicherung
  • Nachteil: fehlende Aktualität

Man unterscheidet Datenbaken auch abhängig von den gespeicherten biologischen Daten

Genomdatenbanken

  • Genomsequenzen, mRNAs, tRNAs rRNAs, microRNAs und Sequenzpolymorphismen lassen sich in konsistenter gemeinsamer Ansicht darstellen

z.B. ENSEMBL-Datenbank, GoldenPath-Browser

Motivdatenbanken

  • ermöglicht die schnelle Identifizierung von konservierten Sequenzen, die für wichtige Proteinstrukturen codieren
  • so lässt sich schnell die Funktion unbekannter Proteine abschätzen und Proteine aufgrund ihrer Funktion in Proteinfamilien einordnen [Weblinks 1]

z.B. BLOCKS, Prosite, ProDom

Molekulare Strukturdatenbank

  • primäre Datenbanken für Proteinstrukturen (3D Strukturen) z.B. PDB

Transkriptomdatenbanken

  • Funktionelle Genomik Daten

z.B. SAGE, ArrayExpress, GEO

Refernezdatenbanken

  • stellen den Bezug zwischen einem Datenbankeintrag in einer Sequenzdatenbank und der wissenschaftlichen Originalliteratur zu dem zugehörigen Gen bzw. Protein her z.B. PubMed


Sekundärdatenbank

  • Sekundärdatenbanken enthalten abgeleitete oder vorhergesagte Daten z.B. Expression Atlas, Uniprot

Weiterführendes

Überblick über biologische Datenbanken und die open-access Philosophie der Hauptanbieter:

https://www.ebi.ac.uk/training-beta/online/courses/bioinformatics-terrified/the-role-of-public-databases/

Weblinks