1 Datenbanken
From Bioinformatik Wiki
Man unterscheidet zwei Arten von Datenbanken: Primär- und Sekundärdatenbanken.
Primärdatenbanken
- Primärdatenbanken enthalten experimentell ermittelte Daten
- man unterscheidet zwischen zwei Konzepten:
1. Datenbanken in die nach minimaler Konsistenzprüfung Sequenzdaten hochgeladen werden können z.B. EMBL und DDB
- Vorteil: schnelle öffentliche Verfügbarkeit der Sequenten
- Nachteil: fehlende Qualitätsprüfung
2. Datenbanken in der jeder Eintrag geprüft wird -curated Datenbanken z.B. PIR
- Vorteil: Qualitätssicherung
- Nachteil: fehlende Aktualität
Man unterscheidet Datenbaken auch abhängig von den gespeicherten biologischen Daten.
Genomdatenbanken
- Genomsequenzen, mRNAs, tRNAs. rRNAs, microRNAs und Sequenzpolymorphismen lassen sich in konsistenter gemeinsamer Ansicht darstellen
z.B. ENSEMBE-Datenbank, GoldenPath-Browser
Motivdatenbanken
- ermöglicht die schnelle Identifizierung von konservierten Sequenzen die für wichtige Proteinstrukturen codieren
- so lässt sich schnell die Funktion unbekannter Proteine abschätzen und Proteine aufgrund ihrer Funktion in Proteinfamilien einordnen
z.B. BLOCKS, Prosite, ProDom
Molekulare Strukturdatenbank
- primäre Datenbanken für Proteinstrukturen (3D Strukturen) z.B. PDB
Transkriptomdatenbanken
- Funktionelle Genomik Daten
z.B. SAGE, ArrayExpress, GEO
Refernezdatenbanken
- stellen den Bezug zwischen einem Datenbankeintrag in einer Sequenzdatenbank und der wissenschaftlichen Originalliteratur zu dem zugehörigen Gen bzw. Protein her z.B. PubMed
Sekundärdatenbank
- Sekundärdatenbanken enthalten abgeleitete oder vorhergesagte Daten z.B. Expression Atlas, Uniprot