1 Datenbanken: Difference between revisions
From Bioinformatik Wiki
No edit summary |
|||
Line 1: | Line 1: | ||
Man unterscheidet zwei Arten von Datenbanken: Primär- und Sekundärdatenbanken. | |||
== Primärdatenbanken == | |||
* Primärdatenbanken enthalten experimentell ermittelte Daten | |||
* man unterscheidet zwischen zwei Konzepten: | |||
1. Datenbanken in die nach minimaler Konsistenzprüfung Sequenzdaten hochgeladen werden können z.B. EMBL und DDB | |||
* Vorteil: schnelle öffentliche Verfügbarkeit der Sequenten | |||
* Nachteil: fehlende Qualitätsprüfung | |||
2. Datenbanken in der jeder Eintrag geprüft wird -curated Datenbanken z.B. PIR | |||
* Vorteil: Qualitätssicherung | |||
* Nachteil: fehlende Aktualität | |||
Man unterscheidet Datenbaken auch abhängig von den gespeicherten biologischen Daten. | |||
=== Genomdatenbanken === | |||
* Genomsequenzen, mRNAs, tRNAs. rRNAs, microRNAs und Sequenzpolymorphismen lassen sich in konsistenter gemeinsamer Ansicht darstellen | |||
z.B. ENSEMBE-Datenbank, GoldenPath-Browser | |||
== | === Motivdatenbanken === | ||
* ermöglicht die schnelle Identifizierung von konservierten Sequenzen die für wichtige Proteinstrukturen codieren | |||
* so lässt sich schnell die Funktion unbekannter Proteine abschätzen und Proteine aufgrund ihrer Funktion in Proteinfamilien einordnen | |||
z.B. BLOCKS, Prosite, ProDom | |||
=== Molekulare Strukturdatenbank === | |||
* primäre Datenbanken für Proteinstrukturen (3D Strukturen) z.B. PDB | |||
=== Transkriptomdatenbanken === | |||
* Funktionelle Genomik Daten | |||
z.B. SAGE, ArrayExpress, GEO | |||
== | === Refernezdatenbanken === | ||
*stellen den Bezug zwischen einem Datenbankeintrag in einer Sequenzdatenbank und der wissenschaftlichen Originalliteratur zu dem zugehörigen Gen bzw. Protein her z.B. PubMed | |||
== | == Sekundärdatenbank == | ||
* Sekundärdatenbanken enthalten abgeleitete oder vorhergesagte Daten z.B. Expression Atlas, Uniprot | |||
Revision as of 15:15, 20 September 2021
Man unterscheidet zwei Arten von Datenbanken: Primär- und Sekundärdatenbanken.
Primärdatenbanken
- Primärdatenbanken enthalten experimentell ermittelte Daten
- man unterscheidet zwischen zwei Konzepten:
1. Datenbanken in die nach minimaler Konsistenzprüfung Sequenzdaten hochgeladen werden können z.B. EMBL und DDB
- Vorteil: schnelle öffentliche Verfügbarkeit der Sequenten
- Nachteil: fehlende Qualitätsprüfung
2. Datenbanken in der jeder Eintrag geprüft wird -curated Datenbanken z.B. PIR
- Vorteil: Qualitätssicherung
- Nachteil: fehlende Aktualität
Man unterscheidet Datenbaken auch abhängig von den gespeicherten biologischen Daten.
Genomdatenbanken
- Genomsequenzen, mRNAs, tRNAs. rRNAs, microRNAs und Sequenzpolymorphismen lassen sich in konsistenter gemeinsamer Ansicht darstellen
z.B. ENSEMBE-Datenbank, GoldenPath-Browser
Motivdatenbanken
- ermöglicht die schnelle Identifizierung von konservierten Sequenzen die für wichtige Proteinstrukturen codieren
- so lässt sich schnell die Funktion unbekannter Proteine abschätzen und Proteine aufgrund ihrer Funktion in Proteinfamilien einordnen
z.B. BLOCKS, Prosite, ProDom
Molekulare Strukturdatenbank
- primäre Datenbanken für Proteinstrukturen (3D Strukturen) z.B. PDB
Transkriptomdatenbanken
- Funktionelle Genomik Daten
z.B. SAGE, ArrayExpress, GEO
Refernezdatenbanken
- stellen den Bezug zwischen einem Datenbankeintrag in einer Sequenzdatenbank und der wissenschaftlichen Originalliteratur zu dem zugehörigen Gen bzw. Protein her z.B. PubMed
Sekundärdatenbank
- Sekundärdatenbanken enthalten abgeleitete oder vorhergesagte Daten z.B. Expression Atlas, Uniprot