1 Datenbanken: Difference between revisions
From Bioinformatik Wiki
(5 intermediate revisions by the same user not shown) | |||
Line 5: | Line 5: | ||
* man unterscheidet zwischen zwei Konzepten: | * man unterscheidet zwischen zwei Konzepten: | ||
1. Datenbanken in die nach minimaler Konsistenzprüfung Sequenzdaten hochgeladen werden können z.B. EMBL und DDB | 1. Datenbanken in die nach minimaler Konsistenzprüfung Sequenzdaten hochgeladen werden können z.B. EMBL und DDB | ||
* Vorteil: schnelle öffentliche Verfügbarkeit der | * Vorteil: schnelle öffentliche Verfügbarkeit der Sequenzen | ||
* Nachteil: fehlende Qualitätsprüfung | * Nachteil: fehlende Qualitätsprüfung | ||
2. curated Datenbanken sind Datenbanken in der jeder Eintrag geprüft wird z.B. PIR | 2. curated Datenbanken sind Datenbanken in der jeder Eintrag geprüft wird z.B. PIR | ||
Line 14: | Line 14: | ||
=== Genomdatenbanken === | === Genomdatenbanken === | ||
* Genomsequenzen, mRNAs, tRNAs | * Genomsequenzen, mRNAs, tRNAs rRNAs, microRNAs und Sequenzpolymorphismen lassen sich in konsistenter gemeinsamer Ansicht darstellen | ||
z.B. | z.B. ENSEMBL-Datenbank, GoldenPath-Browser | ||
=== Motivdatenbanken === | === Motivdatenbanken === | ||
* ermöglicht die schnelle Identifizierung von konservierten Sequenzen die für wichtige Proteinstrukturen codieren | * ermöglicht die schnelle Identifizierung von konservierten Sequenzen, die für wichtige Proteinstrukturen codieren | ||
* so lässt sich schnell die Funktion unbekannter Proteine abschätzen und Proteine aufgrund ihrer Funktion in Proteinfamilien einordnen <ref group="Weblinks"> https:// https://academic.oup.com/nar/article/24/1/197/2359962 (Stand:[20.09.21]) </ref> | * so lässt sich schnell die Funktion unbekannter Proteine abschätzen und Proteine aufgrund ihrer Funktion in Proteinfamilien einordnen <ref group="Weblinks"> https:// https://academic.oup.com/nar/article/24/1/197/2359962 (Stand:[20.09.21]) </ref> | ||
z.B. BLOCKS, Prosite, ProDom | z.B. BLOCKS, Prosite, ProDom | ||
Line 35: | Line 35: | ||
== Sekundärdatenbank == | == Sekundärdatenbank == | ||
* Sekundärdatenbanken enthalten abgeleitete oder vorhergesagte Daten z.B. Expression Atlas, Uniprot | * Sekundärdatenbanken enthalten abgeleitete oder vorhergesagte Daten z.B. Expression Atlas, Uniprot | ||
== Weiterführendes == | |||
Überblick über biologische Datenbanken und die open-access Philosophie der Hauptanbieter: | |||
https://www.ebi.ac.uk/training-beta/online/courses/bioinformatics-terrified/the-role-of-public-databases/ | |||
== Weblinks == | |||
<references group="Weblinks" /> |
Latest revision as of 10:46, 26 September 2021
Man unterscheidet zwei Arten von Datenbanken: Primär- und Sekundärdatenbanken.
Primärdatenbanken
- Primärdatenbanken enthalten experimentell ermittelte Daten
- man unterscheidet zwischen zwei Konzepten:
1. Datenbanken in die nach minimaler Konsistenzprüfung Sequenzdaten hochgeladen werden können z.B. EMBL und DDB
- Vorteil: schnelle öffentliche Verfügbarkeit der Sequenzen
- Nachteil: fehlende Qualitätsprüfung
2. curated Datenbanken sind Datenbanken in der jeder Eintrag geprüft wird z.B. PIR
- Vorteil: Qualitätssicherung
- Nachteil: fehlende Aktualität
Man unterscheidet Datenbaken auch abhängig von den gespeicherten biologischen Daten
Genomdatenbanken
- Genomsequenzen, mRNAs, tRNAs rRNAs, microRNAs und Sequenzpolymorphismen lassen sich in konsistenter gemeinsamer Ansicht darstellen
z.B. ENSEMBL-Datenbank, GoldenPath-Browser
Motivdatenbanken
- ermöglicht die schnelle Identifizierung von konservierten Sequenzen, die für wichtige Proteinstrukturen codieren
- so lässt sich schnell die Funktion unbekannter Proteine abschätzen und Proteine aufgrund ihrer Funktion in Proteinfamilien einordnen [Weblinks 1]
z.B. BLOCKS, Prosite, ProDom
Molekulare Strukturdatenbank
- primäre Datenbanken für Proteinstrukturen (3D Strukturen) z.B. PDB
Transkriptomdatenbanken
- Funktionelle Genomik Daten
z.B. SAGE, ArrayExpress, GEO
Refernezdatenbanken
- stellen den Bezug zwischen einem Datenbankeintrag in einer Sequenzdatenbank und der wissenschaftlichen Originalliteratur zu dem zugehörigen Gen bzw. Protein her z.B. PubMed
Sekundärdatenbank
- Sekundärdatenbanken enthalten abgeleitete oder vorhergesagte Daten z.B. Expression Atlas, Uniprot
Weiterführendes
Überblick über biologische Datenbanken und die open-access Philosophie der Hauptanbieter:
Weblinks
- ↑ https:// https://academic.oup.com/nar/article/24/1/197/2359962 (Stand:[20.09.21])