1 Datenbanken: Difference between revisions

From Bioinformatik Wiki
mNo edit summary
Line 1: Line 1:
Man unterscheidet zwei Arten von Datenbanken: Primär- und Sekundärdatenbanken.  
Man unterscheidet zwei Arten von Datenbanken: Primär- und Sekundärdatenbanken.  


== Primärdatenbanken ==
== Primärdatenbanken ==
* Primärdatenbanken enthalten experimentell ermittelte Daten  
* Primärdatenbanken enthalten experimentell ermittelte Daten  
* man unterscheidet zwischen zwei Konzepten:  
* man unterscheidet zwischen zwei Konzepten:  
1. Datenbanken in die nach minimaler Konsistenzprüfung Sequenzdaten hochgeladen werden können z.B. EMBL und DDB
1. Datenbanken in die nach minimaler Konsistenzprüfung Sequenzdaten hochgeladen werden können z.B. EMBL und DDB
* Vorteil: schnelle öffentliche Verfügbarkeit der Sequenten
* Vorteil: schnelle öffentliche Verfügbarkeit der Sequenzen
* Nachteil: fehlende Qualitätsprüfung  
* Nachteil: fehlende Qualitätsprüfung  
2. curated Datenbanken sind Datenbanken in der jeder Eintrag geprüft wird  z.B. PIR
2. curated Datenbanken sind Datenbanken in der jeder Eintrag geprüft wird  z.B. PIR
Line 30: Line 30:


=== Refernezdatenbanken ===  
=== Refernezdatenbanken ===  
*stellen den Bezug zwischen einem Datenbankeintrag in einer Sequenzdatenbank und der wissenschaftlichen Originalliteratur zu dem zugehörigen Gen bzw. Protein her z.B. PubMed  
*stellen den Bezug zwischen einem Datenbankeintrag in einer Sequenzdatenbank und der wissenschaftlichen Originalliteratur zu dem zugehörigen Gen bzw. Protein her z.B. PubMed
 


== Sekundärdatenbank ==
== Sekundärdatenbank ==

Revision as of 11:39, 26 September 2021

Man unterscheidet zwei Arten von Datenbanken: Primär- und Sekundärdatenbanken.

₴== Primärdatenbanken ==

  • Primärdatenbanken enthalten experimentell ermittelte Daten
  • man unterscheidet zwischen zwei Konzepten:

1. Datenbanken in die nach minimaler Konsistenzprüfung Sequenzdaten hochgeladen werden können z.B. EMBL und DDB

  • Vorteil: schnelle öffentliche Verfügbarkeit der Sequenzen
  • Nachteil: fehlende Qualitätsprüfung

2. curated Datenbanken sind Datenbanken in der jeder Eintrag geprüft wird z.B. PIR

  • Vorteil: Qualitätssicherung
  • Nachteil: fehlende Aktualität

Man unterscheidet Datenbaken auch abhängig von den gespeicherten biologischen Daten

Genomdatenbanken

  • Genomsequenzen, mRNAs, tRNAs rRNAs, microRNAs und Sequenzpolymorphismen lassen sich in konsistenter gemeinsamer Ansicht darstellen

z.B. ENSEMBE-Datenbank, GoldenPath-Browser

Motivdatenbanken

  • ermöglicht die schnelle Identifizierung von konservierten Sequenzen, die für wichtige Proteinstrukturen codieren
  • so lässt sich schnell die Funktion unbekannter Proteine abschätzen und Proteine aufgrund ihrer Funktion in Proteinfamilien einordnen [Weblinks 1]

z.B. BLOCKS, Prosite, ProDom

Molekulare Strukturdatenbank

  • primäre Datenbanken für Proteinstrukturen (3D Strukturen) z.B. PDB

Transkriptomdatenbanken

  • Funktionelle Genomik Daten

z.B. SAGE, ArrayExpress, GEO

Refernezdatenbanken

  • stellen den Bezug zwischen einem Datenbankeintrag in einer Sequenzdatenbank und der wissenschaftlichen Originalliteratur zu dem zugehörigen Gen bzw. Protein her z.B. PubMed

Sekundärdatenbank

  • Sekundärdatenbanken enthalten abgeleitete oder vorhergesagte Daten z.B. Expression Atlas, Uniprot

Weiterführendes

Überblick über biologische Datenbanken und die open-access Philosophie der Hauptanbieter:

https://www.ebi.ac.uk/training-beta/online/courses/bioinformatics-terrified/the-role-of-public-databases/

Weblinks