1 Datenbanken: Difference between revisions

From Bioinformatik Wiki
mNo edit summary
 
(8 intermediate revisions by the same user not shown)
Line 5: Line 5:
* man unterscheidet zwischen zwei Konzepten:  
* man unterscheidet zwischen zwei Konzepten:  
1. Datenbanken in die nach minimaler Konsistenzprüfung Sequenzdaten hochgeladen werden können z.B. EMBL und DDB
1. Datenbanken in die nach minimaler Konsistenzprüfung Sequenzdaten hochgeladen werden können z.B. EMBL und DDB
* Vorteil: schnelle öffentliche Verfügbarkeit der Sequenten
* Vorteil: schnelle öffentliche Verfügbarkeit der Sequenzen
* Nachteil: fehlende Qualitätsprüfung  
* Nachteil: fehlende Qualitätsprüfung  
2. curated Datenbanken sind Datenbanken in der jeder Eintrag geprüft wird  z.B. PIR
2. curated Datenbanken sind Datenbanken in der jeder Eintrag geprüft wird  z.B. PIR
Line 11: Line 11:
* Nachteil: fehlende Aktualität  
* Nachteil: fehlende Aktualität  


Man unterscheidet Datenbaken auch abhängig von den gespeicherten biologischen Daten
Man unterscheidet Datenbaken auch abhängig von den gespeicherten biologischen Daten  


=== Genomdatenbanken ===
=== Genomdatenbanken ===
* Genomsequenzen, mRNAs, tRNAs. rRNAs, microRNAs und Sequenzpolymorphismen lassen sich in konsistenter gemeinsamer Ansicht darstellen  
* Genomsequenzen, mRNAs, tRNAs rRNAs, microRNAs und Sequenzpolymorphismen lassen sich in konsistenter gemeinsamer Ansicht darstellen  
z.B. ENSEMBE-Datenbank, GoldenPath-Browser  
z.B. ENSEMBL-Datenbank, GoldenPath-Browser


=== Motivdatenbanken ===  
=== Motivdatenbanken ===  
* ermöglicht die schnelle Identifizierung von konservierten Sequenzen die für wichtige Proteinstrukturen codieren
* ermöglicht die schnelle Identifizierung von konservierten Sequenzen, die für wichtige Proteinstrukturen codieren
* so lässt sich schnell die Funktion unbekannter Proteine abschätzen und Proteine aufgrund ihrer Funktion in Proteinfamilien einordnen   
* so lässt sich schnell die Funktion unbekannter Proteine abschätzen und Proteine aufgrund ihrer Funktion in Proteinfamilien einordnen <ref group="Weblinks"> https://  https://academic.oup.com/nar/article/24/1/197/2359962 (Stand:[20.09.21]) </ref>  
z.B. BLOCKS, Prosite, ProDom
z.B. BLOCKS, Prosite, ProDom


=== Molekulare Strukturdatenbank ===  
=== Molekulare Strukturdatenbank ===  
* primäre Datenbanken für Proteinstrukturen (3D Strukturen) z.B. PDB
* primäre Datenbanken für Proteinstrukturen (3D Strukturen) z.B. PDB


=== Transkriptomdatenbanken ===
=== Transkriptomdatenbanken ===
Line 36: Line 35:
== Sekundärdatenbank ==
== Sekundärdatenbank ==
* Sekundärdatenbanken enthalten abgeleitete oder vorhergesagte Daten z.B. Expression Atlas, Uniprot
* Sekundärdatenbanken enthalten abgeleitete oder vorhergesagte Daten z.B. Expression Atlas, Uniprot
== Weiterführendes ==
Überblick über biologische Datenbanken und die open-access Philosophie der Hauptanbieter:
https://www.ebi.ac.uk/training-beta/online/courses/bioinformatics-terrified/the-role-of-public-databases/
== Weblinks ==
<references group="Weblinks" />

Latest revision as of 11:46, 26 September 2021

Man unterscheidet zwei Arten von Datenbanken: Primär- und Sekundärdatenbanken.

Primärdatenbanken

  • Primärdatenbanken enthalten experimentell ermittelte Daten
  • man unterscheidet zwischen zwei Konzepten:

1. Datenbanken in die nach minimaler Konsistenzprüfung Sequenzdaten hochgeladen werden können z.B. EMBL und DDB

  • Vorteil: schnelle öffentliche Verfügbarkeit der Sequenzen
  • Nachteil: fehlende Qualitätsprüfung

2. curated Datenbanken sind Datenbanken in der jeder Eintrag geprüft wird z.B. PIR

  • Vorteil: Qualitätssicherung
  • Nachteil: fehlende Aktualität

Man unterscheidet Datenbaken auch abhängig von den gespeicherten biologischen Daten

Genomdatenbanken

  • Genomsequenzen, mRNAs, tRNAs rRNAs, microRNAs und Sequenzpolymorphismen lassen sich in konsistenter gemeinsamer Ansicht darstellen

z.B. ENSEMBL-Datenbank, GoldenPath-Browser

Motivdatenbanken

  • ermöglicht die schnelle Identifizierung von konservierten Sequenzen, die für wichtige Proteinstrukturen codieren
  • so lässt sich schnell die Funktion unbekannter Proteine abschätzen und Proteine aufgrund ihrer Funktion in Proteinfamilien einordnen [Weblinks 1]

z.B. BLOCKS, Prosite, ProDom

Molekulare Strukturdatenbank

  • primäre Datenbanken für Proteinstrukturen (3D Strukturen) z.B. PDB

Transkriptomdatenbanken

  • Funktionelle Genomik Daten

z.B. SAGE, ArrayExpress, GEO

Refernezdatenbanken

  • stellen den Bezug zwischen einem Datenbankeintrag in einer Sequenzdatenbank und der wissenschaftlichen Originalliteratur zu dem zugehörigen Gen bzw. Protein her z.B. PubMed


Sekundärdatenbank

  • Sekundärdatenbanken enthalten abgeleitete oder vorhergesagte Daten z.B. Expression Atlas, Uniprot

Weiterführendes

Überblick über biologische Datenbanken und die open-access Philosophie der Hauptanbieter:

https://www.ebi.ac.uk/training-beta/online/courses/bioinformatics-terrified/the-role-of-public-databases/

Weblinks