1 Datenbanken: Difference between revisions

From Bioinformatik Wiki
 
(25 intermediate revisions by 4 users not shown)
Line 1: Line 1:
Auf dieser Seite sind die Themen zusammengeführt, die in Vorlesung 1 am 04.04.2019 behandelt wurden.
Man unterscheidet zwei Arten von Datenbanken: Primär- und Sekundärdatenbanken.  


== Biologisches Problem ==
== Primärdatenbanken ==
* Primärdatenbanken enthalten experimentell ermittelte Daten
* man unterscheidet zwischen zwei Konzepten:
1. Datenbanken in die nach minimaler Konsistenzprüfung Sequenzdaten hochgeladen werden können z.B. EMBL und DDB
* Vorteil: schnelle öffentliche Verfügbarkeit der Sequenzen
* Nachteil: fehlende Qualitätsprüfung
2. curated Datenbanken sind Datenbanken in der jeder Eintrag geprüft wird  z.B. PIR
* Vorteil: Qualitätssicherung
* Nachteil: fehlende Aktualität


Das Biologische Problem wurde hierbei am Beispiel des [[Gen|Gens]] NAT8L, welches im Krebsmetabolismus eine Rolle spielt, bearbeitet.
Man unterscheidet Datenbaken auch abhängig von den gespeicherten biologischen Daten


== [[Microarrays]] ==
=== Genomdatenbanken ===
* Genomsequenzen, mRNAs, tRNAs rRNAs, microRNAs und Sequenzpolymorphismen lassen sich in konsistenter gemeinsamer Ansicht darstellen
z.B. ENSEMBL-Datenbank, GoldenPath-Browser


Die Methode der Microarrays wurde als Möglichkeit vorgestellt [[Transkriptom|Transkriptome]] zu bestimmen.
=== Motivdatenbanken ===
* ermöglicht die schnelle Identifizierung von konservierten Sequenzen, die für wichtige Proteinstrukturen codieren
* so lässt sich schnell die Funktion unbekannter Proteine abschätzen und Proteine aufgrund ihrer Funktion in Proteinfamilien einordnen <ref group="Weblinks"> https://  https://academic.oup.com/nar/article/24/1/197/2359962 (Stand:[20.09.21]) </ref> 
z.B. BLOCKS, Prosite, ProDom


== [[RNAseq]] ==  
=== Molekulare Strukturdatenbank ===
* primäre Datenbanken für Proteinstrukturen (3D Strukturen) z.B. PDB


Die RNAseq wurde als weitere Methode zur Transkriptomsbestimmung vorgestellt.
=== Transkriptomdatenbanken ===
* Funktionelle Genomik Daten
z.B. SAGE, ArrayExpress, GEO


== [[Übung 1|Vergleich RNAseq - Microarrays]] ==
=== Refernezdatenbanken ===
*stellen den Bezug zwischen einem Datenbankeintrag in einer Sequenzdatenbank und der wissenschaftlichen Originalliteratur zu dem zugehörigen Gen bzw. Protein her z.B. PubMed


Vor- und Nachteile von Microarrays und RNAseq wurden gegeneinander abgewogen um die Methoden besser kennenzulernen.


== [[Datenbanken]] ==
== Sekundärdatenbank ==
* Sekundärdatenbanken enthalten abgeleitete oder vorhergesagte Daten z.B. Expression Atlas, Uniprot


Verschiedene Datenbanken wurden als Ressourcen vorgestellt, welche zum Vergleich und zur Vorhersage von Daten verwendet werden können.
== Weiterführendes ==
Überblick über biologische Datenbanken und die open-access Philosophie der Hauptanbieter:
 
https://www.ebi.ac.uk/training-beta/online/courses/bioinformatics-terrified/the-role-of-public-databases/
 
== Weblinks ==
<references group="Weblinks" />

Latest revision as of 11:46, 26 September 2021

Man unterscheidet zwei Arten von Datenbanken: Primär- und Sekundärdatenbanken.

Primärdatenbanken

  • Primärdatenbanken enthalten experimentell ermittelte Daten
  • man unterscheidet zwischen zwei Konzepten:

1. Datenbanken in die nach minimaler Konsistenzprüfung Sequenzdaten hochgeladen werden können z.B. EMBL und DDB

  • Vorteil: schnelle öffentliche Verfügbarkeit der Sequenzen
  • Nachteil: fehlende Qualitätsprüfung

2. curated Datenbanken sind Datenbanken in der jeder Eintrag geprüft wird z.B. PIR

  • Vorteil: Qualitätssicherung
  • Nachteil: fehlende Aktualität

Man unterscheidet Datenbaken auch abhängig von den gespeicherten biologischen Daten

Genomdatenbanken

  • Genomsequenzen, mRNAs, tRNAs rRNAs, microRNAs und Sequenzpolymorphismen lassen sich in konsistenter gemeinsamer Ansicht darstellen

z.B. ENSEMBL-Datenbank, GoldenPath-Browser

Motivdatenbanken

  • ermöglicht die schnelle Identifizierung von konservierten Sequenzen, die für wichtige Proteinstrukturen codieren
  • so lässt sich schnell die Funktion unbekannter Proteine abschätzen und Proteine aufgrund ihrer Funktion in Proteinfamilien einordnen [Weblinks 1]

z.B. BLOCKS, Prosite, ProDom

Molekulare Strukturdatenbank

  • primäre Datenbanken für Proteinstrukturen (3D Strukturen) z.B. PDB

Transkriptomdatenbanken

  • Funktionelle Genomik Daten

z.B. SAGE, ArrayExpress, GEO

Refernezdatenbanken

  • stellen den Bezug zwischen einem Datenbankeintrag in einer Sequenzdatenbank und der wissenschaftlichen Originalliteratur zu dem zugehörigen Gen bzw. Protein her z.B. PubMed


Sekundärdatenbank

  • Sekundärdatenbanken enthalten abgeleitete oder vorhergesagte Daten z.B. Expression Atlas, Uniprot

Weiterführendes

Überblick über biologische Datenbanken und die open-access Philosophie der Hauptanbieter:

https://www.ebi.ac.uk/training-beta/online/courses/bioinformatics-terrified/the-role-of-public-databases/

Weblinks