7.Hypothesentests: Difference between revisions

From Bioinformatik Wiki
(Created page with "Diese Übung war zum 29.05.2019 abzugeben == Aufgabe 1 == a) Was misst ein t-Test und wie wird dieser berechnet? Was bedeutet der p-Wert? Der t-Test ist eine Methode der st...")
 
No edit summary
Line 5: Line 5:
a) Was misst ein t-Test und wie wird dieser berechnet? Was bedeutet der p-Wert?
a) Was misst ein t-Test und wie wird dieser berechnet? Was bedeutet der p-Wert?


Der t-Test ist eine Methode der statistischen Analyse, bei der man testet ob ein Mittelwert einer Stichprobe von dem Erwartungswert der Grundgesamtheit abhängt. Mit Varianten des t-Tests kann man außerdem Nullhypothesen(H0) überprüfen ob zwei oder mehr Stichproben derselben Gesamtheit entspringen oder sich dafür zu signifikant unterscheiden. Der p-Wert gibt hierbei das minimale Signifikanzniveau an, bei dem H0 nicht mehr gilt. Der p-Wert ist außerdem die Wahrscheinlichkeit mit der Stichproben zufällig die H0-Hypothese ablehnen.
Der t-Test ist eine Methode der statistischen Analyse, bei der man testet ob ein Mittelwert einer Stichprobe von dem Erwartungswert der Grundgesamtheit abhängt. Mit Varianten des t-Tests kann man außerdem Nullhypothesen(H0) überprüfen ob zwei oder mehr Stichproben derselben Gesamtheit entspringen oder sich dafür zu signifikant unterscheiden. Der p-Wert ist eine Wahrscheinlichkeit und gibt hierbei das minimale Signifikanzniveau an, bei dem H0 nicht mehr gilt. Der p-Wert ist außerdem die Wahrscheinlichkeit mit der Stichproben zufällig die H0-Hypothese ablehnen.


Für einen t-Test müssen zunächst Mittelwert, Standardabweichung und Freiheitsgrade für alle Stichproben berechnet werden.   
Für einen t-Test müssen zunächst Mittelwert, Standardabweichung und Freiheitsgrade für alle Stichproben berechnet werden.   
Line 13: Line 13:
Standardabweichung: <math>\tilde s := +\sqrt{\frac{1}{n} \sum \limits_{i=1}^n\left(x_i-\overline x\right)^2} </math>
Standardabweichung: <math>\tilde s := +\sqrt{\frac{1}{n} \sum \limits_{i=1}^n\left(x_i-\overline x\right)^2} </math>


Freiheitsgrade: n-1
Freiheitsgrade: df = n-1


In den Formeln ist <math>\bar{x} </math> der Mittelwert, <math> x_1 </math> etc. die einzelnen Werte der Stichprobe und n die Anzahl der Werte einer Stichprobe
In den Formeln ist <math>\bar{x} </math> der Mittelwert, <math> x_1 </math> etc. die einzelnen Werte der Stichprobe und n die Anzahl der Werte einer Stichprobe.
 
Nachdem man diese Werte bestimmt hat, kann man mit verschiedenen Formeln (da es viele veschiedene t-Tests gibt) den t-Wert berechnen. Hier wird beispielsweise die Formel für den gepoolten Welch-t-test gezeigt:
:<math>
t \quad = \quad {\; \overline{x}_1 - \overline{x}_2 \; \over \sqrt{ \; {s_1^2 \over N_1} \; + \; {s_2^2 \over N_2} \quad }}\,</math>
 
Der berechnete Wert, wird dann in einer T-Tabelle nachgeschlagen und verglichen. Bevor man einen Wert heraussuchen kann muss ein Signifikanzniveau festgelegt werden, über dem H0 abgelehnt wird, z.B. 0,05. Dann kann man in der Tabelle den Referenz-t-Wert finden und wenn der berechnete t-Wert über dem Referenzwert ist, dann unterscheiden sich die Stichproben signifikant und können nicht als zwei Stichproben aus der gleichen Grundgesamtheit angesehen werden.
 
b) Wie unterscheiden sich Student‘s t-Test und Welch‘s t-Test?
 
Students t-Test sollte nur angewendet werden wenn die Grundgeamtheiten die gleiche Varianz
aufweisen. Wenn dies der Fall ist sollte der Welch-Test verwendet werden.
 
== Aufgabe 2 ==
 
a) Welches statistische Problem tritt auf, wenn man eine statistische Signifikanz zw. zwei
Bedingungen für viele Gene testet?
 
Problematisch ist, dass sich Fehler 1. Art (auch alpha-Fehler) anhäufen können. Dies tritt auf wenn bei einer Probe H0 wahr ist, jedoch der Test H1 feststellt. Um dies zu vermeiden muss man Signifikanzniveau oder p-Wert adjustieren.

Revision as of 20:21, 16 July 2019

Diese Übung war zum 29.05.2019 abzugeben

Aufgabe 1

a) Was misst ein t-Test und wie wird dieser berechnet? Was bedeutet der p-Wert?

Der t-Test ist eine Methode der statistischen Analyse, bei der man testet ob ein Mittelwert einer Stichprobe von dem Erwartungswert der Grundgesamtheit abhängt. Mit Varianten des t-Tests kann man außerdem Nullhypothesen(H0) überprüfen ob zwei oder mehr Stichproben derselben Gesamtheit entspringen oder sich dafür zu signifikant unterscheiden. Der p-Wert ist eine Wahrscheinlichkeit und gibt hierbei das minimale Signifikanzniveau an, bei dem H0 nicht mehr gilt. Der p-Wert ist außerdem die Wahrscheinlichkeit mit der Stichproben zufällig die H0-Hypothese ablehnen.

Für einen t-Test müssen zunächst Mittelwert, Standardabweichung und Freiheitsgrade für alle Stichproben berechnet werden.

Mittelwert: [math]\displaystyle{ \bar{x}_{\mathrm{arithm}} = \frac{1}{n} \sum_{i=1}^n{x_i} = \frac{x_1 + x_2 + \dotsb + x_n}{n} }[/math]

Standardabweichung: [math]\displaystyle{ \tilde s := +\sqrt{\frac{1}{n} \sum \limits_{i=1}^n\left(x_i-\overline x\right)^2} }[/math]

Freiheitsgrade: df = n-1

In den Formeln ist [math]\displaystyle{ \bar{x} }[/math] der Mittelwert, [math]\displaystyle{ x_1 }[/math] etc. die einzelnen Werte der Stichprobe und n die Anzahl der Werte einer Stichprobe.

Nachdem man diese Werte bestimmt hat, kann man mit verschiedenen Formeln (da es viele veschiedene t-Tests gibt) den t-Wert berechnen. Hier wird beispielsweise die Formel für den gepoolten Welch-t-test gezeigt:

[math]\displaystyle{ t \quad = \quad {\; \overline{x}_1 - \overline{x}_2 \; \over \sqrt{ \; {s_1^2 \over N_1} \; + \; {s_2^2 \over N_2} \quad }}\, }[/math]

Der berechnete Wert, wird dann in einer T-Tabelle nachgeschlagen und verglichen. Bevor man einen Wert heraussuchen kann muss ein Signifikanzniveau festgelegt werden, über dem H0 abgelehnt wird, z.B. 0,05. Dann kann man in der Tabelle den Referenz-t-Wert finden und wenn der berechnete t-Wert über dem Referenzwert ist, dann unterscheiden sich die Stichproben signifikant und können nicht als zwei Stichproben aus der gleichen Grundgesamtheit angesehen werden.

b) Wie unterscheiden sich Student‘s t-Test und Welch‘s t-Test?

Students t-Test sollte nur angewendet werden wenn die Grundgeamtheiten die gleiche Varianz aufweisen. Wenn dies der Fall ist sollte der Welch-Test verwendet werden.

Aufgabe 2

a) Welches statistische Problem tritt auf, wenn man eine statistische Signifikanz zw. zwei Bedingungen für viele Gene testet?

Problematisch ist, dass sich Fehler 1. Art (auch alpha-Fehler) anhäufen können. Dies tritt auf wenn bei einer Probe H0 wahr ist, jedoch der Test H1 feststellt. Um dies zu vermeiden muss man Signifikanzniveau oder p-Wert adjustieren.