7.Hypothesentests: Difference between revisions
(Created page with "Diese Übung war zum 29.05.2019 abzugeben == Aufgabe 1 == a) Was misst ein t-Test und wie wird dieser berechnet? Was bedeutet der p-Wert? Der t-Test ist eine Methode der st...") |
No edit summary |
||
Line 5: | Line 5: | ||
a) Was misst ein t-Test und wie wird dieser berechnet? Was bedeutet der p-Wert? | a) Was misst ein t-Test und wie wird dieser berechnet? Was bedeutet der p-Wert? | ||
Der t-Test ist eine Methode der statistischen Analyse, bei der man testet ob ein Mittelwert einer Stichprobe von dem Erwartungswert der Grundgesamtheit abhängt. Mit Varianten des t-Tests kann man außerdem Nullhypothesen(H0) überprüfen ob zwei oder mehr Stichproben derselben Gesamtheit entspringen oder sich dafür zu signifikant unterscheiden. Der p-Wert gibt hierbei das minimale Signifikanzniveau an, bei dem H0 nicht mehr gilt. Der p-Wert ist außerdem die Wahrscheinlichkeit mit der Stichproben zufällig die H0-Hypothese ablehnen. | Der t-Test ist eine Methode der statistischen Analyse, bei der man testet ob ein Mittelwert einer Stichprobe von dem Erwartungswert der Grundgesamtheit abhängt. Mit Varianten des t-Tests kann man außerdem Nullhypothesen(H0) überprüfen ob zwei oder mehr Stichproben derselben Gesamtheit entspringen oder sich dafür zu signifikant unterscheiden. Der p-Wert ist eine Wahrscheinlichkeit und gibt hierbei das minimale Signifikanzniveau an, bei dem H0 nicht mehr gilt. Der p-Wert ist außerdem die Wahrscheinlichkeit mit der Stichproben zufällig die H0-Hypothese ablehnen. | ||
Für einen t-Test müssen zunächst Mittelwert, Standardabweichung und Freiheitsgrade für alle Stichproben berechnet werden. | Für einen t-Test müssen zunächst Mittelwert, Standardabweichung und Freiheitsgrade für alle Stichproben berechnet werden. | ||
Line 13: | Line 13: | ||
Standardabweichung: <math>\tilde s := +\sqrt{\frac{1}{n} \sum \limits_{i=1}^n\left(x_i-\overline x\right)^2} </math> | Standardabweichung: <math>\tilde s := +\sqrt{\frac{1}{n} \sum \limits_{i=1}^n\left(x_i-\overline x\right)^2} </math> | ||
Freiheitsgrade: n-1 | Freiheitsgrade: df = n-1 | ||
In den Formeln ist <math>\bar{x} </math> der Mittelwert, <math> x_1 </math> etc. die einzelnen Werte der Stichprobe und n die Anzahl der Werte einer Stichprobe | In den Formeln ist <math>\bar{x} </math> der Mittelwert, <math> x_1 </math> etc. die einzelnen Werte der Stichprobe und n die Anzahl der Werte einer Stichprobe. | ||
Nachdem man diese Werte bestimmt hat, kann man mit verschiedenen Formeln (da es viele veschiedene t-Tests gibt) den t-Wert berechnen. Hier wird beispielsweise die Formel für den gepoolten Welch-t-test gezeigt: | |||
:<math> | |||
t \quad = \quad {\; \overline{x}_1 - \overline{x}_2 \; \over \sqrt{ \; {s_1^2 \over N_1} \; + \; {s_2^2 \over N_2} \quad }}\,</math> | |||
Der berechnete Wert, wird dann in einer T-Tabelle nachgeschlagen und verglichen. Bevor man einen Wert heraussuchen kann muss ein Signifikanzniveau festgelegt werden, über dem H0 abgelehnt wird, z.B. 0,05. Dann kann man in der Tabelle den Referenz-t-Wert finden und wenn der berechnete t-Wert über dem Referenzwert ist, dann unterscheiden sich die Stichproben signifikant und können nicht als zwei Stichproben aus der gleichen Grundgesamtheit angesehen werden. | |||
b) Wie unterscheiden sich Student‘s t-Test und Welch‘s t-Test? | |||
Students t-Test sollte nur angewendet werden wenn die Grundgeamtheiten die gleiche Varianz | |||
aufweisen. Wenn dies der Fall ist sollte der Welch-Test verwendet werden. | |||
== Aufgabe 2 == | |||
a) Welches statistische Problem tritt auf, wenn man eine statistische Signifikanz zw. zwei | |||
Bedingungen für viele Gene testet? | |||
Problematisch ist, dass sich Fehler 1. Art (auch alpha-Fehler) anhäufen können. Dies tritt auf wenn bei einer Probe H0 wahr ist, jedoch der Test H1 feststellt. Um dies zu vermeiden muss man Signifikanzniveau oder p-Wert adjustieren. |
Revision as of 19:21, 16 July 2019
Diese Übung war zum 29.05.2019 abzugeben
Aufgabe 1
a) Was misst ein t-Test und wie wird dieser berechnet? Was bedeutet der p-Wert?
Der t-Test ist eine Methode der statistischen Analyse, bei der man testet ob ein Mittelwert einer Stichprobe von dem Erwartungswert der Grundgesamtheit abhängt. Mit Varianten des t-Tests kann man außerdem Nullhypothesen(H0) überprüfen ob zwei oder mehr Stichproben derselben Gesamtheit entspringen oder sich dafür zu signifikant unterscheiden. Der p-Wert ist eine Wahrscheinlichkeit und gibt hierbei das minimale Signifikanzniveau an, bei dem H0 nicht mehr gilt. Der p-Wert ist außerdem die Wahrscheinlichkeit mit der Stichproben zufällig die H0-Hypothese ablehnen.
Für einen t-Test müssen zunächst Mittelwert, Standardabweichung und Freiheitsgrade für alle Stichproben berechnet werden.
Mittelwert: [math]\displaystyle{ \bar{x}_{\mathrm{arithm}} = \frac{1}{n} \sum_{i=1}^n{x_i} = \frac{x_1 + x_2 + \dotsb + x_n}{n} }[/math]
Standardabweichung: [math]\displaystyle{ \tilde s := +\sqrt{\frac{1}{n} \sum \limits_{i=1}^n\left(x_i-\overline x\right)^2} }[/math]
Freiheitsgrade: df = n-1
In den Formeln ist [math]\displaystyle{ \bar{x} }[/math] der Mittelwert, [math]\displaystyle{ x_1 }[/math] etc. die einzelnen Werte der Stichprobe und n die Anzahl der Werte einer Stichprobe.
Nachdem man diese Werte bestimmt hat, kann man mit verschiedenen Formeln (da es viele veschiedene t-Tests gibt) den t-Wert berechnen. Hier wird beispielsweise die Formel für den gepoolten Welch-t-test gezeigt:
- [math]\displaystyle{ t \quad = \quad {\; \overline{x}_1 - \overline{x}_2 \; \over \sqrt{ \; {s_1^2 \over N_1} \; + \; {s_2^2 \over N_2} \quad }}\, }[/math]
Der berechnete Wert, wird dann in einer T-Tabelle nachgeschlagen und verglichen. Bevor man einen Wert heraussuchen kann muss ein Signifikanzniveau festgelegt werden, über dem H0 abgelehnt wird, z.B. 0,05. Dann kann man in der Tabelle den Referenz-t-Wert finden und wenn der berechnete t-Wert über dem Referenzwert ist, dann unterscheiden sich die Stichproben signifikant und können nicht als zwei Stichproben aus der gleichen Grundgesamtheit angesehen werden.
b) Wie unterscheiden sich Student‘s t-Test und Welch‘s t-Test?
Students t-Test sollte nur angewendet werden wenn die Grundgeamtheiten die gleiche Varianz aufweisen. Wenn dies der Fall ist sollte der Welch-Test verwendet werden.
Aufgabe 2
a) Welches statistische Problem tritt auf, wenn man eine statistische Signifikanz zw. zwei Bedingungen für viele Gene testet?
Problematisch ist, dass sich Fehler 1. Art (auch alpha-Fehler) anhäufen können. Dies tritt auf wenn bei einer Probe H0 wahr ist, jedoch der Test H1 feststellt. Um dies zu vermeiden muss man Signifikanzniveau oder p-Wert adjustieren.