t-Test, Chi-Quadrat, ANOVA, Regression, Korrelation... (2024)

Der t-Test ist einer der häufigsten Hypothesentests in der Statistik, wobei es drei Varianten des t-Tests gibt:

  • Einstichproben t-Test
  • t-Test für unabhängige Stichproben
  • t-Test für abhängige Stichproben
t-Test, Chi-Quadrat, ANOVA, Regression, Korrelation... (1)

Welcher t-Test berechnet wird, hängt davon ab, ob eine oder zwei Stichproben vorliegen. Bei zwei Stichproben wird weiter unterschieden, ob es sich um abhängige oder unabhängige Stichproben handelt. In diesem Tutorial geht es um den t-Test für eine Stichprobe, der auch als Einstichproben t-Test oder Einfacher t-Test bezeichnet wird.

Tipp: Willst du den t-Wert berechnen? Du kannst ihn für alle drei t-Tests ganz einfach online im t-Test Rechner auf DATAtab berechnen

Der t-Test für eine Stichprobe wird verwendet, um zu testen, ob sich die Grundgesamtheit von einem festgelegten Wert unterscheidet. Die Frage lautet also: Gibt es statistisch bedeutsame (signifikante) Unterschiede zwischen einem Stichproben-Mittelwert und dem festgelegten Wert? Der festgelegte Wert kann z.B. den restlichen Bevölkerungsanteil widerspiegeln oder ein festgelegtes Qualitätsziel welches kontrolliert werden soll.

Sozialwissenschaftliches Beispiel:

Du möchtest herausfinden, ob sich das Gesundheitsempfinden von ManagerInnen in Österreich von jenem der Gesamtbevölkerung unterscheidet. Dazu befragst du 50 ManagerInnen zu ihrem Gesundheitsempfinden.

Technisches Beispiel:

Du möchtest herausfinden, ob die Schrauben, die deine Firma herstellt, wirklich durchschnittlich 10 Gramm wiegen. Dazu wiegst du 50 Schrauben und vergleichst das tatsächliche Gewicht mit dem Gewicht, das sie haben sollten (10 Gramm).

Beispiel aus der Medizin:

Eine Pharmafirma verspricht, dass ihr neues Medikament den Blutdruck innerhalb einer Woche um 10 mmHg senkt. Du sollst herausfinden, ob das stimmt. Hierfür vergleichst du die beobachtete Reduktion des Blutdrucks von 75 ProbandInnen mit der erwarteten Reduktion von 10 mmHg.

Voraussetzungen für den Einstichproben t-Test

Bei einem t-Test für eine Stichprobe müssen die betrachteten Daten aus einer Zufallsstichprobe stammen, metrisches Skalenniveau besitzen und normalverteilt sein.

Einseitiger und zweiseitiger t-Test

t-Test, Chi-Quadrat, ANOVA, Regression, Korrelation... (2)

Wenn du also wissen möchtest, ob sich eine Stichprobe von der Grundgesamtheit unterscheidet, musst du einen Einstichproben t-Test berechnen. Bevor der t-Test jedoch berechnet werden kann, müssen erstmal eine Fragestellung formuliert und die Hypothesen definiert werden. Daraus ergibt sich, ob ein einseitiger (gerichteter) oder ein zweiseitiger (ungerichteter) t-Test berechnet werden muss.

Die Fragestellung hilft dir, den Untersuchungsgegenstand abzugrenzen. Im Falle des einfachen t-Tests ergibt sich die Fragestellung wie folgt:

Zweiseitig (Ungerichtet)

Gibt es einen statistisch signifikanten Unterschied zwischen dem Mittelwerten der Stichprobe und der Grundgesamtheit?

Einseitig (Gerichtet)

Ist der Mittelwert der Stichprobe signifikant größer (bzw. kleiner) als der Mittelwert der Grundgesamtheit?

Für die obenstehenden Beispiele ergeben sich die Fragestellungen:

  • Unterscheidet sich das Gesundheitsempfinden von ManagerInnen in Österreich von jenem der Gesamtbevölkerung in Österreich?
  • Produziert die Produktionsanlage Schrauben mit dem Gewicht von 10 Gramm?
  • Senkt das neue Medikament den Blutdruck innerhalb von einer Woche um 10 mmHg?

Hypothesen

Um nun im nächsten Schritt einen Einstichproben t-Test durchzuführen, werden folgende Hypothesen formuliert:

Zweiseitig (Ungerichtet)

  • Nullhypothese H0: Der Mittelwert der Grundgesamtheit ist gleich dem vorgegebenen Wert.
  • Alternativhypothese H1: Der Mittelwert der Grundgesamtheit ist kleiner (bzw. größer) als der vorgegebenen Wert.

Einseitig (Gerichtet)

  • Nullhypothese H0: Der Mittelwert der Grundgesamtheit ist gleich oder größer (bzw. kleiner) jenem des vorgegebenen Wertes.
  • Alternativhypothese H1: Der Mittelwert der Grundgesamtheit ist kleiner (bzw. größer) als der vorgegebenen Werte

Einstichproben t-Test berechnen

Den t-Test berechnen kannst du entweder mit einer Statistik-Software wie DATAtab oder per Hand. Für die Berechnung per Hand wird zunächst die Teststatistik t benötigt. Die Teststatistik für den t-Test kann folgendermaßen berechnet werden

t-Test, Chi-Quadrat, ANOVA, Regression, Korrelation... (3)

wobei die Standardabweichung die mithilfe der Stichprobe geschätzte Standardabweichung der Grundgesamtheit ist.

Um zu prüfen, ob sich der Stichprobenmittelwert signifikant von jenem der Grundgesamtheit unterscheidet, muss der kritische t-Wert berechnet werden. Hierzu wird zunächst der Freiheitsgrad, abgekürzt mit df (degree of freedom), benötigt. Der Freiheitsgrad ergibt sich, indem man die Anzahl der Stichproben minus eins rechnet.

t-Test, Chi-Quadrat, ANOVA, Regression, Korrelation... (4)

Ist der Freiheitsgrad bekannt, kann mithilfe der Tabelle der t-Werte der kritische t-Wert ermittelt werden. Für eine Stichprobe mit der Größe von 12 Personen ergibt sich ein Freiheitsgrad von 11. Als Signifikanzniveau wird 5% angenommen. In der folgenden Tabelle sind die t Werte für eine einseitig offene Verteilung angegeben. Je nachdem, ob du nun einen einseitigen (gerichteten) oder zweiseitigen (ungerichteten) t-Test berechnen möchtest, musst du entweder den t-Wert bei 0,95 oder bei 0,975 ablesen. Für eine ungerichtete Hypothese und bei einem Alpha-Niveau von 5% ergibt sich der kritische t-Wert mit 2,201.

Liegt der berechnete t Wert unter dem kritischen t-Wert, ergibt sich kein signifikanter Unterschied zwischen der Stichprobe und der Grundgesamtheit, liegt er über dem kritischen t-Wert, ergibt sich ein signifikanter Unterschied.

Fläche einseitig
Freiheitsgrade 0,5 0,75 0,8 0,85 0,9 0,95 0,975 0,99 0,995 0,999 0,9995
... ... ... ... ... ... ... ... ... ... ... ...
9 0 0,703 0,883 1,1 1,383 1,833 2,262 2,821 3,25 4,297 4,781
10 0 0,7 0,879 1,093 1,372 1,812 2,228 2,764 3,169 4,144 4,587
11 0 0,697 0,876 1,088 1,363 1,796 2,201 2,718 3,106 4,025 4,437
12 0 0,695 0,873 1,083 1,356 1,782 2,179 2,681 3,055 3,93 4,318
13 0 0,694 0,87 1,079 1,35 1,771 2,16 2,65 3,012 3,852 4,221
... ... ... ... ... ... ... ... ... ... ... ...

t-Wert interpretieren

Der t-Wert ergibt sich aus der gemessenen Differenz geteilt durch die Streuung in den Stichprobendaten Je größer der Betrag von t ist, umso mehr spricht dies gegen die Nullhypothese. Ist der berechnete t-Wert vom Betrag größer als der kritische t-Wert wird die Nullhypothese abgelehnt.

Anzahl der Freiheitsgrade - df

Die Anzahl der Freiheitsgrade geben an, wie viele Werte frei variieren dürfen. Die Freiheitsgrade sind also die Anzahl der unabhängigen Einzelinformationen.

Einstichproben t-Test mit DATAtab berechnen

Als Beispiel für den t-Test für eine Stichprobe wird untersucht, ob ein an der Uni neu eingeführtes Online-Statistik-Tutorium einen Einfluss auf die Prüfungsergebnisse der Studierenden hat.

Die durchschnittliche Punktezahl beim Statistik-Test an einer Uni liegt seit Jahren bei 28 Punkten. Dieses Semester wurde ein neues Online-Statistik-Tutorium eingeführt. Nun möchte die Studiengangsleitung wissen, ob sich der Studienerfolg seit der Einführung des Statistik-Tutoriums verändert hat: Wirkt sich das Online-Statistik-Tutorium positiv auf die Prüfungsergebnisse aus?

Die betrachtete Grundgesamtheit umfasst alle Studierenden, die die Statistik Prüfung geschrieben haben, seit dem das neue Statistik-Tutorium eingeführt worden ist. Der zu vergleichende Referenzwert ist 28.

Nullhypothese H0

Der Mittelwert aus der Stichprobe und der vorgegebene Wert unterscheiden sich nicht signifikant. Das Online-Statistik-Tutorium hat keinen signifikanten Einfluss auf die Prüfungsergebnisse.

StudentIn Punktezahl
1 28
2 29
3 35
4 37
5 32
6 26
7 37
8 39
9 22
10 29
11 36
12 38
Mit DATAtab einen Einstichproben t-Test online berechnen:

Du willst eigenständig einen t-Test berechnen? Berechne das Beispiel im Statistik Rechner nach. Kopiere dazu einfach die obere Tabelle inklusive der ersten Zeile in den t-Test Rechner. DATAtab gibt dir dann die untenstehenden Tabellen aus.

Der obere Datensatz besteht aus N=12 Fällen, mit einem Mittelwert von 32,33 und einer Standardabweichung von 5,46. Mithilfe von DATAtab oder der oben beschriebenen Formeln ergibt sich nun ein Standardfehler des Mittelwerts von 1,57 und eine t-Statistik von 2,75. Der t-Wert für den Datensatz ergibt sich damit mit 2,75.

Du möchtest nun wissen, ob deine Hypothese (die Punktezahl ist 28) signifikant ist oder nicht. Hierfür gibst du zunächst ein Signifikanzniveau in DATAtab an, in der Regel wird 5 % verwendet, welches vorausgewählt ist. Für den mit Datatab online berechneten t-Test erhältst du nun die untenstehende Tabelle.

Statistiken
n Mittelwert Standardabweichung Standardfehler des Mittelwerts
Punktezahl 12 32,33 5,47 1,58
Einfacher t-Test (Test Wert = 28)
t df p
Punktezahl 2,75 11 0,02
95% Konfidenzintervall der Differenz
Mittelwertdifferenz Untere Obere
4,33 0,86 7,81

Um eine Aussage treffen zu können, ob deine Hypothese bestätigt werden kann oder nicht, wird einer der beiden folgenden Werte verwendet:

  • p-Wert (2-Seitig) (p-Wert)
  • unteres und oberes Konfidenzintervall der Differenz

In diesem t-Test-Beispiel ist der p-Wert (2-seitig) gleich 0,02 also 2 %. In Worten gefasst bedeutet dies: Die Wahrscheinlichkeit, dass aus der Grundgesamtheit eine Stichprobe mit der Mittelwertdifferenz von 4,33 oder mehr gezogen wird liegt bei 2 %. Das Signifikanzniveau ist mit 5 % festgelegt worden und ist damit größer als 2 %. Aus diesem Grund wird von einem signifikanten Unterschied zwischen der Stichprobe und der Grundgesamtheit ausgegangen.

Ob es einen signifikanten Unterschied gibt oder nicht, kann auch aus dem Konfidenzintervall der Differenz abgelesen werden. Verläuft die untere und die obere Grenze durch null, gibt es keinen signifikanten Unterschied. Ist dies nicht der Fall, liegt ein signifikanter Unterschied vor. In diesem Beispiel ist der untere Wert 0,86 und der obere Wert 7,81. Da der untere und der obere Wert null nicht streifen, kann von einem signifikanten Unterschied ausgegangen werden.

APA Format | Einstichproben t-Test

Wenn wir das obere Ergebnis für eine Veröffentlichung in einer APA-Zeitschrift schreiben würden, also in einem APA-Format, würden wir es folgendermaßen machen:

Ein t-Test ergab einen statistisch zuverlässigen Unterschied zwischen der Punktezahl von Studenten, die den Online-Kurs besucht haben (M = 32,33, SD = 5,47) und der Durchschnitts-Punktezahl von Studierenden, die keinen Online-Kurs besucht haben, t(11) = 2,75, p = ,02.

Damit wurde ganz einfach ein t-Test online erklärt und berechnet, probiere es gleich selber aus mit der Statistik Software auf Datatab.

t-Test, Chi-Quadrat, ANOVA, Regression, Korrelation... (2024)

FAQs

When to use chi-square test vs t-test vs ANOVA? ›

While t-tests and ANOVA primarily deal with continuous dependent variables, Chi-Square tests come into play when there is a categorical dependent variable, often in the context of logistic regression.

When to use ANOVA vs t-test vs regression? ›

The t test can be thought of as a simple regression model with the covariate taking on only two values, and the ANOVA can also be viewed as a regression model with multiple covariates. More complicated ANOVA models can also be thought of in regression frameworks.

How do you interpret t-test results in regression analysis? ›

The t-test assesses whether the beta coefficient is significantly different from zero. If the beta coefficient is not statistically significant (i.e., the t-value is not significant), the variable does not significantly predict the outcome. If the beta coefficient is significant, examine the sign of the beta.

Does ANOVA tell you correlation? ›

Pearson correlation coefficient is used to measure the strength and direction of the linear relationship between two continuous variables, while ANOVA is used to test for differences in means among two or more groups.

How do you know if you need a chi-square test or t-test? ›

The t-test and the chi-square test are two different statistical tests used for different types of data. The t-test is used to compare the means of two groups and is suitable for continuous numerical data. On the other hand, the chi-square test is used to examine the association between two categorical variables.

When should we use an ANOVA instead of multiple t-tests and why? ›

The Student's t test is used to compare the means between two groups, whereas ANOVA is used to compare the means among three or more groups.

Why choose ANOVA over regression? ›

ANOVA is used to find a common mean between variables of different groups. The predictions made by the regression analysis are not always desirable; that's because of the error term in a regression, this error term is also known as residual. In the case of regression, the number of the error term is one.

When should a regression test be used? ›

Regression testing is performed before each new instance of the product is deployed, guaranteeing that the program works perfectly in each setting. For instance, we need to make sure the product continues to perform properly in a production environment before we release it.

What if p-value is greater than 0.05 in regression? ›

If the p-value were greater than 0.05, you would say that the group of independent variables does not show a statistically significant relationship with the dependent variable, or that the group of independent variables does not reliably predict the dependent variable.

How to know if a regression is significant? ›

F is a test for statistical significance of the regression equation as a whole. It is obtained by dividing the explained variance by the unexplained variance. By rule of thumb, an F-value of greater than 4.0 is usually statistically significant but you must consult an F-table to be sure.

What is a good t-value in regression? ›

A good t-statistic is one that is statistically significant, meaning that the difference between the two sample means is unlikely to have occurred by chance. Generally, a t-statistic of 2 or higher is considered to be statistically significant.

When should you not use ANOVA? ›

If the assumption of normality is violated, or outliers are present, then the one-way ANOVA may not be the most powerful test available, and this could mean the difference between detecting a true difference among the population means or not.

Is chi-square a regression analysis? ›

It turns out that the 2 X 2 contingency analysis with chi-square is really just a special case of logistic regression, and this is analogous to the relationship between ANOVA and regression. With chi-square contingency analysis, the independent variable is dichotomous and the dependent variable is dichotomous.

When to use a chi-square test? ›

A chi-square test is used to help determine if observed results are in line with expected results and to rule out that observations are due to chance. A chi-square test is appropriate for this when the data being analyzed is from a random sample, and when the variable in question is a categorical variable.

When should we use chi squared vs f ratio vs ANOVA? ›

As a basic rule of thumb: Use Chi-Square Tests when every variable you're working with is categorical. Use ANOVA when you have at least one categorical variable and one continuous dependent variable.

When should Chi Squared test be used? ›

A chi-square test is used to help determine if observed results are in line with expected results and to rule out that observations are due to chance. A chi-square test is appropriate for this when the data being analyzed is from a random sample, and when the variable in question is a categorical variable.

When to use t-test or z-test or chi-square? ›

Both the t-test and the z-test are usually used for continuous populations, and the chi-square test is used for categorical data. The F- test is used for comparing more than two means.

When should ANOVA be used? ›

You might use ANOVA when you want to test a particular hypothesis between groups, determining – in using one-way ANOVA – the relationship between an independent variable and one quantitative dependent variable. An example could be examining how the level of employee training impacts customer satisfaction ratings.

Top Articles
Latest Posts
Article information

Author: Edwin Metz

Last Updated:

Views: 6512

Rating: 4.8 / 5 (58 voted)

Reviews: 89% of readers found this page helpful

Author information

Name: Edwin Metz

Birthday: 1997-04-16

Address: 51593 Leanne Light, Kuphalmouth, DE 50012-5183

Phone: +639107620957

Job: Corporate Banking Technician

Hobby: Reading, scrapbook, role-playing games, Fishing, Fishing, Scuba diving, Beekeeping

Introduction: My name is Edwin Metz, I am a fair, energetic, helpful, brave, outstanding, nice, helpful person who loves writing and wants to share my knowledge and understanding with you.