Test t Studenta

Test t Studentatest statystyczny używany do porównywania dwóch średnich lub porównywania średniej z próby z pewną założoną wartością i sprawdzania, czy różnice pomiędzy nimi mogą być wynikiem losowości. Test t Studenta korzysta ze statystyki testowej o rozkładzie t.

Zasada działania

Jeśli próba losowa pochodzi z populacji o rozkładzie normalnym, to średnia z próby również ma rozkład normalny z taką samą jak w populacji wartością oczekiwaną. Różnica średniej z próby i średniej z populacji dzielona przez błąd standardowy średniej (iloraz odchylenia standardowego z populacji i pierwiastka z liczebności próby) ma standaryzowany rozkład normalny. Odchylenie standardowe w populacji nie jest jednak zwykle znane. Jeśli zastąpimy je odchyleniem z próby, uzyskamy rozkład t, który zbiega do rozkładu normalnego wraz ze wzrostem wielkości próby[1].

Test jednej średniej

Hipoteza zerowa. Oznaczmy średnią z próby symbolem a wariancję z próby – symbolem W ramach testu jednej średniej weryfikuje się hipotezę zerową, że średnia rozkładu, z którego pobierana jest próbka o liczebności jest równa pewnej liczbie Jeżeli ta hipoteza zerowa jest prawdziwa, statystyka T, dana wzorem

ma rozkład t z stopniami swobody.

Formy hipotezy alternatywnej. Hipoteza alternatywna może przyjąć formę dwustronną (średnia w populacji nie jest równa ) lub formę jednostronną: lewostronną ( ) lub prawostronną ( )[2]. Podobnie jak w innych podobnych testach, w zależności od formy hipotezy alternatywnej oraz przyjętego poziomu istotności wyznacza się obszar krytyczny lub wartość p.

Kryterium decyzyjne. Analogicznie do wielu innych testów statystycznych, jeżeli uzyskana w próbie wartość statystyki testowej T znajdzie się w obszarze krytycznym lub (co jest równoważne) wartość p nie przekroczy , hipoteza zerowa jest odrzucana.

Założenia. Zakłada się, szczególnie w przypadku małych prób (np. [2]), że rozkład w populacji, z której pobiera się próbę losową, ma w przybliżeniu rozkład normalny.

Test dwóch średnich

Hipoteza zerowa. W przypadku testu dwóch średnich porównywane są średnie z dwóch prób o liczebnościach i pochodzących z dwóch populacji. Hipoteza zerowa zwykle zakłada równość dwóch średnich w populacjach ( ), co jest równoznaczne stwierdzeniu, że różnica pomiędzy tymi średnimi wynosi zero ( ). Konstrukcja testu pozwala również na niezerową wartość różnicy w hipotezie zerowej ( ), w praktyce najczęściej jednak

Hipoteza alternatywna. Hipoteza alternatywna może być, podobnie jak w teście jednej średniej, dwustronna lewostronna ( ) lub prawostronna ( ).

Statystyka testowa dana jest wzorem[3]:

,

gdzie i to średnia i wariancja w pierwszej próbie, a i to analogiczne statystyki z drugiej próby, ma rozkład t o stopniach swobody.

Założenia. Przeprowadzając test, zakłada się, że rozkłady w populacjach są w przybliżeniu normalne. Jest to ważne w przypadku małych prób, ponieważ dla większych prób test jest odporny na umiarkowane odstępstwa od tego założenia. Test wymaga ponadto założenia o równości wariancji w obu populacjach. Podobny test umożliwiający pominięcie założenia o równości wariancji nazywany jest testem t Welcha.

Test różnicy średnich dla obserwacji powiązanych w pary. Jeżeli obserwacje z dwóch populacji można powiązać w pary (na przykład testujemy zużycie paliwa wylosowanych samochodów w jeździe miejskiej i poza miastem albo umiejętności uczestników szkoleń przed i po szkoleniu), należy obliczyć różnice dla każdej pary i na tak przygotowanych danych (na obliczonych różnicach) przeprowadzić test jednej średniej[3].

Przypisy