A statisztikai hipotézisek tesztelésének kritériumai és módszerei, példák

Tartalomjegyzék:

A statisztikai hipotézisek tesztelésének kritériumai és módszerei, példák
A statisztikai hipotézisek tesztelésének kritériumai és módszerei, példák
Anonim

A hipotézisvizsgálat a statisztikákban szükséges eljárás. A hipotézis teszt két, egymást kizáró állítást értékel annak meghatározására, hogy melyik állítást támasztják alá legjobban a mintaadatok. Amikor egy megállapítást statisztikailag szignifikánsnak mondanak, az egy hipotézis tesztnek köszönhető.

Ellenőrzési módszerek

A statisztikai hipotézisek tesztelésének módszerei a statisztikai elemzés módszerei. Általában két statisztikakészletet hasonlítanak össze, vagy egy mintavételezett adatkészletet egy idealizált modellből származó szintetikus adatkészlettel. Az adatokat úgy kell értelmezni, hogy azok új jelentéseket adjanak. Ezeket úgy értelmezheti, hogy feltételezi a végeredmény egy bizonyos szerkezetét, és statisztikai módszereket használ a feltételezés megerősítésére vagy elutasítására. Ezt a feltevést hipotézisnek, az erre használt statisztikai teszteket pedig statisztikai hipotézisnek nevezzük.

H0 és H1 hipotézisek

Két főa hipotézisek statisztikai tesztelésének fogalmai – az úgynevezett „fő- vagy nullhipotézis” és „ alternatív hipotézis”. Ezeket Neyman-Pearson hipotéziseknek is nevezik. A statisztikai teszt feltevését nullhipotézisnek, főhipotézisnek vagy röviden H0-nak nevezzük. Gyakran nevezik alapértelmezett feltételezésnek vagy annak a feltételezésnek, hogy semmi sem változott. A tesztfeltételezés megsértését gyakran első hipotézisnek, alternatív hipotézisnek vagy H1-nek nevezik. A H1 egy másik hipotézis rövidítése, mert csak annyit tudunk róla, hogy a H0 adatok elvethetők.

nullhipotézis teszt
nullhipotézis teszt

A nullhipotézis elutasítása vagy elutasítása előtt a teszt eredményét értelmezni kell. Az összehasonlítás akkor tekinthető statisztikailag szignifikánsnak, ha az adathalmazok közötti kapcsolat nem valószínű, hogy a nullhipotézis megvalósítása a küszöbvalószínűség – a szignifikancia szint – szerint. A statisztikai hipotézisek teszteléséhez is léteznek az illeszkedési kritériumok. Ez a hipotézisvizsgálati kritérium neve, amely az ismeretlen eloszlás feltételezett törvényéhez kapcsolódik. Ez az empirikus és az elméleti eloszlás közötti eltérés numerikus mértéke.

A statisztikai hipotézisek tesztelésének eljárása és kritériumai

A leggyakoribb hipotéziskiválasztási módszerek vagy az Akaike információs kritériumon, vagy a Bayes-együtthatón alapulnak. A statisztikai hipotézisek tesztelése kulcsfontosságú technika mind a következtetésben, mind a Bayes-i következtetésben, bár a két típus között jelentős különbségek vannak. Statisztikai hipotézisvizsgálatokdefiniáljon egy eljárást, amely szabályozza annak valószínűségét, hogy tévesen döntenek egy hibás alapértelmezett vagy nullhipotézisről. Az eljárás azon alapul, hogy milyen valószínűséggel működik. A rossz döntés meghozatalának ez a valószínűsége annak a valószínűsége, hogy a nullhipotézis igaz, és nincs külön alternatív hipotézis. A teszt nem tudja megmutatni, hogy igaz vagy hamis.

Statisztikai hipotézisek tesztelésének módszerei
Statisztikai hipotézisek tesztelésének módszerei

A döntéselmélet alternatív módszerei

Léteznek alternatív döntéselméleti módszerek, amelyekben a null- és az első hipotézist egyenlőbb alapon veszik figyelembe. Más döntéshozatali megközelítések, mint például a Bayes-elmélet, megpróbálják egyensúlyba hozni a rossz döntések következményeit az összes lehetőség között, ahelyett, hogy egyetlen nullhipotézisre összpontosítanának. Az adatokon alapul számos egyéb megközelítés annak eldöntésére, hogy melyik hipotézis helyes, és melyikük rendelkezik a kívánt tulajdonságokkal. De a hipotézisek tesztelése az adatelemzés domináns megközelítése a tudomány számos területén.

A statisztikai hipotézis tesztelése

Ha az eredmények egyik halmaza eltér egy másik halmaztól, statisztikai hipotézis-tesztekre vagy statisztikai hipotézisvizsgálatokra kell hagyatkozni. Értelmezésük megköveteli a p-értékek és a kritikus értékek megfelelő megértését. Azt is fontos megérteni, hogy a szignifikancia szintjétől függetlenül a tesztek továbbra is tartalmazhatnak hibákat. Ezért előfordulhat, hogy a következtetés nem helyes.

A tesztelési folyamat a következőkből álltöbb lépés:

  1. Egy kezdeti hipotézis készül a kutatáshoz.
  2. A releváns null- és alternatív hipotézisek meg vannak jelölve.
  3. Megmagyarázza a teszt mintájára vonatkozó statisztikai feltételezéseket.
  4. A megfelelő teszt meghatározása.
  5. Válassza ki a szignifikancia szintet és a valószínűségi küszöböt, amely alatt a nullhipotézis elutasításra kerül.
  6. A nullhipotézis teszt statisztika eloszlása megmutatja azokat a lehetséges értékeket, amelyeknél a nullhipotézis elutasításra kerül.
  7. Számítás folyamatban.
  8. Döntés születik a nullhipotézis elutasításáról vagy elfogadásáról egy alternatíva javára.

Van egy alternatíva, amely p-értéket használ.

Példák statisztikai hipotézisek tesztelésére
Példák statisztikai hipotézisek tesztelésére

Szignifikanciatesztek

A tiszta adatoknak nincs gyakorlati haszna értelmezés nélkül. A statisztikában, amikor az adatokkal kapcsolatos kérdésekről és az eredmények értelmezéséről van szó, statisztikai módszereket alkalmaznak a válaszok pontosságának vagy valószínűségének biztosítására. Statisztikai hipotézisek tesztelésekor a módszerek ezen osztályát statisztikai tesztelésnek vagy szignifikancia tesztnek nevezik. A „hipotézis” kifejezés olyan tudományos módszerekre emlékeztet, amelyek során hipotéziseket és elméleteket vizsgálnak. A statisztikában egy hipotézisvizsgálat egy adott feltételezéssel adott mennyiséget eredményez. Lehetővé teszi annak értelmezését, hogy egy feltételezés igaz-e, vagy szabálysértés történt-e.

Tesztek statisztikai értelmezése

Hipotézisvizsgálatokarra szolgálnak, hogy meghatározzák, mely kutatási eredmények vezetnek a nullhipotézis elvetéséhez egy előre meghatározott szignifikanciaszint mellett. A statisztikai hipotézisvizsgálat eredményeit értelmezni kell, hogy tovább lehessen dolgozni rajta. A statisztikai hipotézisvizsgálati kritériumoknak két általános formája van. Ezek a p-érték és a kritikus értékek. A kiválasztott kritériumtól függően a kapott eredményeket eltérően kell értelmezni.

Mi az a p-érték

A kimenet statisztikailag szignifikáns a p-érték értelmezésekor. Valójában ez a mutató a hiba valószínűségét jelenti, ha a nullhipotézist elutasítják. Más szóval, egy olyan érték megnevezésére használható, amely segítségével értelmezhető vagy számszerűsíthető a teszteredmény, és meghatározható a nullhipotézis elutasítása esetén a hiba valószínűsége. Például elvégezhet egy normalitástesztet egy adatmintán, és megállapíthatja, hogy kicsi az esély a kiugró értékekre. A nullhipotézist azonban nem kell elvetni. A statisztikai hipotézis teszt p-értéket adhat vissza. Ez úgy történik, hogy összehasonlítjuk p értékét egy előre meghatározott küszöbértékkel, amelyet szignifikanciaszintnek neveznek.

Nullhipotézisek statisztikai tesztelése
Nullhipotézisek statisztikai tesztelése

Jelentőségi szint

A jelentőség szintjét gyakran a görög kis „alfa” betűvel írják. Az alfa általános értéke 5% vagy 0,05. A kisebb alfa érték a nullhipotézis megbízhatóbb értelmezését sugallja. A p-értéket összehasonlítjukelőre kiválasztott alfa érték. Az eredmény statisztikailag szignifikáns, ha a p-érték kisebb, mint alfa. A szignifikanciaszint megfordítható, ha egyből kivonjuk. Ennek célja a hipotézis megbízhatósági szintjének meghatározása a megfigyelt mintaadatok alapján. Ha a statisztikai hipotézisek tesztelésének ezt a módszerét alkalmazzuk, a P-érték valószínűségi. Ez azt jelenti, hogy egy statisztikai teszt eredményének értelmezése során az ember nem tudja, mi igaz vagy hamis.

Statisztikai hipotézisvizsgálati elmélet

A nullhipotézis elutasítása azt jelenti, hogy elegendő statisztikai bizonyíték áll rendelkezésre ahhoz, hogy valószínűnek tűnik. Ellenkező esetben ez azt jelenti, hogy nincs elegendő statisztika az elutasításhoz. A statisztikai teszteket a nullhipotézis elutasításának és elfogadásának dichotómiájában lehet elképzelni. A nullhipotézis statisztikai tesztelésének veszélye az, hogy ha elfogadjuk, akkor igaznak tűnhet. Ehelyett helyesebb lenne azt mondani, hogy a nullhipotézist nem utasítják el, mert nincs elegendő statisztikai bizonyíték az elutasításhoz.

Az illeszkedési kritériumok jóságát tesztelő statisztikai hipotézis
Az illeszkedési kritériumok jóságát tesztelő statisztikai hipotézis

Ez a pillanat gyakran összezavarja a kezdő statisztákat. Ilyen esetben fontos emlékeztetni magát arra, hogy az eredmény valószínűségi, és még a nullhipotézis elfogadása esetén is van egy kis hibalehetőség.

Igaz vagy hamis nullhipotézis

A p értékének értelmezése nem azt jelenti, hogy nullaa hipotézis igaz vagy hamis. Ez azt jelenti, hogy az empirikus adatok és a választott statisztikai teszt alapján döntés született a nullhipotézis elutasításáról vagy elutasításáról a statisztikai szignifikancia bizonyos szintjén. Ezért a p-érték felfogható a statisztikai tesztekbe ágyazott előre meghatározott feltételezés alapján adott adatok valószínűségének. A p-érték annak mértéke, hogy mekkora valószínűséggel lesz megfigyelhető az adatminta, ha a nullhipotézis igaz.

A kritikus értékek értelmezése

Egyes tesztek nem adják vissza a p. Ehelyett visszaadhatják a kritikus értékek listáját. Egy ilyen vizsgálat eredményeit hasonló módon értelmezik. Ahelyett, hogy egyetlen p-értéket egy előre meghatározott szignifikanciaszinttel hasonlítanának össze, a tesztstatisztikát egy kritikus értékkel hasonlítják össze. Ha kiderül, hogy kevesebb, az azt jelenti, hogy nem lehetett elvetni a nullhipotézist. Ha nagyobb vagy egyenlő, a nullhipotézist el kell utasítani. A statisztikai hipotézisvizsgáló algoritmus jelentése és eredményének értelmezése hasonló a p-értékhez. A választott szignifikanciaszint egy valószínűségi döntés, hogy elutasítják-e vagy nem utasítják el az alapteszt feltevését az adatok alapján.

Hibák a statisztikai tesztekben

A statisztikai hipotézis teszt értelmezése valószínűségi. A statisztikai hipotézisek tesztelésének nem az a feladata, hogy igaz vagy hamis állítást találjunk. A teszt bizonyítékai tévesek lehetnek. Például, ha az alfa 5%, ez azt jelenti, hogy a legtöbb esetben 1 a 20-bóla nullhipotézist tévedésből elutasítjuk. Vagy nem az adatmintában lévő statisztikai zaj miatt. Ezen a ponton egy kis p érték, amelynél el kell utasítani a nullhipotézist, azt jelentheti, hogy hamis, vagy hibát követtek el. Ha ilyen típusú hibát követnek el, az eredményt hamis pozitívnak nevezik. Az ilyen hiba pedig az első fajta hiba a statisztikai hipotézisek tesztelésekor. Másrészt, ha a p-érték elég nagy ahhoz, hogy a nullhipotézis elutasítását jelentse, ez azt jelentheti, hogy igaz. Vagy nem helyes, és valamilyen valószínűtlen esemény történt, amely miatt a hiba bekövetkezett. Az ilyen típusú hibát hamis negatívnak nevezik.

Nullhipotézisek statisztikai tesztelése
Nullhipotézisek statisztikai tesztelése

A hibák valószínűsége

A statisztikai hipotézisek tesztelésekor továbbra is fennáll az ilyen típusú hibák elkövetésének esélye. Valószínűleg hamis adatok vagy hamis következtetések vonhatók le. Ideális esetben olyan szignifikanciaszintet kell választani, amely minimálisra csökkenti e hibák valamelyikének valószínűségét. Például a nullhipotézisek statisztikai tesztelése nagyon alacsony szignifikanciaszinttel rendelkezhet. Bár az olyan szignifikanciaszintek, mint a 0,05 és 0,01, a tudomány számos területén gyakoriak, a leggyakrabban használt szignifikanciaszint a 310^-7 vagy 0,0000003. Gyakran „5-szigmának” nevezik. Ez azt jelenti, hogy a következtetés véletlenszerű volt, a kísérletek 3,5 millió független ismétléséből 1 valószínűséggel. A statisztikai hipotézisek tesztelésének példái gyakran tartalmaznak ilyen hibákat. Ez is az oka annak, hogy fontos a független eredmények.ellenőrzés.

Példák a statisztikai ellenőrzés használatára

Több gyakori példa létezik a hipotézisvizsgálatra a gyakorlatban. Az egyik legnépszerűbb teakóstoló néven ismert. Dr. Muriel Bristol, Robert Fisher biometrikus alapító kollégája azt állította, hogy biztosan meg tudja mondani, hogy először egy csésze teához vagy tejhez adták-e hozzá. Fisher felajánlotta, hogy véletlenszerűen ad neki nyolc csészét (mindegyik fajtából négyet). A tesztstatisztika egyszerű volt: megszámolni a kupaválasztás sikereit. A kritikus régió volt az egyetlen sikeres 4 közül, valószínűleg a szokásos valószínűségi kritérium alapján (< 5%; 1 a 70-hez ≈ 1,4%). Fisher azzal érvelt, hogy nincs szükség alternatív hipotézisre. A hölgy minden csészét helyesen azonosított, ami statisztikailag szignifikáns eredménynek számított. Ez a tapasztalat vezetett Fisher Statisztikai módszerek kutatók számára című könyvéhez.

Alperes Példa

A statisztikai tárgyalási eljárás egy büntetőbírósághoz hasonlítható, ahol a vádlottat mindaddig ártatlannak tekintik, amíg bűnösségét be nem bizonyítják. Az ügyész a vádlott bűnösségét próbálja bizonyítani. Csak akkor lehet a vádlottat bűnösnek nyilvánítani, ha elegendő bizonyíték áll rendelkezésre a vádemelésre. Az eljárás elején két hipotézis létezik: „A vádlott nem bűnös” és „A vádlott bűnös”. Az ártatlanság hipotézise csak akkor utasítható el, ha a tévedés nagyon valószínűtlen, mert nem akarunk elítélni egy ártatlan vádlottat. Az ilyen hibát I. típusú hibának nevezzük, és annak előfordulásátritkán irányított. Ennek az aszimmetrikus viselkedésnek a következményeként gyakoribb a II-es típusú hiba, azaz az elkövető felmentése.

Statisztikai érvényesítési példák
Statisztikai érvényesítési példák

A statisztikák hasznosak nagy mennyiségű adat elemzésekor. Ez vonatkozik a hipotézisek tesztelésére is, amelyek akkor is igazolhatják a következtetéseket, ha nem létezik tudományos elmélet. A teakóstoló példában „nyilvánvaló” volt, hogy nincs különbség aközött, hogy tejet öntünk a teába vagy a teát a tejbe.

A hipotézisvizsgálat valós gyakorlati alkalmazása magában foglalja:

  • megvizsgálja, hogy a férfiaknak több rémálmaik vannak-e, mint a nőknek;
  • dokumentummegjelölés;
  • A telihold viselkedésre gyakorolt hatásának felmérése;
  • meghatározza azt a tartományt, amelyen belül a denevér visszhang segítségével észlelhet egy rovart;
  • a dohányzásról való leszokás legjobb módszerének kiválasztása;
  • Annak ellenőrzése, hogy a lökhárító matricák tükrözik-e az autó tulajdonosának viselkedését.

A statisztikai hipotézisek tesztelése fontos szerepet játszik a statisztikákban általában és a statisztikai következtetésekben. Az értéktesztet a becsült érték és a kísérleti eredmény hagyományos összehasonlítása helyett használják a tudományos módszer középpontjában. Ha egy elmélet csak egy kapcsolat előjelét képes előre jelezni, az irányított hipotézisvizsgálatokat úgy lehet konfigurálni, hogy csak statisztikailag szignifikáns eredmény támassza alá az elméletet. Az értékeléselméletnek ez a formája a legmerevebba hipotézisvizsgálat használatának kritikája.

Ajánlott: