Mi a Pearson-féle elosztási törvény? A válasz erre a tág kérdésre nem lehet egyszerű és tömör. A Pearson-rendszert eredetileg látható torz megfigyelések modellezésére tervezték. Abban az időben jól ismert volt, hogyan kell egy elméleti modellt úgy hangolni, hogy az megfeleljen a megfigyelt adatok első két kumulánsának vagy mozzanatának: bármely valószínűségi eloszlás közvetlenül kibővíthető helyskálák csoportjába.
Pearson hipotézise a kritériumok normális eloszlásáról
A patológiás esetek kivételével a helyskálát tetszőleges módon úgy állíthatjuk be, hogy megfeleljenek a megfigyelt átlagnak (első kumuláns) és a variancianak (második kumuláns). Nem ismert azonban, hogyan lehet olyan valószínűségi eloszlást létrehozni, amelyben a ferdeség (standardizált harmadik kumuláns) és a kurtózis (standardizált negyedik kumuláns) egyformán szabadon szabályozható. Ez az igény akkor vált nyilvánvalóvá, amikor az ismert elméleti modelleket próbáltuk a megfigyelt adatokhoz illeszteni,aki aszimmetriát mutatott.
Az alábbi videóban megtekintheti Pearson chi-eloszlásának elemzését.
Előzmények
Eredeti munkájában Pearson a normál eloszláson (amely eredetileg V típusként ismert) négyféle eloszlást azonosított (I-től IV-ig). Az osztályozás attól függ, hogy az eloszlásokat egy korlátozott intervallumon, egy féltengelyen vagy a teljes valós vonalon támogatják-e, és hogy potenciálisan ferdék voltak-e vagy szükségszerűen szimmetrikusak.
Két kihagyást javítottak ki a második írásban: újradefiniálta az V típusú eloszlást (eredetileg csak normál eloszlás volt, de most inverz gammával), és bevezette a VI. típusú eloszlást. Az első két cikk együttesen a Pearson-rendszer öt fő típusát fedi le (I., III., IV., V. és VI.). A harmadik cikkben Pearson (1916) további altípusokat vezetett be.
A koncepció tökéletesítése
Rind feltalált egy egyszerű módot a Pearson-rendszer paraméterterének (vagy a kritériumok eloszlásának) megjelenítésére, amelyet később át is vett. Ma sok matematikus és statisztikus használja ezt a módszert. A Pearson-eloszlások típusait két mennyiség jellemzi, általában β1 és β2. Az első az aszimmetria négyzete. A második a hagyományos kurtosis, vagy a negyedik standardizált momentum: β2=γ2 + 3.
A modern matematikai módszerek a kurtosis γ2-t kumulánsként határozzák meg momentumok helyett, tehát normál eseténeloszlásnál γ2=0 és β2=3. Itt érdemes követni a történelmi precedenst és β2-t használni. A jobb oldali diagram azt mutatja, hogy egy adott Pearson-eloszlás milyen típusú (ponttal (β1, β2) jelölve).
A ma ismert ferde és/vagy nem mezokurtikus eloszlások közül sok még nem volt ismert az 1890-es évek elején. A ma béta eloszlásnak nevezettet Thomas Bayes használta a Bernoulli-eloszlás utólagos paramétereként az inverz valószínűségről szóló 1763-as cikkében.
A béta disztribúció előtérbe került a Pearson rendszerben való jelenléte miatt, és az 1940-es évekig Pearson I. típusú disztribúcióként ismerték. A II. típusú eloszlás az I. típus speciális esete, de általában már nem különítik el.
A Gamma-eloszlás az ő munkájából származik, és Pearson Type III Normal Distribution néven volt ismert, mielőtt az 1930-as és 1940-es években felvette volna modern nevét. Egy tudós 1895-ös tanulmánya a IV. típusú eloszlást, amely a Student-féle t-eloszlást tartalmazza, speciális esetként mutatta be, amely több évvel megelőzte William Seely Gosset későbbi használatát. 1901-es dolgozata inverz gamma (V típus) és béta prímszámok (VI. típus) eloszlását mutatta be.
Más vélemény
Ord szerint Pearson kidolgozta az (1) egyenlet alapformáját a normál eloszlási sűrűségfüggvény logaritmusának deriváltjának képleten (amely lineáris osztást ad a másodfokúval)szerkezet). Sok szakember még mindig foglalkozik a Pearson-kritériumok eloszlására vonatkozó hipotézis tesztelésével. És ez bizonyítja a hatékonyságát.
Ki volt Karl Pearson
Karl Pearson angol matematikus és biostatisztika volt. Nevéhez fűződik a matematikai statisztika tudományágának megteremtése. 1911-ben megalapította a világ első statisztikai tanszékét a londoni University College-ban, és jelentős mértékben hozzájárult a biometria és a meteorológia területéhez. Pearson a szociáldarwinizmus és az eugenika híve is volt. Sir Francis G alton pártfogoltja és életrajzírója volt.
Biometria
Karl Pearson fontos szerepet játszott a biometrikus iskola létrehozásában, amely versengő elmélet volt a populációk evolúciójának és öröklődésének leírásában a 20. század fordulóján. Tizennyolc cikkből álló sorozata „Matematikai hozzájárulások az evolúcióelmélethez” tette őt a biometrikus öröklési iskola megalapítójává. Valójában Pearson ideje nagy részét 1893 és 1904 között ennek szentelte a biometrikus adatok statisztikai módszereinek fejlesztése. Ezek a ma statisztikai elemzésre széles körben használt módszerek magukban foglalják a khi-négyzet tesztet, a szórást, a korrelációs és regressziós együtthatókat.
Az öröklődés kérdése
Pearson öröklődési törvénye kimondta, hogy a csíraplazma a szülőktől, valamint a távolabbi ősöktől örökölt elemekből áll, amelyek aránya különböző jellemzők szerint változott. Karl Pearson G alton követője volt, és bár az őa munkák bizonyos tekintetben eltértek egymástól, Pearson tanára statisztikai fogalmainak jelentős részét felhasználta az öröklődés biometrikus iskolájának megfogalmazásakor, például a regresszió törvényét.
Az iskola jellemzői
A biometrikus iskola a mendeliekkel ellentétben nem az öröklődési mechanizmusra összpontosított, hanem egy olyan matematikai leírásra, amely nem volt oksági jellegű. Míg G alton egy nem folytonos evolúcióelméletet javasolt, amelyben a fajok nagy ugrásokkal változnának az idő múlásával felhalmozódó kis változások helyett, Pearson rámutatott ennek az érvelésnek a hibáira, és ténylegesen felhasználta elképzeléseit egy folyamatos evolúcióelmélet kidolgozására. A mendeliek előnyben részesítették az evolúció nem folytonos elméletét.
Míg G alton főként a statisztikai módszerek alkalmazására összpontosított az öröklődés tanulmányozására, Pearson és kollégája, Weldon kibővítette érvelését ezen a területen, a természetes és szexuális szelekció variációiban, összefüggéseiben.
Egy pillantás az evolúcióba
Pearson számára az evolúció elméletének nem az volt a célja, hogy azonosítsa azt a biológiai mechanizmust, amely megmagyarázza az öröklődési mintákat, míg a mendeli megközelítés szerint a gén az öröklődés mechanizmusa.
Pearson kritizálta Batesont és más biológusokat, amiért nem alkalmaztak biometrikus módszereket az evolúció tanulmányozása során. Elítélte azokat a tudósokat, akik nem arra koncentráltakelméleteik statisztikai érvényessége, kimondva:
"Mielőtt a [progresszív változás bármely okát] tényezőként elfogadhatnánk, nemcsak annak valószerűségét kell megmutatnunk, hanem lehetőség szerint bizonyítanunk kell mennyiségi képességét is."
A biológusok behódoltak az öröklődés okairól szóló „szinte metafizikai spekulációknak”, amelyek felváltották a kísérleti adatok gyűjtésének folyamatát, ami valójában lehetővé teheti a tudósok számára, hogy leszűkítsék a lehetséges elméleteket.
A természet törvényei
Pearson számára a természet törvényei hasznosak voltak a pontos előrejelzések készítéséhez és a megfigyelt adatok tendenciáinak összegzéséhez. Az ok az volt, hogy „egy bizonyos sorozat megtörtént és megismétlődött a múltban”.
Így a genetika egy bizonyos mechanizmusának azonosítása nem volt méltó próbálkozás a biológusok számára, hanem inkább az empirikus adatok matematikai leírására kellene összpontosítaniuk. Ez részben keserű vitához vezetett a biometrikusok és a mendeliek, köztük Bateson között.
Miután az utóbbi elutasította Pearson egyik kéziratát, amely az utódok variációjának vagy homotipiájának új elméletét írja le, Pearson és Weldon 1902-ben megalapította a Biometrika céget. Bár az öröklődés biometrikus megközelítése végül elvesztette mendeli perspektíváját, az akkoriban kifejlesztett módszerek létfontosságúak a mai biológia és evolúció tanulmányozása szempontjából.