Chi-Kvadrat számológép
Számolja ki a chi-kvadrat statisztikát, a p-értéket és a szabadságfokokat egy 2x2-es váratlan táblázatban. Azonnal tesztelje a függetlenséget két kategorikus változó között. Ingyenes statisztikai eszköz.
Mi az a chi-kvadrát teszt?
A chi-kvadrát (χ2) teszt az egyik legszélesebb körben használt statisztikai teszt a kategorikus adatok elemzéséhez.Két kategorikus változó független, vagy van köztük valódi kapcsolat?A numerikus adatok tesztjeitől eltérően (mint a t-tesztek), a chi-kvadrát számokkal működik -- hány tétel tartozik az egyes kategóriákba.
Klasszikus példák a chi-kvadrát alkalmazásokra:
- A dohányzási állapot (dohányzó/nem dohányzó) összefügg-e a tüdőbetegséggel (igen/nem)?
- Van-e összefüggés az edzés gyakorisága (alacsony/magas) és a sérülések aránya (igen/nem)?
- A nem befolyásolja-e a termékpreferenciát (A termék/B termék)?
- A kockák egyenlőek-e? (Az egyes arcok körülbelül 1/6 alkalommal jelennek meg?)
A teszt összehasonlítással működik.megfigyelhető gyakoriságok(amit ténylegesen számoltál)várható gyakoriságokHa a megfigyelt számok eléggé eltérnek a vártaktól, elutasítjuk a függetlenség hipotézisét, és arra a következtetésre jutunk, hogy a változók összefüggésben vannak.
Egy 2x2-es táblázat esetében (minden két változóra két kategória) a tesztnek 1 szabadságfoka van. Az eredményes chi-kvadrát statisztikát összehasonlítják egy kritikus értékkel, vagy p-értékre konvertálják a statisztikai jelentőség meghatározása érdekében.
A chi négyzet képlete egy 2x2-es táblázatnak
Adva egy 2x2-es vészhelyzeti táblázatot az A, B, C, D megfigyelhető számokkal:
| 1. kategória | 2. kategória | Sorok összege | |
|---|---|---|---|
| 1. csoport | A | B | A + B |
| 2. csoport | C | D | C + D |
| Col összesen | A + C | B + D | N = A+B+C+D |
1. lépés -- A várható gyakoriságok kiszámítása:
E_A = (A+B) ((A+C) /N E_B = (A+B) ((B+D) /N
E_C = (C+D) ((A+C) /N E_D = (C+D) ((B+D) /N
2. lépés - Számolja ki a chi négyzetét:
χ2 = Σ [(O - E) 2 / E]
= (A-E_A)2/E_A + (B-E_B)2/E_B + (C-E_C)2/E_C + (D-E_D)2/E_D
Vagy egyenértékűen egy 2x2-es táblázat esetében a rövidítő képlet:
χ2 = N ((AD - BC) 2 / [ ((A+B) ((C+D) ((A+C) ((B+D)) ]
3. lépés - Szabadságfok:Egy 2x2-es táblázat esetében: df = (sorok - 1) x (foltok - 1) = 1 x 1 = 1
4. lépés -- Szerezd meg a p-értéket:Hasonlítsuk össze a χ2-t a chi négyzet eloszlással, ahol df=1. 95%-os megbízhatósággal (α=0.05) a kritikus érték 3,841. Ha a χ2 > 3,841, az eredmény statisztikailag szignifikáns - elutasítjuk a függetlenséget.
Működött példa:A = 50 (magas frekvenciájú edzésen részt vevő futók, sérülés nélkül), B = 30 (magas frekvencia, sérülés), C = 20 (alacsony frekvencia, sérülés nélkül), D = 40 (alacsony frekvencia, sérülés). N = 140.
- χ2 = 140 x (50x40 - 30x20) 2 / [{80) }{60) }{70) ] = 140 x (2000-600) 2 / 23,520,000
- = 140 x 1 960 000 / 23 520 000 = 11,67
- Az edzés gyakorisága és a sérülés nem függetlenek.
A chi-kvadrát kritikus értékek táblázata
A chi-kvadratos jelentőség vizsgálatának referenciaértékei 1 szabadságfokkal (2x2-es táblázat):
| p-érték | Jelentőség | Kritikus χ2 (df=1) | Értelmezés |
|---|---|---|---|
| 0,10 | 90%-os megbízhatóság | 2.706 | Jelentős tendencia |
| 0,05 | 95%-os megbízhatóság | 3.841 | Statisztikailag jelentős |
| 0,01 | 99%-os megbízhatóság | 6.635 | Nagyon jelentős. |
| 0,001 | 99,9%-os megbízhatóság | 10.828 | Nagyon nagy jelentőségű. |
A nagyobb várakozási tábláknál a szabadságfokok emelkednek. A 2x3 táblázatnál: df = (2-1) (((3-1) = 2. A 3x3 táblázatnál: df = 4. A kritikus érték a szabadságfokkal növekszik, így a nagyobb táblák nagyobb chi-kvadrát értékeket igényelnek a jelentőség eléréséhez.
| A táblázat mérete | df | Kritikus χ2 (p=0,05) | Kritikus χ2 (p=0,01) |
|---|---|---|---|
| 2x2 | 1 | 3.841 | 6.635 |
| 2x3 vagy 3x2 | 2 | 5.991 | 9.210 |
| 3x3 | 4 | 9.488 | 13.277 |
| 4x4-es | 9 | 16.919 | 21.666 |
Feltételezések és mikor érvényes a ki négyzet
A chi-kvadrát tesztnek számos fontos feltételezése van, amelyek teljesülniük kell az érvényes eredményekhez:
- A megfigyelések függetlensége:Ha ugyanazokat az egyéneket kétszer mérik (előtte/utána), helyette a McNemar-tesztet kell használni.
- Megfelelő várható gyakoriság:Az összes várható sejtfrekvenciának >= 5-nek kell lennie. Ha bármely várható sejtnek kevesebb, mint 5-e van, a chi-kvadrát megbízhatatlan lehet. Ehelyett használjuk a Fisher pontos tesztet kis minták esetében.
- Véletlenszerű mintavételezés:Az adatoknak véletlenszerű vagy reprezentatív mintából kell származniuk, nem pedig olyan önkéntesek kényelmi mintájából, akik szisztematikusan eltérhetnek a populációtól.
- Csak kategorikus adatok:A chi-kvadrát számokhoz/kategóriákhoz való. Ne használd folyamatos numerikus adatokhoz - használd helyette a korrelációt, a t-teszteket vagy az ANOVA-t.
Yates folytonossági korrekció:A 2x2-es táblázatok esetében, ahol a minták kis méretűek (n < 40 vagy bármilyen várható gyakoriság < 10), a Yates-korrekció 0,5 -t von le minden O-E-ból a négyzetre emelés előtt, csökkentve a chi-kvadrát értékét. Ez a korrekció vitatott - néhány statisztikus helyette Fisher pontos tesztjét javasolja. Számítógépünk mind a nem korrigált, mind a Yates-korrigált értékeket mutatja.
Fisher pontos tesztje:2x2-es táblázatok esetében, ahol nagyon kis minták vannak (összesen N < 20, vagy bármely várható sejt < 5), a Fisher pontos tesztje kiszámítja az adott sejtek számának pontos valószínűségét, anélkül, hogy a chi-kvadrát megközelítésre támaszkodna. Ez az aranystandard a kis minták számára az orvostudományban és a biológiában.
Hatásméret: Phi (φ) és Cramér V
Egy statisztikailag szignifikáns chi-kvadrát eredménye azt mondja, hogy van egy valódi kapcsolat, de nem azt, hogy mennyire erős. Egy nagyon nagy minta még egy apró, gyakorlatilag értelmetlen társulást is statisztikailag szignifikánsá teheti. A hatásméret mérése a kapcsolat erősségét számszerűsíti függetlenül a minta méretétől.
| Az intézkedés | A képlet | Hatótávolság | Mikor kell használni? |
|---|---|---|---|
| Phi (φ) | √(χ2/N) | 0-tól 1-ig | Csak 2x2-es asztalok |
| Cramér V-je | √(χ2/(Nxmin(r-1,c-1))) | 0-tól 1-ig | Bármilyen méretű asztal |
Értelmezési iránymutatások (Cohen, 1988):
- Kis hatás:φ vagy V = 0,1 - kapcsolat létezik, de gyenge; a gyakorlati hatás minimális lehet
- Középszerű hatás:φ vagy V = 0,3 -- mérsékelt kapcsolat, amely érdemes figyelmet szentelni az alkalmazott kutatásban
- Nagy hatás:φ vagy V = 0,5 - erős kapcsolat, egyértelműen látható az adatok vizualizációjában
Példa: Az edzés gyakorisága / sérülés példájában (χ2 = 11.67, N = 140), phi = √(11.67/140) = √0.0834 = 0.29 - közepes hatásméret. A kapcsolat valós és mérsékelten erős, nem csak egy statisztikai artefaktum egy nagy mintából.
Ki-kvadratos megfelelőség vizsgálata
A két változó közötti függetlenség vizsgálata mellett a chi-kvadrátot arra is használják, hogy megvizsgálják, hogy a megfigyelt számok eloszlása megfelel-e a várható (elméleti) eloszlásnak.a megfelelőség vizsgálata.
Klasszikus alkalmazások:
- Tisztességes tesztelés:Ha 60szor dobunk egy kockát, akkor minden egyes kockát 10-szer dobunk, de elég közel jutottunk ahhoz, hogy azt mondjuk, a kockák tisztességesek?
- Genetikai arányok:Mendel borsó kísérletei azt vizsgálták, hogy a megfigyelt utódok aránya (pl. 3: 1 domináns: recesszív) megfelel-e a várt genetikai arányoknak.
- Születésnapi eloszlás:A születések egyenletesen eloszlanak a hét napjai között, vagy bizonyos napok gyakrabban fordulnak elő (a tervezett császármetszések és indukciók miatt)?
- Piaci részesedés:A termék megfigyelt beszerzési eloszlása megfelel-e a várt piaci részesedési százalékoknak?
A képlet: χ2 = Σ[(O_i - E_i) 2 / E_i] minden i. kategóriára. A szabadságfokok = a kategóriák száma - 1 (minusz minden további becsült paraméter). A vizsgálat ugyanazt a chi-kvadrát eloszlást követi, mint a függetlenségi vizsgálat.
Valós világbeli alkalmazások a sport és az egészség kutatásában
A chi-kvadrát tesztek a sporttudomány és a járványügyi kutatás munkahelyét képezik, mert ezen területeken a legtöbb adat kategorikus.
Sérülési kockázati tényezők:Összehasonlítva a felmelegedési gyakorlatokat végző sportolók és a nem végző sportolók közötti sérülési arányokat. Megfigyelés: 15 sérülés 80 felmelegedő sportoló között, 28 sérülés 70 nem felmelegedő sportoló között. A chi-kvadrát vizsgálja, hogy ez a 18,75% vs. 40% különbség statisztikailag jelentős-e, vagy csak véletlen.
Kiegészítő hatásossági vizsgálatok:Az X kiegészítőt szedő sportolók teljesítményjavulást jelentettek-e (igen/nem)? 200 sportolóval egy 2x2-es táblázatban a chi-kvadrát gyorsan meghatározza, hogy bármely megfigyelt összefüggés meghaladja-e azt, amit egyedül a véletlen eredményezne.
A doppingellenőrzés eredményei:Annak elemzése, hogy a pozitív teszt arányok sportok vagy versenyszintek között eltérnek-e. Minden sport/szint oszlop lesz; pozitív/negatív lesz a sor változó.
Orvosi szűrés:Az új diagnosztikai teszt pozitív vagy negatív összefüggésben áll-e a valódi betegség állapotával (az aranystandard megerősítésével)? Ez ad érzékenységet és specifikusságot, és a chi-kvadrát megerősíti, hogy a teszt jobban teljesít, mint a véletlen.
A felmérés válaszainak elemzése:A férfiak és a nők eltérően reagálnak egy kategorikus felmérési kérdésre (egyeznek/nem értenek egyet/semlegesek)? 2x3 chi-kvadrát teszt (nemek x válasz) válaszol erre.
Mindezekben az esetekben a chi négyzete a helyes választás, mert az adatok kategorikus eredmények gyakorisága, nem folyamatos mérések. Ez a statisztikai teszt, ami azt kérdezi: "a nullhipotézisünk alapján, hogy ezek a változók nem kapcsolódnak egymáshoz, mennyire meglepőek az adataink?"
Gyakran feltett kérdések
Mire használjuk a chi négyzet tesztet?
A chi-kvadrat vizsgálatot arra használják, hogy megállapítsák, hogy van-ekét kategorikus változó közötti jelentős összefüggés(függetlenség vizsgálata) vagy hogy a megfigyelt kategóriák száma megfelel-e a várt számoknak (a megfelelőség vizsgálata). A gyakorisági adatokkal működik -- a számok, hogy hány tétel esik az egyes kategóriákba -- nem pedig a folyamatos mérések.
Melyik p-érték jelentőségteljes a chi-kvadrát tesztben?
A hagyományos küszöbértékp < 0,05Ha a p-érték 0,05-nél alacsonyabb, elutasítja a függetlenség nullhipotézisét, és arra a következtetésre jut, hogy a változók jelentősen összefüggnek.
Melyek a szabadságfokok a chi négyzet tesztben?
A vészhelyzeti táblázathoz:df = (sorok száma - 1) x (oszlopok száma - 1)Egy 2x2-es táblázathoz: df = 1. Egy 3x4-es táblázathoz: df = (3-1) (((4-1) = 6. A megfelelőség vizsgálatához: df = kategóriák száma - 1. A szabadságfokok határozza meg, hogy melyik chi-kvadrát eloszlást kell használni a p-érték meghatározásához.
Mi van, ha a várható mobilfrekvenciám kevesebb, mint 5?
Ha a várható sejtfrekvenciakevesebb, mint 5, a standard chi-kvadrat megközelítés megbízhatatlan lehet. Opciók: (1) Használja a Fisher pontos tesztet, amely pontos p-értékeket ad a kis minták számára; (2) Kombinálja a kategóriákat, ha ez tartalmi értelemben értelmes; (3) Alkalmazza a Yates folytonossági korrekciót (vitatott, de néha használatos). 2x2 táblázatok esetében, összesen N < 20, a Fisher pontos tesztje erősen előnyös.
A chi négyzete meg tudja mondani, hogy milyen erős a kapcsolat?
Csak a chi négyzet jelentőségét.nem jelzi a hatás méretétEgy elég nagy mintával még egy triviálisan gyenge kapcsolat is statisztikailag jelentőssé válik.Phi (φ)2x2-es asztalokhoz, vagyCramér V-jeA 0,1-hez közeli értékek kis értékek, a 0,3-hoz közeli értékek közepes értékek, a 0,5-hez közeli értékek pedig nagy értékek.