Skip to main content
🟢 Beginner

Chi-Kvadrat számológép

Számolja ki a chi-kvadrat statisztikát, a p-értéket és a szabadságfokokat egy 2x2-es váratlan táblázatban. Azonnal tesztelje a függetlenséget két kategorikus változó között. Ingyenes statisztikai eszköz.

Mi az a chi-kvadrát teszt?

A chi-kvadrát (χ2) teszt az egyik legszélesebb körben használt statisztikai teszt a kategorikus adatok elemzéséhez.Két kategorikus változó független, vagy van köztük valódi kapcsolat?A numerikus adatok tesztjeitől eltérően (mint a t-tesztek), a chi-kvadrát számokkal működik -- hány tétel tartozik az egyes kategóriákba.

Klasszikus példák a chi-kvadrát alkalmazásokra:

A teszt összehasonlítással működik.megfigyelhető gyakoriságok(amit ténylegesen számoltál)várható gyakoriságokHa a megfigyelt számok eléggé eltérnek a vártaktól, elutasítjuk a függetlenség hipotézisét, és arra a következtetésre jutunk, hogy a változók összefüggésben vannak.

Egy 2x2-es táblázat esetében (minden két változóra két kategória) a tesztnek 1 szabadságfoka van. Az eredményes chi-kvadrát statisztikát összehasonlítják egy kritikus értékkel, vagy p-értékre konvertálják a statisztikai jelentőség meghatározása érdekében.

A chi négyzet képlete egy 2x2-es táblázatnak

Adva egy 2x2-es vészhelyzeti táblázatot az A, B, C, D megfigyelhető számokkal:

1. kategória2. kategóriaSorok összege
1. csoportABA + B
2. csoportCDC + D
Col összesenA + CB + DN = A+B+C+D

1. lépés -- A várható gyakoriságok kiszámítása:

E_A = (A+B) ((A+C) /N E_B = (A+B) ((B+D) /N
E_C = (C+D) ((A+C) /N E_D = (C+D) ((B+D) /N

2. lépés - Számolja ki a chi négyzetét:

χ2 = Σ [(O - E) 2 / E]
= (A-E_A)2/E_A + (B-E_B)2/E_B + (C-E_C)2/E_C + (D-E_D)2/E_D

Vagy egyenértékűen egy 2x2-es táblázat esetében a rövidítő képlet:

χ2 = N ((AD - BC) 2 / [ ((A+B) ((C+D) ((A+C) ((B+D)) ]

3. lépés - Szabadságfok:Egy 2x2-es táblázat esetében: df = (sorok - 1) x (foltok - 1) = 1 x 1 = 1

4. lépés -- Szerezd meg a p-értéket:Hasonlítsuk össze a χ2-t a chi négyzet eloszlással, ahol df=1. 95%-os megbízhatósággal (α=0.05) a kritikus érték 3,841. Ha a χ2 > 3,841, az eredmény statisztikailag szignifikáns - elutasítjuk a függetlenséget.

Működött példa:A = 50 (magas frekvenciájú edzésen részt vevő futók, sérülés nélkül), B = 30 (magas frekvencia, sérülés), C = 20 (alacsony frekvencia, sérülés nélkül), D = 40 (alacsony frekvencia, sérülés). N = 140.

A chi-kvadrát kritikus értékek táblázata

A chi-kvadratos jelentőség vizsgálatának referenciaértékei 1 szabadságfokkal (2x2-es táblázat):

p-értékJelentőségKritikus χ2 (df=1)Értelmezés
0,1090%-os megbízhatóság2.706Jelentős tendencia
0,0595%-os megbízhatóság3.841Statisztikailag jelentős
0,0199%-os megbízhatóság6.635Nagyon jelentős.
0,00199,9%-os megbízhatóság10.828Nagyon nagy jelentőségű.

A nagyobb várakozási tábláknál a szabadságfokok emelkednek. A 2x3 táblázatnál: df = (2-1) (((3-1) = 2. A 3x3 táblázatnál: df = 4. A kritikus érték a szabadságfokkal növekszik, így a nagyobb táblák nagyobb chi-kvadrát értékeket igényelnek a jelentőség eléréséhez.

A táblázat méretedfKritikus χ2 (p=0,05)Kritikus χ2 (p=0,01)
2x213.8416.635
2x3 vagy 3x225.9919.210
3x349.48813.277
4x4-es916.91921.666

Feltételezések és mikor érvényes a ki négyzet

A chi-kvadrát tesztnek számos fontos feltételezése van, amelyek teljesülniük kell az érvényes eredményekhez:

Yates folytonossági korrekció:A 2x2-es táblázatok esetében, ahol a minták kis méretűek (n < 40 vagy bármilyen várható gyakoriság < 10), a Yates-korrekció 0,5 -t von le minden O-E-ból a négyzetre emelés előtt, csökkentve a chi-kvadrát értékét. Ez a korrekció vitatott - néhány statisztikus helyette Fisher pontos tesztjét javasolja. Számítógépünk mind a nem korrigált, mind a Yates-korrigált értékeket mutatja.

Fisher pontos tesztje:2x2-es táblázatok esetében, ahol nagyon kis minták vannak (összesen N < 20, vagy bármely várható sejt < 5), a Fisher pontos tesztje kiszámítja az adott sejtek számának pontos valószínűségét, anélkül, hogy a chi-kvadrát megközelítésre támaszkodna. Ez az aranystandard a kis minták számára az orvostudományban és a biológiában.

Hatásméret: Phi (φ) és Cramér V

Egy statisztikailag szignifikáns chi-kvadrát eredménye azt mondja, hogy van egy valódi kapcsolat, de nem azt, hogy mennyire erős. Egy nagyon nagy minta még egy apró, gyakorlatilag értelmetlen társulást is statisztikailag szignifikánsá teheti. A hatásméret mérése a kapcsolat erősségét számszerűsíti függetlenül a minta méretétől.

Az intézkedésA képletHatótávolságMikor kell használni?
Phi (φ)√(χ2/N)0-tól 1-igCsak 2x2-es asztalok
Cramér V-je√(χ2/(Nxmin(r-1,c-1)))0-tól 1-igBármilyen méretű asztal

Értelmezési iránymutatások (Cohen, 1988):

Példa: Az edzés gyakorisága / sérülés példájában (χ2 = 11.67, N = 140), phi = √(11.67/140) = √0.0834 = 0.29 - közepes hatásméret. A kapcsolat valós és mérsékelten erős, nem csak egy statisztikai artefaktum egy nagy mintából.

Ki-kvadratos megfelelőség vizsgálata

A két változó közötti függetlenség vizsgálata mellett a chi-kvadrátot arra is használják, hogy megvizsgálják, hogy a megfigyelt számok eloszlása megfelel-e a várható (elméleti) eloszlásnak.a megfelelőség vizsgálata.

Klasszikus alkalmazások:

A képlet: χ2 = Σ[(O_i - E_i) 2 / E_i] minden i. kategóriára. A szabadságfokok = a kategóriák száma - 1 (minusz minden további becsült paraméter). A vizsgálat ugyanazt a chi-kvadrát eloszlást követi, mint a függetlenségi vizsgálat.

Valós világbeli alkalmazások a sport és az egészség kutatásában

A chi-kvadrát tesztek a sporttudomány és a járványügyi kutatás munkahelyét képezik, mert ezen területeken a legtöbb adat kategorikus.

Sérülési kockázati tényezők:Összehasonlítva a felmelegedési gyakorlatokat végző sportolók és a nem végző sportolók közötti sérülési arányokat. Megfigyelés: 15 sérülés 80 felmelegedő sportoló között, 28 sérülés 70 nem felmelegedő sportoló között. A chi-kvadrát vizsgálja, hogy ez a 18,75% vs. 40% különbség statisztikailag jelentős-e, vagy csak véletlen.

Kiegészítő hatásossági vizsgálatok:Az X kiegészítőt szedő sportolók teljesítményjavulást jelentettek-e (igen/nem)? 200 sportolóval egy 2x2-es táblázatban a chi-kvadrát gyorsan meghatározza, hogy bármely megfigyelt összefüggés meghaladja-e azt, amit egyedül a véletlen eredményezne.

A doppingellenőrzés eredményei:Annak elemzése, hogy a pozitív teszt arányok sportok vagy versenyszintek között eltérnek-e. Minden sport/szint oszlop lesz; pozitív/negatív lesz a sor változó.

Orvosi szűrés:Az új diagnosztikai teszt pozitív vagy negatív összefüggésben áll-e a valódi betegség állapotával (az aranystandard megerősítésével)? Ez ad érzékenységet és specifikusságot, és a chi-kvadrát megerősíti, hogy a teszt jobban teljesít, mint a véletlen.

A felmérés válaszainak elemzése:A férfiak és a nők eltérően reagálnak egy kategorikus felmérési kérdésre (egyeznek/nem értenek egyet/semlegesek)? 2x3 chi-kvadrát teszt (nemek x válasz) válaszol erre.

Mindezekben az esetekben a chi négyzete a helyes választás, mert az adatok kategorikus eredmények gyakorisága, nem folyamatos mérések. Ez a statisztikai teszt, ami azt kérdezi: "a nullhipotézisünk alapján, hogy ezek a változók nem kapcsolódnak egymáshoz, mennyire meglepőek az adataink?"

Gyakran feltett kérdések

Mire használjuk a chi négyzet tesztet?

A chi-kvadrat vizsgálatot arra használják, hogy megállapítsák, hogy van-ekét kategorikus változó közötti jelentős összefüggés(függetlenség vizsgálata) vagy hogy a megfigyelt kategóriák száma megfelel-e a várt számoknak (a megfelelőség vizsgálata). A gyakorisági adatokkal működik -- a számok, hogy hány tétel esik az egyes kategóriákba -- nem pedig a folyamatos mérések.

Melyik p-érték jelentőségteljes a chi-kvadrát tesztben?

A hagyományos küszöbértékp < 0,05Ha a p-érték 0,05-nél alacsonyabb, elutasítja a függetlenség nullhipotézisét, és arra a következtetésre jut, hogy a változók jelentősen összefüggnek.

Melyek a szabadságfokok a chi négyzet tesztben?

A vészhelyzeti táblázathoz:df = (sorok száma - 1) x (oszlopok száma - 1)Egy 2x2-es táblázathoz: df = 1. Egy 3x4-es táblázathoz: df = (3-1) (((4-1) = 6. A megfelelőség vizsgálatához: df = kategóriák száma - 1. A szabadságfokok határozza meg, hogy melyik chi-kvadrát eloszlást kell használni a p-érték meghatározásához.

Mi van, ha a várható mobilfrekvenciám kevesebb, mint 5?

Ha a várható sejtfrekvenciakevesebb, mint 5, a standard chi-kvadrat megközelítés megbízhatatlan lehet. Opciók: (1) Használja a Fisher pontos tesztet, amely pontos p-értékeket ad a kis minták számára; (2) Kombinálja a kategóriákat, ha ez tartalmi értelemben értelmes; (3) Alkalmazza a Yates folytonossági korrekciót (vitatott, de néha használatos). 2x2 táblázatok esetében, összesen N < 20, a Fisher pontos tesztje erősen előnyös.

A chi négyzete meg tudja mondani, hogy milyen erős a kapcsolat?

Csak a chi négyzet jelentőségét.nem jelzi a hatás méretétEgy elég nagy mintával még egy triviálisan gyenge kapcsolat is statisztikailag jelentőssé válik.Phi (φ)2x2-es asztalokhoz, vagyCramér V-jeA 0,1-hez közeli értékek kis értékek, a 0,3-hoz közeli értékek közepes értékek, a 0,5-hez közeli értékek pedig nagy értékek.