What is a chi square test?

Testul Chi-Pătrat al Bunății Ajustării

14/08/2025

Rating: 4.04 (3969 votes)

În lumea complexă a datelor și a cercetării, capacitatea de a determina dacă observațiile noastre se aliniază cu predicțiile sau așteptările este crucială. Fie că sunteți un cercetător, un analist de date sau pur și simplu curios să înțelegeți mai bine fenomenele din jurul dumneavoastră, Testul Chi-Pătrat al Bunății Ajustării (Chi-Square Goodness of Fit) este un instrument statistic fundamental care vă poate oferi răspunsuri clare. Acest test non-parametric ne permite să evaluăm cât de bine se potrivește o distribuție observată cu o distribuție teoretică așteptată. Este o metodă puternică pentru a valida ipoteze și pentru a înțelege abaterile.

How do you interpret chi-square goodness of fit?
Cuprins

Ce Este Testul Chi-Pătrat al Bunății Ajustării?

Testul Chi-Pătrat al Bunății Ajustării este o procedură statistică utilizată pentru a determina dacă există o diferență semnificativă între valorile observate ale unui fenomen și valorile așteptate (sau teoretice) ale acestuia. Termenul "bunătate a ajustării" se referă tocmai la măsura în care distribuția eșantionului nostru observat se potrivește cu o distribuție de probabilitate teoretică. Acest test este esențial atunci când dorim să verificăm dacă datele noastre categorice se conformează unui anumit model sau unei anumite ipoteze predefinite. De exemplu, dacă ne așteptăm ca anumite rezultate să apară cu o anumită frecvență, acest test ne ajută să vedem dacă observațiile noastre se abat semnificativ de la acele așteptări.

Spre deosebire de alte teste, Chi-Pătratul Bunății Ajustării este non-parametric, ceea ce înseamnă că nu face presupuneri despre forma distribuției populației din care provin datele. Acesta este un avantaj major, în special atunci când lucrăm cu date care nu respectă o distribuție normală.

Procedura Testului Chi-Pătrat al Bunății Ajustării

Pentru a efectua corect un Test Chi-Pătrat al Bunății Ajustării, trebuie să urmați o serie de pași bine definiți:

1. Stabilirea Ipotezelor

Orice test statistic începe cu formularea a două ipoteze complementare:

  • Ipoteza nulă (H₀): Aceasta afirmă că nu există o diferență semnificativă între valorile observate și cele așteptate. În termeni mai simpli, datele noastre observate se potrivesc bine cu distribuția teoretică sau cu modelul propus.
  • Ipoteza alternativă (H₁): Aceasta afirmă că există o diferență semnificativă între valorile observate și cele așteptate. Aceasta înseamnă că datele noastre nu se potrivesc cu distribuția teoretică sau cu modelul propus.

De exemplu, dacă aruncăm o monedă de 100 de ori, ipoteza nulă ar fi că "numărul de capete va fi de 50 din 100 de aruncări", iar ipoteza alternativă ar fi că "numărul de capete nu va fi de 50 din 100 de aruncări".

2. Calcularea Valorii Chi-Pătrat (χ²)

Valoarea statistică Chi-Pătrat se calculează folosind următoarea formulă:

χ² = Σ [ (Oᵢ - Eᵢ)² / Eᵢ ]

Unde:

  • Σ: Simbolul sumei (adică, însumăm pentru toate categoriile).
  • Oᵢ: Frecvența observată (numărul de cazuri) în categoria i.
  • Eᵢ: Frecvența așteptată (numărul de cazuri) în categoria i, dacă ipoteza nulă ar fi adevărată.

Această formulă măsoară discrepanța dintre ceea ce am observat și ceea ce ne-am așteptat. O valoare χ² aproape de zero indică o potrivire foarte bună între datele observate și cele așteptate.

Ce Înseamnă O Potrivire Perfectă în Testul Chi-Pătrat?

O "potrivire perfectă" în contextul Testului Chi-Pătrat al Bunății Ajustării înseamnă că valorile observate sunt exact egale cu valorile așteptate pentru fiecare categorie. În acest scenariu ideal, diferența (Oᵢ - Eᵢ) ar fi zero pentru toate categoriile, iar suma (χ²) ar fi, de asemenea, zero. O valoare Chi-Pătrat de zero ar indica o concordanță absolută între datele noastre și predicțiile modelului sau ale teoriei. Deși o potrivire perfectă este rară în practică, scopul testului este de a evalua cât de aproape suntem de acest ideal.

Exemple Practice

Să explorăm câteva exemple clasice pentru a înțelege mai bine aplicarea și interpretarea Testului Chi-Pătrat al Bunății Ajustării.

Exemplul 1: Aruncarea unei Monede

Să presupunem că aruncăm o monedă de 120 de ori și observăm 70 de capete și 50 de pajuri. Ne așteptăm, teoretic, ca o monedă echitabilă să dea 50% capete și 50% pajuri. Deci, din 120 de aruncări, ne-am aștepta la 60 de capete și 60 de pajuri.

Ipoteze:
H₀: Moneda este echitabilă (Capete = 50%, Pajuri = 50%).
H₁: Moneda nu este echitabilă.

Calculul χ²:

CategorieObservat (O)Așteptat (E)(O - E)(O - E)²(O - E)² / E
Capete706010100100 / 60 = 1.667
Pajuri5060-10100100 / 60 = 1.667
Total1201200χ² = 1.667 + 1.667 = 3.334

Valoarea calculată a χ² este 3.334.

Exemplul 2: Genetica Mendeliană (Forma Bobului de Mazăre)

Conform geneticii mendeliene simple, la încrucișarea anumitor plante de mazăre, ne așteptăm la un raport fenotipic de 3:1 (3/4 rotunde, 1/4 încrețite). Dacă observăm 100 de plante, ne-am aștepta la 75 rotunde și 25 încrețite. Să presupunem că observăm 84 rotunde și 16 încrețite.

Ipoteze:
H₀: Raportul formei bobului de mazăre respectă legile mendeliene (3:1).
H₁: Raportul formei bobului de mazăre nu respectă legile mendeliene.

Calculul χ²:

CategorieObservat (O)Așteptat (E)(O - E)(O - E)²(O - E)² / E
Rotunde847598181 / 75 = 1.080
Încrețite1625-98181 / 25 = 3.240
Total1001000χ² = 1.080 + 3.240 = 4.320

Valoarea calculată a χ² este 4.320.

What is an example of goodness of fit?
For example, it demonstrates how closely manufactured products meet the standards. Good results indicate that the products meet the requirements. Goodness-of-fit is a statistical method for assessing how well a sample of data matches a given distribution as its population.

Exemplul 3: Echilibrul Hardy-Weinberg în Genetică Populațională

Modelul Hardy-Weinberg prezice frecvențele genotipice într-o populație care nu evoluează. Dacă avem două alele, 'a' și 'a'' cu frecvențele p=0.6 și q=0.4, ne așteptăm la genotipurile p² (aa), 2pq (aa') și q² (a'a'). Pentru o populație de 100 de indivizi, ne-am aștepta la 36 'aa', 48 'aa'' și 16 'a'a''. Să presupunem că observăm 45 'aa', 34 'aa'' și 21 'a'a''.

Ipoteze:
H₀: Frecvențele genotipice respectă așteptările Hardy-Weinberg.
H₁: Frecvențele genotipice nu respectă așteptările Hardy-Weinberg.

Calculul χ²:

GenotipObservat (O)Așteptat (E)(O - E)(O - E)²(O - E)² / E
aa453698181 / 36 = 2.250
aa'3448-14196196 / 48 = 4.083
a'a'211652525 / 16 = 1.563
Total1001000χ² = 2.250 + 4.083 + 1.563 = 7.896

Valoarea calculată a χ² este 7.896.

Grade de Libertate (df)

După calcularea valorii Chi-Pătrat, pasul următor este determinarea gradelor de libertate (df). Pentru Testul Chi-Pătrat al Bunății Ajustării, gradele de libertate se calculează simplu ca numărul de categorii (k) minus unu:

df = k - 1

În Exemplul 1 (Moneda), avem 2 categorii (Capete, Pajuri), deci df = 2 - 1 = 1.
În Exemplul 2 (Mazăre), avem 2 categorii (Rotunde, Încrețite), deci df = 2 - 1 = 1.
În Exemplul 3 (Hardy-Weinberg), avem 3 categorii (aa, aa', a'a'), deci df = 3 - 1 = 2.

Ipoteze și Condiții pentru Utilizarea Testului Chi-Pătrat

Pentru ca rezultatele Testului Chi-Pătrat să fie valide, trebuie îndeplinite anumite condiții:

  • Există două sau mai multe categorii distincte.
  • Fiecare observație trebuie să se încadreze într-o singură categorie. Nu pot exista observații "între" categorii.
  • Valorile așteptate (Eᵢ) trebuie să fie suficient de mari. De obicei, se recomandă ca fiecare valoare Eᵢ să fie de cel puțin 5. Dacă una sau mai multe valori Eᵢ sunt mai mici de 5, testul poate deveni inexact. În aceste cazuri, ar putea fi necesară combinarea unor categorii sau utilizarea unei metode alternative.
  • Suma valorilor observate trebuie să fie egală cu suma valorilor așteptate.
  • Datele trebuie să fie frecvențe sau numărători, nu procente sau medii.

Interpretarea Rezultatelor

Odată ce am calculat valoarea Chi-Pătrat și am determinat gradele de libertate, trebuie să interpretăm rezultatul pentru a decide dacă respingem sau nu ipoteza nulă.

1. Compararea cu Valoarea Critică

Pentru a interpreta valoarea χ² calculată, o comparăm cu o valoare critică dintr-un tabel de distribuție Chi-Pătrat. Această valoare critică depinde de gradele de libertate (df) și de nivelul de semnificație (α) pe care l-am ales, de obicei 0.05 (sau 5%). Nivelul de semnificație (α) reprezintă probabilitatea de a face o eroare de Tip I, adică de a respinge ipoteza nulă atunci când aceasta este, de fapt, adevărată.

  • Dacă χ² calculat > Valoarea Critică: Respingem ipoteza nulă. Există o diferență semnificativă între distribuția observată și cea așteptată.
  • Dacă χ² calculat ≤ Valoarea Critică: Nu respingem ipoteza nulă. Nu există suficiente dovezi pentru a spune că există o diferență semnificativă; datele noastre se potrivesc rezonabil de bine cu așteptările.

De exemplu, pentru Exemplul 1 (Moneda), cu df = 1 și α = 0.05, valoarea critică este 3.841. Deoarece χ² = 3.334 este mai mic decât 3.841, nu respingem ipoteza nulă. Concluzia este că moneda pare a fi echitabilă.

2. Utilizarea Valorii p (p-value)

O abordare mai modernă și mai informativă este utilizarea valorii p. Valoarea p este probabilitatea de a obține o valoare Chi-Pătrat la fel de extremă sau mai extremă decât cea observată, presupunând că ipoteza nulă este adevărată.

  • Dacă p-value < α: Respingem ipoteza nulă. Rezultatele sunt considerate statistic semnificative.
  • Dacă p-value ≥ α: Nu respingem ipoteza nulă. Rezultatele nu sunt considerate statistic semnificative.

Pentru Exemplul 1 (Moneda), p-value calculată este aproximativ 0.0679. Deoarece 0.0679 > 0.05, nu respingem ipoteza nulă. Aceasta înseamnă că discrepanța de 70 de capete din 120 de aruncări nu este suficient de mare pentru a concluziona că moneda este neechitabilă la un nivel de semnificație de 5%.

Pentru Exemplul 2 (Mazăre), p-value este aproximativ 0.0377. Deoarece 0.0377 < 0.05, respingem ipoteza nulă. Aceasta înseamnă că raportul observat al formei bobului de mazăre diferă semnificativ de raportul mendelian de 3:1.

Pentru Exemplul 3 (Hardy-Weinberg), p-value este aproximativ 0.0049. Deoarece 0.0049 < 0.05, respingem ipoteza nulă. Aceasta indică faptul că frecvențele genotipice observate nu sunt în echilibru Hardy-Weinberg, sugerând posibile forțe evolutive în acțiune.

Diferența dintre Chi-Pătrat Goodness of Fit și Testul de Independență Chi-Pătrat

Este important de menționat că există două tipuri principale de teste Chi-Pătrat: Testul Bunății Ajustării și Testul de Independență. Deși ambele folosesc aceeași formulă de bază pentru χ², ele diferă fundamental în scop și în modul de calcul al valorilor așteptate și al gradelor de libertate.

What is a chi square test?
  • Testul Bunății Ajustării: Compară o distribuție observată cu o distribuție teoretică sau predefinită (adică, valorile așteptate sunt cunoscute dinainte, dintr-o teorie, model sau o ipoteză specifică). Gradele de libertate sunt k-1 (numărul de categorii minus 1).
  • Testul de Independență: Evaluează dacă două variabile categorice sunt independente una de alta (adică, nu există o asociere între ele). Valorile așteptate sunt calculate din datele observate, iar datele sunt adesea organizate într-un tabel de contingență. Gradele de libertate sunt (număr rânduri - 1) * (număr coloane - 1).

Articolul nostru se concentrează pe primul tip, unde avem o "teorie" sau o "așteptare" clară pentru distribuția datelor.

Cum se Efectuează Testul Chi-Pătrat în Software

Deși calculul manual este util pentru înțelegere, în practică, software-ul statistic simplifică enorm procesul.

Utilizarea R (RStudio)

R este un limbaj și mediu gratuit pentru calcul statistic și grafică. Funcția principală pentru testul Chi-Pătrat al Bunății Ajustării este chisq.test().

Pentru exemplul cu moneda (70 capete, 50 pajuri, așteptat 50% fiecare):

# Definirea valorilor observate observate <- c(70, 50) # Definirea proporțiilor așteptate (trebuie să se însumeze la 1) asteptate_proportii <- c(0.5, 0.5) # Efectuarea testului Chi-Pătrat rezultat_chi <- chisq.test(observate, p = asteptate_proportii) # Vizualizarea rezultatelor print(rezultat_chi) 

Output-ul va arăta similar cu:

 Chi-squared test for given probabilities data: observate X-squared = 3.3333, df = 1, p-value = 0.0679 

Acest rezultat confirmă calculele noastre manuale pentru χ² și valoarea p. Puteți accesa componentele individuale ale rezultatului (statistică, p-value, observate, așteptate) folosind rezultat_chi$statistic, rezultat_chi$p.value, etc.

Utilizarea Microsoft Excel (sau alte foi de calcul)

Excel poate calcula direct valoarea p pentru testul Chi-Pătrat al Bunății Ajustării folosind funcția CHITEST(). De asemenea, puteți calcula statisticile individuale și valoarea critică.

Pentru exemplul cu mazărea (84 rotunde, 16 încrețite; așteptat 75 rotunde, 25 încrețite):

1. Introduceți valorile observate într-un interval (ex: A1:A2).
2. Introduceți valorile așteptate într-un alt interval (ex: B1:B2).

A (Observate)B (Așteptate)
18475
21625

Într-o celulă goală, introduceți formula pentru a obține valoarea p:

=CHITEST(A1:A2, B1:B2)

Rezultatul va fi aproximativ 0.0377, confirmând valoarea p a testului. Pentru a obține valoarea critică, puteți folosi =CHIINV(probabilitate, grade_libertate), iar pentru a calcula valoarea p dintr-o statistică Chi-Pătrat dată, folosiți =CHIDIST(valoare_chi_patrat, grade_libertate).

Întrebări Frecvente (FAQ)

Ce înseamnă o valoare Chi-Pătrat mare sau mică?

O valoare Chi-Pătrat mică (aproape de zero) indică o potrivire bună între datele observate și cele așteptate. Cu cât valoarea Chi-Pătrat este mai mare, cu atât este mai mare discrepanța dintre observații și așteptări, sugerând o potrivire slabă.

Ce înseamnă o valoare p mare sau mică?

O valoare p mare (de obicei > 0.05) sugerează că diferența observată între date și așteptări ar putea fi rezultatul întâmplării și nu este suficient de semnificativă pentru a respinge ipoteza nulă. O valoare p mică (de obicei < 0.05) indică faptul că diferența este puțin probabil să fie rezultatul întâmplării și este suficient de semnificativă pentru a respinge ipoteza nulă, sugerând că modelul teoretic nu se potrivește bine cu datele.

Ce fac dacă valorile mele așteptate sunt prea mici?

Dacă una sau mai multe valori așteptate sunt mai mici de 5, precizia testului Chi-Pătrat poate fi compromisă. Soluții includ combinarea unor categorii adiacente pentru a crește valorile așteptate sau utilizarea unui test exact, cum ar fi Testul Exact Fisher, dacă este cazul.

Pot folosi Testul Chi-Pătrat al Bunății Ajustării pentru date continue?

Nu, Testul Chi-Pătrat al Bunății Ajustării este conceput pentru date categorice (frecvențe sau numărători în categorii discrete). Pentru date continue, ar trebui să utilizați alte teste statistice, cum ar fi testele t, ANOVA sau regresia.

Concluzie

Testul Chi-Pătrat al Bunății Ajustării este un instrument statistic valoros, permițându-ne să evaluăm obiectiv cât de bine se aliniază datele noastre observate cu predicțiile teoretice. Înțelegerea ipotezelor, a formulei de calcul și, mai ales, a interpretării rezultatelor, este esențială pentru a trage concluzii valide din orice set de date categorice. Fie că sunteți în domeniul biologiei, sociologiei, economiei sau fitness-ului, capacitatea de a aplica și interpreta corect acest test vă va îmbunătăți semnificativ abilitățile de analiză a datelor și de luare a deciziilor.

Dacă vrei să descoperi și alte articole similare cu Testul Chi-Pătrat al Bunății Ajustării, poți vizita categoria Fitness.

Go up