Cramérs V

Cramérs V is een door de Zweedse wiskundige en statisticus Harald Cramér ontwikkelde associatiemaat voor twee categorische variabelen, dus variabelen die slechts op nominale schaal gemeten zijn.

Populatie

De simultane verdeling van de beide variabelen A {\displaystyle A} en B {\displaystyle B} wordt gegeven door de kansen

p i j = P ( A = A i , B = B j ) , i = 1 , , r ; j = 1 , , k {\displaystyle p_{ij}=P(A=A_{i},B=B_{j}),i=1,\ldots ,r;j=1,\ldots ,k}

De χ 2 {\displaystyle \chi ^{2}} -grootheid die de simultane kansen vergelijkt met de kansen bij onafhankelijkheid, is:

χ p 2 = i , j ( p i j p i p j ) 2 p i p j = i , j p i j 2 p i p j 1 {\displaystyle \chi _{p}^{2}=\sum _{i,j}{\frac {(p_{ij}-p_{i\cdot }p_{\cdot j})^{2}}{p_{i\cdot }p_{\cdot j}}}=\sum _{i,j}{\frac {p_{ij}^{2}}{p_{i\cdot }p_{\cdot j}}}-1}

Daarin is

p i = j p i j {\displaystyle p_{i\cdot }=\sum _{j}p_{ij}}

en analoog

p j = i p i j {\displaystyle p_{\cdot j}=\sum _{i}p_{ij}}

Bij statistische onafhankelijkheid tussen beide variabelen geldt:

p i j = p i p j {\displaystyle p_{ij}=p_{i\cdot }p_{\cdot j}} ;

dus:

χ p 2 = 0 {\displaystyle \chi _{p}^{2}=0}

Bij volledige samenhang tussen de beide variabelen zijn er evenveel rijen als kolommen ( r = k {\displaystyle r=k} ) en is (eventueel na herschikking):

p i i = p i = p i {\displaystyle p_{ii}=p_{i\cdot }=p_{\cdot i}}

en

p i j = 0 , i j {\displaystyle p_{ij}=0,\,i\neq j} ,

zodat:

χ p 2 = k 1 {\displaystyle \chi _{p}^{2}=k-1}

Voor de populatie is Cramérs V de parameter:

V p = χ p 2 min ( r 1 , k 1 ) {\displaystyle V_{p}={\sqrt {\frac {\chi _{p}^{2}}{\min(r-1,k-1)}}}} ,

met een waarde minimaal 0 bij onderlinge onafhankelijkheid en maximaal 1 bij volledige samenhang.

Steekproef

De parameter V p {\displaystyle V_{p}} kan geschat worden op basis van een steekproef uit de simultane verdeling van de variabelen A {\displaystyle A} en B {\displaystyle B} . De steekproef is gegeven in de vorm van de kruistabel met r {\displaystyle r} rijen en k {\displaystyle k} kolommen en waargenomen frequenties ( n i j ) {\displaystyle (n_{ij})} van de uitkomsten ( A i , B j ) {\displaystyle (A_{i},B_{j})} . Een geschikte schatter is de steekproeffunctie, die ook aangeduid wordt als Cramérs V:

V = χ 2 / n min ( r 1 , k 1 ) {\displaystyle V={\sqrt {\frac {\chi ^{2}/n}{\min(r-1,k-1)}}}}

Daarin is χ 2 {\displaystyle \chi ^{2}} de chi-kwadraatgrootheid:

χ 2 = i , j ( n i j n i n j n ) 2 n i n j n = n i , j ( n i j n n i n j n 2 ) 2 n i n j n 2 {\displaystyle \chi ^{2}=\sum _{i,j}{\frac {{\big (}n_{ij}-{\frac {n_{i\cdot }n_{\cdot j}}{n}}{\big )}^{2}}{\frac {n_{i\cdot }n_{\cdot j}}{n}}}=n\sum _{i,j}{\frac {{\big (}{\frac {n_{ij}}{n}}-{\frac {n_{i\cdot }n_{\cdot j}}{n^{2}}}{\big )}^{2}}{\frac {n_{i\cdot }n_{\cdot j}}{n^{2}}}}} ,

met ( n i ) {\displaystyle (n_{i\cdot })} en ( n j ) {\displaystyle (n_{\cdot j})} respectievelijk de rij- en kolomsommen en n {\displaystyle n} de steekproefomvang, dus ook de totale som.

De steekproeffuncie V {\displaystyle V} kan ook gebruikt worden als toetsingsgrootheid.

Zie ook

  • Kruistabel