Análisis de la covarianza

El análisis de la covarianza o ANCOVA, acrónimo del inglés analysis of covariance, es un modelo lineal general con una variable cuantitativa y uno o más factores. El ANCOVA es una fusión del ANOVA y de la regresión lineal múltiple. Es un procedimiento estadístico que permite eliminar la heterogeneidad causada en la variable de interés (variable dependiente) por la influencia de una o más variables cuantitativas (covariables). Básicamente, el fundamento del ANCOVA es un ANOVA al que a la variable dependiente se le ha eliminado el efecto predicho por una o más covariables por regresión lineal múltiple. La inclusión de covariables puede aumentar la potencia estadística porque a menudo reduce la variabilidad.

Ecuaciones

ANCOVA de un factor

El análisis de un factor es apropiado cuando se dispone de tres o más grupos. En los diseños equilibrados, cada grupo tiene el mismo número de datos (individuos), los cuales idealmente han sido asignados al azar a cada grupo a partir de una muestra original preferiblemente homogénea.

Calculando la suma de las desviaciones al cuadrado para la variable independiente X y la variable dependiente Y

Las sumas de las desviaciones al cuadrado o sumas de cuadrados (SS): S S T y {\displaystyle SST_{y}} , S S T r y {\displaystyle SSTr_{y}} , y S S E y {\displaystyle SSE_{y}} deben ser calculadas usando las siguientes ecuaciones para la variable dependiente, Y. La SS para la covariable también debe ser calculada; los dos valores necesarios son S S T x {\displaystyle SST_{x}} y S S E x {\displaystyle SSE_{x}} .

La suma de cuadrados total define una la variabilidad del total de individuos n T {\displaystyle n_{T}} :

S S T y = i = 1 n j = 1 k Y i j 2 ( i = 1 n j = 1 k Y i j ) 2 n T {\displaystyle SST_{y}=\sum _{i=1}^{n}\sum _{j=1}^{k}Y_{ij}^{2}-{\frac {\left(\sum _{i=1}^{n}\sum _{j=1}^{k}Y_{ij}\right)^{2}}{n_{T}}}}

La suma de cuadrados para los tratamientos define la variabilidad entre las poblaciones o grupos. k {\displaystyle k} representa el número de grupos.

S S T r y = i = 1 n ( j = 1 k Y i j 2 k ) ( i = 1 n j = 1 k Y i j ) 2 n T {\displaystyle SSTr_{y}=\sum _{i=1}^{n}\left({\frac {\sum _{j=1}^{k}Y_{ij}^{2}}{k}}\right)-{\frac {\left(\sum _{i=1}^{n}\sum _{j=1}^{k}Y_{ij}\right)^{2}}{n_{T}}}}

La suma de cuadrados del error define la variabilidad residual dentro de cada grupo. n n {\displaystyle n_{n}} representa el número de individuos en un grupo dado:

S S E y = i = 1 n j = 1 k Y i j 2 i = 1 n ( j = 1 k Y i j 2 n k ) {\displaystyle SSE_{y}=\sum _{i=1}^{n}\sum _{j=1}^{k}Y_{ij}^{2}-\sum _{i=1}^{n}\left({\frac {\sum _{j=1}^{k}Y_{ij}^{2}}{n_{k}}}\right)}

La suma de cuadrados total es igual a la suma de cuadrados de los tratamientos y la suma de cuadrados del error (propiedad de aditividad de las sumas de cuadrados y de los grados de libertad, característica del ANOVA).

S S T y = S S T r y + S S E y . {\displaystyle SST_{y}=SSTr_{y}+SSE_{y}.\,}

Cálculo de la covarianza de X e Y

La sumas de las covarianzas ( S C T {\displaystyle SCT} y S C E {\displaystyle SCE} ) definen la covarianza de X e Y.

S C T = i = 1 n j = 1 k X i j Y i j ( i = 1 n j = 1 k X i j ) ( i = 1 n j = 1 k Y i j ) n T {\displaystyle SCT=\sum _{i=1}^{n}\sum _{j=1}^{k}X_{ij}Y_{ij}-{\frac {\left(\sum _{i=1}^{n}\sum _{j=1}^{k}X_{ij}\right)\left(\sum _{i=1}^{n}\sum _{j=1}^{k}Y_{ij}\right)}{n_{T}}}}
S C E = j = 1 k ( i = 1 n X i j Y i j i = 1 n ( X i j Y i j ) n n ) {\displaystyle SCE=\sum _{j=1}^{k}\left(\sum _{i=1}^{n}X_{ij}Y_{ij}-{\frac {\sum _{i=1}^{n}(X_{ij}Y_{ij})}{n_{n}}}\right)}

Ajuste de SSTy

Las correlaciones entre X e Y son r T {\displaystyle r_{T}} para el total y r n {\displaystyle r_{n}} para el error.

r T = S C T S S T x S S T y {\displaystyle r_{T}={\frac {SCT}{\sqrt {SST_{x}SST_{y}}}}}
r n = S C E S S E x S S E y {\displaystyle r_{n}={\frac {SCE}{\sqrt {SSE_{x}SSE_{y}}}}}

La proporción de covarianza es sustraída de la dependiente; valores de S S y {\displaystyle SS_{y}} :

S S T y ( a d j ) = S S T y S S T y ( r T ) 2 {\displaystyle SST_{y(adj)}=SST_{y}-SST_{y}(r_{T})^{2}\,}
S S E y ( a d j ) = S S E y S S E y ( r n ) 2 {\displaystyle SSE_{y(adj)}=SSE_{y}-SSE_{y}(r_{n})^{2}\,}
S S T r y ( a d j ) = S S T y ( a d j ) S S E y ( a d j ) {\displaystyle SSTr_{y(adj)}=SST_{y(adj)}-SSE_{y(adj)}\,}

Ajuste de las medias de cada grupo k

La media de cada grupo es ajustada del siguiente modo:

M y i ( a d j ) = M y i S C E y S C E x ( M x i M x T ) {\displaystyle M_{y_{i}(adj)}=M_{y_{i}}-{\frac {SCE_{y}}{SCE_{x}}}(M_{x_{i}}-M_{x_{T}})}

Análisis usando los valores de la suma de cuadrados

Finalmente obtenemos la varianza de los tratamientos libre de la covarianza, donde d f T r {\displaystyle df_{Tr}} (grados de libertad de los tratamientos) es igual a k 1 {\displaystyle k-1} y d f E {\displaystyle df_{E}} (grados de libertad del error) es igual a n T k 1 {\displaystyle n_{T}-k-1} . Puede apreciarse que cada covariable elimina un grado de libertad.

M S T r = S S T r d f T r {\displaystyle MSTr={\frac {SSTr}{df_{Tr}}}}
M S E = S S E d f E {\displaystyle MSE={\frac {SSE}{df_{E}}}}

El estadístico F se obtiene de:

F d f E , d f T r = M S T r M S E {\displaystyle F_{df_{E},df_{\mathrm {Tr} }}={\frac {MSTr}{MSE}}}

Véase también

  • Covarianza
  • MANCOVA

Enlaces externos

  • One-Way Analysis of Covariance for Independent Samples (en inglés)


Control de autoridades
  • Proyectos Wikimedia
  • Wd Datos: Q1628597
  • Wd Datos: Q1628597