Tablas estadísticas/Distribución chi-cuadrado

De testwiki
Ir a la navegación Ir a la búsqueda

La Distribución chi-cuadrado, tiene por función de densidad

χk2(x)=xk/21ex/22k/2Γ(k/2)

Donde el parámetro k de χk2, se denomina grados de libertad de la distribución.

La Distribución chi-cuadrado no tiene sentido para valores negativos de x, como se puede ver en la figura.

Téngase en cuenta que para k = 1 y k = 2 la función de densidad para x = 0, se hace infinito:

χ12(0)=
χ22(0)=

Para el resto de los valores de k, para x = 0, la función vale 0.

La Distribución de probabilidad de esta función para valores menores de un x dado, que representamos por (χk2<x)

P(χk2<x)=0xχk2du

donde:

0xχk2du=0xuk/21eu/22k/2Γ(k/2)du

Esta integral no tiene una solución conocida, y solo se conocen métodos numéricos para calcular sus valores, hay distintos tipos de tablas y algoritmos para ordenador con los que se pueden calcular sus soluciones, veamos una tabla distribución chi-cuadrado y su modo de utilización.

La Tabla

Esta tabla presenta la distribución de probabilidad de chi-cuadrado para distintos valores de k(de 1 a 10) y de x(de 0 a 20 de 0,2 de incremento), presentándolo con seis cifras decimales, separadas de tres en tres por un espacio en blanco para facilitar la lectura, en la fila superior están los valores de k, y en la columna de la izquierda los de x, donde se cruzan la columna de la k buscada y la fila de la x, se encuentra el valor de la probabilidad acumulada desde 0 a la x buscada.

Tabla distribución chi-cuadrado

ejemplo:

Cual es la Distribución de probabilidad de chi-cuadrado de 4 grados de libertad de que x< 1,2

Buscando en la tabla la columna del 4 y la fila de 1,2, tenemos:

P(χ42<1,2)=0,121901

Para otros valores de x

En la tabla podemos encontrar directamente la probabilidad:P(χk2<x), pero se pueden presentar otros casos, veamos algunos.

Para la variable mayor que x

Para calcular P(χk2>x), partimos de la expresión:

P(χk2<x)+P(χk2>x)=1

La probabilidad de que la variable estadística sea menor que x más la probabilidad de que sea mayor que x es la certeza, de probabilidad 1.

Operando:

P(χk2>x)=1P(χk2<x)

Ejemplo

Calcular la distribución de probabilidad de una variable estadística chi-cuadrado, de 6 grados de libertad sea mayor de 3,4.

P(χ62>3,4)

según lo anterior:

P(χ62>3,4)=1P(χ62<3,4)

buscando en la tabla tenemos:

P(χ62<3,4)=0,242777

con lo que tenemos:

P(χ62>3,4)=10,242777

operando tenemos:

P(χ62>3,4)=0,757223

que es la respuesta a la pregunta.

Para la variable mayor que x1 y menor que x2

Para calcular la probabilidad de que:

P(x1<χk2<x2)

siendo:

x1<x2

tenemos que:

P(x1<χk2<x2)=P(χk2<x2)P(χk2<x1)

Ejemplo

Cual es la probabilidad de que una variable chi-cuadrado de 8 grados de libertad este comprendida entre 3,4 y 5,6.

Esto es:

P(3,4<χ82<5,6)

según la tabla tenemos:

{P(χ82<3,4)=0,093189P(χ82<5,6)=0,308063

según lo anterior, tenemos que:

P(3,4<χ82<5,6)=P(χ82<5,6)P(χ82<3,4)

sustituyendo los valores:

P(3,4<χ82<5,6)=0,3080630,093189

operando:

P(3,4<χ82<5,6)=0,214874

Con lo que tenemos la respuesta.

Interpolación lineal.

La función chi-cuadrado es continua para x mayor que cero, pero en la tabla solo se recogen algunos de sus valores, si bien la tabla podría hacerse más extensa el numero de valores recogidos siempre seria finito, para calcular los valores no recogidos en la tabla podemos emplear la interpolación lineal.

La interpolación lineal, parte de unos puntos conocidos de la función, y los valores intermedios los determina por la recta que une estos dos puntos, este método siempre añade un cierto error, al sustituir la función: y= f(x) por la recta que une dos puntos: y= r(x), que siempre será menor que tomar el valor conocido más próximo de la función, ver la figura, es importante que los puntos tomados estén lo más próximos entre sí, para que este error sea el mínimo posible.

La expresión:

y=(xx1)(x2x1)(y2y1)+y1

determina el valor y de la función para un x dado, partiendo de dos puntos conocidos (x1,y1) y (x2,y2), siendo x1<x<x2.

Ejemplo

Cual es la probabilidad de una distribución chi-cuadrado de 5 grados de libertad, de que x sea menor que 1,75.

Esto es:

P(χ52<1,75)

el valor 1,75 no esta en la tabla, pero si tenemos que:

{P(χ52<1,6)=0,098751P(χ52<1,8)=0,123932

sustituyendo en la expresión:

y=(xx1)(x2x1)(y2y1)+y1

tenemos que:

y=(1,751,6)(1,81,6)(0,1239320,098751)+0,098751

operando tenemos:

y=(0,15)(0,2)(0,025181)+0,098751

esto es:

y=0,018886+0,098751

que resulta:

y=0,117637

que es el resultado buscado:

P(χ52<1,75)=0,117637

Tabla inversa de distribución chi-cuadrado

Otra forma de tabla de distribución chi-cuadrado, en la cual los valores de búsqueda son los grados de libertad y la probabilidad acumulada, dada la expresión

P(χk2<x)=p

En este tipo de tablas se parte de los valoras conocidos k y p, y se obtiene x, de forma inversa a lo visto anteriormente, lo que resulta interesante para responder a la pregunta:

Para una distribución chi-cuadrado de k grados de libertad, cual es el valor de x que deja a su izquierda una probabilidad p.

Este tipo de problema en la practica, suele ser más usual, la tabla es más compacta y también nos permite calcular la probabilidad con la tabla directa.

En la tabla tenemos en la fila superior las probabilidades P, en la columna de la izquierda los grados de libertad k, donde se cruzan la fila y la columna correspondientes el valor de x que en una función chi-cuadrado de k grados de libertad, deja a su izquierda una probabilidad P.

Tabla distribución chi-cuadrado, inversa

ejemplo

Cual es el valor de x, de una distribución chi-cuadrado de 6 grados de libertad, que deja a su izquierda una probabilidad del 80%

P(χ62<x)=0,80

Consultando la tabla tenemos que:

x=8,558

Calculo de la probabilidad con la tabla inversa.

empleando esta tabla podemos realizar cálculos directos como en la anterior, normalmente será necesaria recurrir a la interpolación lineal para obtener los resultados

Ejemplo

¿Cuál es la distribución de probabilidad de chi-cuadrado de 4 grados de libertad de x < 1,2 ?

este es el mismo ejemplo que en la tabla directa, veamos como se haría en este caso:

la pregunta es:

P(χ42<1,2)

este valor no figura en la tabla pero si tenemos en la fila de k= 4, que:

{P(χ42<1,064)=0,1P(χ42<1,649)=0,2

por la expresión de interpolación lineal:

y=(xx1)(x2x1)(y2y1)+y1

sustituyendo los valores de este caso:

y=(1,21,064)(1,6491,064)(0,20,1)+0,1

operando:

y=(0,136)(0,585)(0,1)+0,1

esto es:

y=0,0232+0,1

que da como resultado:

y=0,1232

esto es:

P(χ42<1,2)=0,1232

como se puede ver hay una diferencia del orden de la tercera cifra decimal, respecto a la búsqueda directa en la tabla, esta diferencia se produce por la interpolación lineal, al sustituir la función por la recta que une dos puntos conocidos, y a la relativamente gran diferencia entre x1 y x2, que es el 60% al valor de x1.

Para valores de k grandes

cuando el valor de k es suficientemente grande se tiene en cuenta que:

limkχk2(x)=N(k,2k)(x)

Con lo que podemos aproximar la distribución Chi-cuadrado por la distribución normal, de media k y desviación típica raíz de 2k, empleando la tabla distribución normal tipificada para su calculo.