Prueba de hipótesis para dos muestras PRUEBA CHI-CUADRADO Esta prueba puede utilizarse incluso con datos medibles en una escala nominal. La hipótesis nula de la prueba Chi-cuadrado postula una distribución de probabilidad totalmente especificada como el modelo matemático de la población que ha generado la muestra. Para realizar este contraste se disponen los datos en una tabla de frecuencias. Para cada valor o intervalo de valores se indica la frecuencia absoluta observada o empírica (Oi). A continuación, y suponiendo que la hipótesis nula es cierta, se calculan para cada valor o intervalo de valores la frecuencia absoluta que cabría esperar o frecuencia esperada (Ei=n·pi , donde n es el tamaño de la muestra y pi la probabilidad del i-ésimo valor o intervalo de valores según la hipótesis nula). El estadístico de prueba se basa en las diferencias entre la Oi y Ei y se define como:
PRUEBA DE BONDAD DE AJUSTE CHI CUADRADO x2 El procedimiento de la prueba requiere una muestra aleatoria de tamaño n proveniente de la población cuya distribución de probabilidad es desconocida. Estas n observaciones se pueden distribuir en k intervalos de clases y pueden ser representadas en histogramas. La prueba se puede utilizar tanto para distribuciones discretas como para distribuciones continuas La prueba se puede sintetizar en los siguientes pasos.
1. Se colocan los n datos históricos (muéstrales) en una tabla de frecuencia de la siguiente manera: a. Se busca en cuantos intervalos de clases se puede distribuir los datos en estudio lo cual se puede hacer m = n o alternativamente es muy común utilizar las encontrar el número de intervalos se aplica la regla de sturges: m =1+3,3 log n donde n es el número de datos b. Luego encontramos el rango el cual es la diferencia entre el mayor valor y el menor valor. R=Xmax-Xmin c. Amplitud de cada intervalo está dado por: Número de intervalos Rango A = Rango/numero de intervalos. d. se obtienen las frecuencias observadas en cada intervalos se calcula la media, la varianza y las desviación estándar.
2. Se propone una distribución de probabilidad una distribución de probabilidad de acuerdo con la tabla de frecuencia o con la curva que muestre un histograma o polígono de frecuencia. 3. Con la distribución propuesta, se calcula la frecuencia esperada para cada uno de los intervalos (FEi) de la siguiente manera: Si la variable es continua se halla mediante la integración de la distribución propuesta y luego se multiplica por el número total de datos. Si la variable es continua se utiliza de modelo matemático de la distribución propuesta y se evalúan todas la categorías y luego se multiplica por el número total de datos. 4. Se calcula el estadístico de prueba
Nota: El estadístico de prueba tiene distribución Chi cuadrado con, m-k-1 grados de libertad, siempre que las frecuencias esperadas sean 5 o más para todas las categorías 5. Si el estimador C es menor o igual al valor correspondiente X2 con m-k-1 grados de libertad (K= números de parámetros estimados de la distribución propuesta estimada por los estadísticos muéstrales) y a un nivel de confiabilidad de 1-α, entonces no se puede rechazar la hipótesis de que los datos siguen la distribución que se propuso. DETERMINACIÓN DE LOS GRADOS DE LIBERTAD EN UNA PRUEBA DE BONDAD DE AJUSTE. Si queremos calcular el número apropiado de grados de libertad en una prueba de bondad de ajuste chi cuadrado, contamos el números de clases ( representados por m) para los cuales hemos comparados las frecuencias observadas y las esperadas, entonces aplicamos la regla (m-1) y luego se resta un grado adicional de libertad para cada parámetro de la población que tenga que ser estimado de los datos de la muestra. Debe notarse que esta regla es igual a la que tenemos en el punto 5. m-k-1 Prueba de los rangos con signo de Wilcoxon La prueba de los rangos con signo de Wilcoxon es una prueba no paramétrica para comparar el rango medio de dos muestras relacionadas y determinar si existen diferencias entre ellas. Se utiliza como alternativa a la prueba t de
Student cuando no se puede suponer la normalidad de dichas muestras. Planteamiento[editar] Suponga que se dispone de n pares de observaciones, denominadas
. El objetivo del test es comprobar si puede
dictaminarse que los valores
e
son o no iguales.
Suposiciones[editar] 1. Si Zi= yi-xi, entonces los valores zi son independientes. 2. Los valores zi tienen una misma distribución continua y simétrica respecto a una mediana común ϴ
.
Método[editar]
La distribución del estadístico puede consultarse en tablas para determinar si se acepta o no la hipótesis nula. En ocasiones, esta prueba se usa para comparar las diferencias entre dos muestras de datos tomados antes y después del tratamiento, cuyo valor central se espera que sea cero. Las diferencias iguales a cero son eliminadas y el valor absoluto de las desviaciones con respecto al valor central son
ordenadas de menor a mayor. A los datos idénticos se les asigna el lugar medio en la serie. La suma de los rangos se hace por separado para los signos positivos y los negativos. S representa la menor de esas dos sumas. Comparamos Scon el valor proporcionado por las tablas estadísticas al efecto para determinar si rechazamos o no la hipótesis nula, según el nivel de significación elegido. La prueba de Kruskal-Wallis (de WILLIAM KRUSKALL y W ALLEN WALLIS es un Método no parametrico para: 1.
Probar si un grupo de datos proviene de la misma población.
2. Se emplea cuando se quieren comparar tres o más poblaciones 3. Es el equivalente a un análisis de varianza de una sola vía 4. No requiere supuesto de normalidad 5. No requiere supuesto de varianzas iguales (homogeneidad de varianzas) 6. Compara esencialmente los rangos promedios observados para las k muestras, con los esperados bajo Ho. Pasos para el calculo de la prueba • 1. Planteamiento de hipótesis • 2. Se ordenan las n observaciones de menor a mayor, y se les asignan rangos desde 1 hasta n. • 3. Se obtiene la suma de los rangos correspondientes a los elementos de cada muestra, rj y se halla el rango promedio • 4. Calcular estadístico de prueba
• 5. Buscar H en la Tabla de chi cuadrado • 6. Conclusiones