Pruebas-no-parametricas-unido.-1.docx

  • Uploaded by: mary sol
  • 0
  • 0
  • November 2019
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Pruebas-no-parametricas-unido.-1.docx as PDF for free.

More details

  • Words: 1,736
  • Pages: 6
PRUEBAS NO PARAMETRICAS PRTE 1

Hasta ahora hemos vistos en estadística inferencial paramétrica: Cuando yo comparo promedios tengo varias opciones de comparación, puedo comparar promedios para un promedio de importancia, puedo comparar 2 promedios entre sí, y esto esta mediado por una prueba eje para definir si yo requiero usar varianzas homogéneas o varianzas no homogéneas y, la tercera comparación que tenemos es un promedio de un antes versus un promedio de un después y eso lo solucionamos con una T pareada. Todas estas pruebas de comparación de promedios están basadas en unas distribuciones paramétricas y usan pruebas T.

La ultima clase hablamos de modelos de regresión lineal que me permite predecir el comportamiento de cualquier valor de la variable independiente en relación de la variable dependiente y viceversa siempre y cuando tengan coeficientes de correlación buenos o mayores de 0.6, es decir que yo podría por ejemplo asociar y predecir el comportamiento de una variable dependiente en relación con la independiente siempre y cuando las 2 sean cuantitativas continuas y muestren fuerte estrechez de asociación. Ahora lo cierto es que a veces yo puedo tener consideraciones de más de una variable que yo creo puedan afectar a una variable dependiente es decir varias variables independientes que afecten a una variable dependiente, siempre y cuando la variable dependiente sea cuantitativa. Por ejemplo yo digo de que dependerá el peso de las personas: y alguien dice varios determinantes que pueden afectar el peso como la edad, la talla y el sexo. Y yo quiero saber que tanto se relacionan la variación que yo encuentro en peso con la variación que yo encuentro en talla o que tanto se afecta el peso con la variación que obtenga de edad. Pero además aparece una variable que no es la variable cuantitativa como es el sexo hombre o mujer, entonces digo la condición de ser mujer determina más las variaciones de peso o al revés pero con los hombres. Y ahora como puedo resolver yo cuál de esas variables juegan dentro de sí para alterar la condición de peso y entonces aparece algo que se llama Regresión Múltiple y esta tiene varias consideraciones: yo tendré siempre la variable dependiente que esa si TIENE QUE SER CUANTITATIVA y las independientes que quiero asociar pueden ser CUANTITATIVAS O CUALITATIVAS. Las cuantitativas se trabajan obviamente como números y a las cualitativas habitualmente se las dicotomisa por ejemplo al sexo 0 o 1. Cuando yo hago un modelo de regresión múltiple voy a tener una pendiente y un valor de corte en relación con cada una de las variables. Ojo: mientras más variables meto en el modelo de regresión múltiple resulta que más grande va a ser el r2 por eso es que los modelos de regresión múltiple deben ser muy bien pensados para que no muestren información falsa.

Otro problema es que pueden darse como confusiones en las conclusiones del modelo de regresión multiple cuando 2 variables de ahí están relacionadas y eso se llama colinealidad Ejemplo la talla también se relaciona con la edad entonces debo decidir si le quito una o quito otra o quito ambas, lo ideal es que yo deje una la que mi marco teórico diga que tiene mayor peso sobre mi variable dependiente. La idea es que debería evitarse la colinealidad en las variables independientes Se debe entender que el r2 no necesariamente significa que la regresión es buenasa porque mientras más variables estén formando parte de la regresión múltiple más grande va a ser mi r2, por la misma razón a veces acompañan al r2 de un valor P y tampoco significa que la P significativa diga de que la relación es buenasa porque mientras más variables están acompañando al modelo de regresión es más probable que la P sea significativa entonces les puede dar confusiones.

Como se controla las variables que tienen que entrar? -Con la matriz de variables porque solo ingresan las variables que realmente determinan la variable dependiente.

Pruebas No Paramétricas que van a reemplazar en el caso de las paramétricas a la prueba T Se van a encontrar en la literatura de las pruebas no paramétricas que no deben usarse cuando tienen n menor de 25 en la práctica se está usando habitualmente con n menor de 25. La prueba del Signo Cuando yo trabajo con pruebas no paramétricas trabajo con la mediana y entonces la prueba del signo busca eso, un signo de frente a una mediana o un signo de frente a una variación. Yo voy a partir de una hipótesis nula: la mediana A es igual a la mediana B y la hipótesis de trabajo: la mediana A es diferente a la mediana B

Primera prueba No Paramétrica (prte 2)

La Prueba del Signo + y LA prueba del signo busca un signo de frente a una mediana o una variación Vamos a partir de la hipótesis nula y de trabajo: Ho: Med A= Med B

HT: Med A ≠ Med B

/

Estudio: Entrevistan a 10 parejas, hombres y mujeres, y les preguntan cuántos hijos quieren tener: Personas 1 2 3 4 5 6 7 8 9 10

Mujeres 3 2 1 0 0 1 2 2 2 0

Hombres 2 3 2 2 0 2 1 3 1 2

Diferencia +1 -1 -1 -2 +0 esta es igualdad -1 +1 -1 +1 -2

Ho: Mujeres= Hombres

Signos positivos (+): 3 …este es el signo menos frecuente Signos negativos (-): 5

HT: Mujeres ≠ Hombres

/

Las hipótesis serian: la nula, que tanto hombres como mujeres quieren tener el mismo número de hijos, y la de trabajo que no quieren el mismo número de hijos

Ahora vamos a la tabla de valores críticos: Cuantos sujetos se estudiaron: 10

α 0.05 1

(+): 3

LA HIPOTESIS NULA SE RECHAZA SI EL NUMERO DE VECES QUE SE REPITE EL SIGNO MENOS FRECUENTE ES MENOR O IGUAL AL VALOR DE LA TABLA DE VALORES CRITICOS CONCLUSION: Como el signo el número de veces del signo menos frecuente es en este caso mayor al de la tabla, pues NO SE RECHAZA LA HIPOTESIS NULA. Ho: Mujeres= Hombres ✔

/

HT: Mujeres ≠ Hombres x

Ahora todo esto se parecería a una T de diferencia de promedios, estoy comparando la variación del signo.

Otra aplicación del test del signo: Supongamos que tenemos una población de sujetos A, luego de ser sometidos a un tratamiento de quimioterapia, el tiempo de supervivencia de los manes fueron los siguientes: La literatura dice que la mediana de supervivencia de esas personas es de 5 años. Población A 10 7 5 4 3 8 9 10 11 12

Diferencia con la mediana de 5 años: +5 +2 0 -1 -2 -3 +4 +5 +6 +7 Ho: T supervivencia= Mediana

/

Signo positivo (+): 7 Signo negativo (-): 2… este es el signo menos frecuente

HT: T supervivencia≠ Mediana

LA hipótesis nula seria el tiempo de supervivencia es igual o corresponde a la mediana de 5 años, y la hipótesis de trabajo es si es diferente a la mediana. Vamos a la tabla de valores críticos: Cuantos sujetos se estudiaron: 10

α 0.05 1

(-): 2

LA HIPOTESIS NULA SE RECHAZA SI EL NUMERO DE VECES QUE SE REPITE EL SIGNO MENOS FRECUENTE ES MENOR O IGUAL AL VALOR DE LA TABLA DE VALORES CRITICOS CONCLUSION: Como el signo el número de veces del signo menos frecuente es en este caso mayor al de la tabla, pues NO SE RECHAZA LA HIPOTESIS NULA. Ho: T supervivencia= Mediana ✔

/

HT: T supervivencia≠ Mediana x

El tiempo de supervivencia de la población a corresponde a la mediana de supervivencia reportada.

Realmente tiene como tres variantes mas, estas dos las más comunes. LA usamos para comparar una mediana de referencia o para medir las variaciones entre dos poblaciones sobre una variable cuantitativa discreta. El test del signo tiene una variación adicional. Para poblaciones superiores a 25 Z: (x o valor de menos frecuencia + 0.05) – (n/2) √n Porque por 0.05 porque significa una probabilidad dicotómica.

TEST DEL RANGO DE WOLCOXON

Es parecido al test del signo, con una lógica igual. Pero con rangos Supongamos que se evaluaron, el número de recidivas de una enfermedad con un fármaco A y Fármaco B Ho: Fármaco A= Fármaco B

HT: Fármaco A ≠ Fármaco B

/

Hipótesis que las medianas de recidivas va a ser igual en ambos grupos o diferentes para la hipótesis de trabajo. A 4 B 3 DIFEREN 1

3 4 -1

6 6 0

7 6 1

9 5 4

4 4 0

2 7 -5

5 3 2

1. Ordenar las diferencias en orden ascendente 2. Luego se les da un orden, un rango de orden de wilcoxon, los que son empates no se les toma en cuenta. 3. Cuando hay diferencias que se repiten se llaman LIGUES, para unir el ligue, uso el promedio del rango asignado (1+2+3=6 / 3 = 2), y ese rango de 2 voy a usar para los ligues.

Diferencias en orden ascendente 0 0 1 1 1 2 4 5 A B DIFEREN RANGO ASIGNADO

4 3 1 2

3 4 -1 2

Rangos Rango orden asignado

6 6 0 -

1 2 3 4 5 6 7 6 1 2

2 2 2 4 5 6 9 5 4 5

4 4 0 -

2 7 -5 6

5 3 2 4

Luego sumamos todos los de signo positivo: Signo positivo (+): 13 Signo negativo (-): 8 Para tomar la decisión: El valor más bajo, de los rangos positivos y negativos, en este caso el 8, y con ese se hace el contraste. Con la tabla de contraste de Wilcoxon.

Valores útiles (sin empates) 6

α 0.05 0-21

(-):8

Si es que esta entre 0 y 21, voy a aceptar la hipótesis nula, sino rechazo la hipótesis nula.

Ho: Fármaco A= Fármaco B ✔ /

HT: Fármaco A ≠ Fármaco B x

Acepto la hipótesis nula, donde dice que el número de recidivas con el fármaco A es igual al número de recidivas con el fármaco B.

Yo puedo usar el test de signo para comparar dos grupos, igualmente el test de rangos de wilcoxon.

En realidad el test de rango se usa habitualmente para análisis pareados, ósea es el reemplazo para la t pareada porque se basa en las diferencias.

Conclusion: El test de signo y rangos trabajan sobre MEDIANAS.

More Documents from "mary sol"