Reporte (1.1).pdf

  • Uploaded by: Wilbert Cabrera
  • 0
  • 0
  • October 2019
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Reporte (1.1).pdf as PDF for free.

More details

  • Words: 3,498
  • Pages: 14
INFERENCIA ESTADÍSTICA La inferencia estadística es el conjunto de métodos y técnicas que permiten inducir, a partir de la información empírica proporcionada por una muestra, cual es el comportamiento de una determinada población con un riesgo de error medible en términos de probabilidad. Los métodos paramétricos de la inferencia estadística se pueden dividir, básicamente, en dos: métodos de estimación de parámetros y métodos de contraste de hipótesis. Ambos métodos se basan en el conocimiento teórico de la distribución de probabilidad del estadístico muestral que se utiliza como estimador de un parámetro. La estimación de parámetros consiste en asignar un valor concreto al parámetro o parámetros que caracterizan la distribución de probabilidad de la población. Cuando se estima un parámetro poblacional, aunque el estimador que se utiliza posea todas las propiedades deseables, se comete un error de estimación que es la diferencia entre la estimación y el verdadero valor del parámetro. El error de estimación es desconocido por lo cual es imposible saber en cada caso cual ha sido la magnitud o el signo del error; para valorar el grado de precisión asociado con una estimación puntual se parte de dicha estimación para construir un intervalo de confianza. En síntesis, un intervalo de confianza está formado por un conjunto de valores numéricos tal que la probabilidad de que éste contenga al verdadero valor del parámetro puede fijarse tan grande como se quiera. Esta probabilidad se denomina grado de confianza del intervalo, y la amplitud de éste constituye una medida del grado de precisión con el que se estima el parámetro. Los métodos de contraste de hipótesis tienen como objetivo comprobar si determinado supuesto referido a un parámetro poblacional, o a parámetros análogos de dos o más poblaciones, es compatible con la evidencia empírica contenida en la muestra. Los supuestos que se establecen respecto a los parámetros se llaman hipótesis paramétricas. Para cualquier hipótesis paramétrica, el contraste se basa en establecer un criterio de decisión, que depende en cada caso de la naturaleza de la población, de la distribución de probabilidad del estimador de dicho parámetro y del

control que se desea fijar a priori sobre la probabilidad de rechazar la hipótesis contrastada en el caso de ser ésta cierta.

Conceptos básicos     

Población: “Conjunto de elementos en los que se observa alguna característica común” Observaciones: “Valores que toma la característica observada en cada elemento de la población” Parámetro: “Característica numérica que describe una variable observada en la población” Muestra: “Conjunto de unidades representativas de una población” Estadístico: “Función de los valores de la muestra”

(Proceso) 1. La inferencia estadística está basada en el estudio de las muestras. 2. La muestra debe ser representativa de la población para extraer conclusiones validas sobre esta población. 3. La muestra debe ser aleatoria.

Objetivos de la Inferencia Estadística. El objetivo de la Estadística es medir y modelar la variabilidad del proceso mediante un modelo probabilístico. Para modelar la variabilidad de una variable aleatoria si sólo se dispone del conocimiento de una muestra de la misma se sigue el siguiente modo de actuación:

• Planteamiento del problema. • Selección de la muestra (Muestreo estadístico), en algunos estudios la muestra se obtiene por simulación (Simulación Estadística) • Estudio descriptivo de la muestra, analítico y gráfico (Estadística Descriptiva).

• En base al conocimiento de los modelos probabilísticos más utilizados y teniendo en cuenta el planteamiento del problema y el estudio descriptivo previo, elegir un modelo de probabilidad (Teoría de la Probabilidad). • Estimar los parámetros del modelo supuesto a partir de las observaciones muestrales utilizando los métodos de Inferencia Estadística: estimación puntual, estimación por intervalos de confianza y contrastes de hipótesis paramétricos. • Chequear que el modelo de probabilidad ajustado a los datos es adecuado y que se verifican las hipótesis supuestas en el estudio, por ejemplo, que las observaciones muestrales son independientes, que no existen observaciones erróneas… etc. Para ello se utilizan los métodos de Inferencia no Paramétrica. • Si se acepta que el modelo ajustado es adecuado se puede utilizar para obtener resultados y conclusiones sobre la variable en estudio. En caso contrario, se debe reformular el modelo de probabilidad y repetir el proceso desde el paso 4.

Muestreo El muestreo es por lo tanto una herramienta de la investigación científica, cuya función básica es determinar que parte de una población debe examinarse, con la finalidad de hacer inferencias sobre dicha población. La muestra debe lograr una representación adecuada de la población, en la que se reproduzca de la mejor manera los rasgos esenciales de dicha población que son importantes para la investigación. Para que una muestra sea representativa, y por lo tanto útil, debe de reflejar las similitudes y diferencias encontradas en la población, es decir ejemplificar las características de ésta. Clasificación Muestreo Probabilístico Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente,

todas las posibles muestras de tamaño n tienen la misma probabilidad de ser seleccionadas.  Muestreo aleatorio simple En este método de muestreo lo principales es tener una idea clara de cuantos sujetos serán necesarios para completar el tamaño de la muestra que se va a investigar, pues este consiste en que a cada sujeto de la población se le debe asignar un número, para que posteriormente mediante algún sorteo, o generando números aleatorios con ayuda de rifas o algún ordenador se logre dar a conocer los números de los sujetos seleccionados que serán tomados como muestra. Ejemplo: A un grupo de 100 personas se les numera de uno a cien y se depositan en una urna 100 bolitas a su vez numeradas de uno a cien. Para obtener una muestra aleatoria simple de 20 elementos, tendríamos que sacar 20 bolitas numeradas de la urna que nos seleccionarán en forma completamente al azar a los 20 elementos escogidos para que opinen sobre un nuevo producto.  Muestreo sistemático Pues en este método como en el primero, los sujetos que conforman a la población son enumerados, pero en lugar de dar a conocer los que serán incluidos mediante el azar en este caso incluyen otra técnica. Ejemplo No. 2: a partir de una lista de 100 establecimientos de comestibles, deseamos seleccionar una muestra probabilística de 20 tiendas. La forma de hacerlo sería: o dividir 100 entre 20 para obtener 5, que es un salto sistemático o extraer un número al azar entre 1 y 5. Supóngase que es el número 2 el cual corresponde al primer elemento seleccionado. o Se incluyen en la muestra de establecimientos numerados: 2, 7, 12, 17, 22,…..,97.  Muestreo estratificado Mediante este método de investigación, los investigadores dividen a la población en grupos o estratos que tengan relación o compartan características similares y posteriormente se selecciona al azar o aleatoriamente a los sujetos finales de los grupos o estratos formados.

Ejemplo No. 4: es muy probable que la investigación acerca de las actitudes, preferencias y hábitos de consumo de las madres de familia y los niños por un nuevo tipo de galleta en el mercado deba enfocarse más hacia los niveles socioeconómicos altos, ya que son quienes pueden hacer frente a un precio Premium del 20%. Suponga que se planea hacer un total de 500 encuestas en la ciudad donde usted vive. Considerando los porcentajes de hogares en cada estrato socioeconómico en un muestreo probabilístico con cálculo proporcional obtendríamos: Nivel socioeconómico % de hogares Número de entrevistas A/B 8 40 C 36 180 D/E 56 280 Total 100 % 500 Sin embargo, este número de entrevistas por estrato no permitiría mayor análisis y desvirtuaría los objetivos de la investigación en los estratos altos. Aquí se deberá calcular el tamaño de cada muestra mediante el método desproporcional, utilizando el siguiente procedimiento: oSe numeran los hogares de la lista en forma independiente para cada estrato. oSe determina la característica importante para cada estrato y se hace una estimación de su distribución en la muestra total. Columna 1 Nivel socioeconó mico A/B C D/E Total

Columna 2 % de hogares 8% 36% 56% 100%

Columna 3 Número inicial de entrevistas 40 180 280 500

Columna 4 ¿Pagaría 20% de sobreprecio? 60% 25% 15% 100%

Columna 5 Columna 3 x columna 4 24.00 45.00 42.00 111.00

Columna 6 Número final de entrevistas 108 203 189 500

Columna 7 % equivalente 21.6% 40.6% 37.8% 100.0%

O Se aplica el método de muestreo por zonas, considerando los valores de 108, 203 y 189 como tamaños totales de muestras para cada zona. Esto implica que si se hubiera aplicado el muestreo directamente proporcional al tamaño del estrato, al intentar investigar la probabilidad de pago de un aprecio Premium, la investigación se habría visto muy limitada, precisamente por el tamaño del estrato. Al balancear el tamaño del mismo con la probabilidad de posesión del producto, se podrá explorar mejor el fenómeno.

 Muestreo por conglomerados En este método, la población ya se encuentra dividida en grupos o estratos formados naturalmente y a partir de estos se toman la cantidad de sujetos que sean necesarios de cada uno para así formar la muestra. Ejemplo No. 5: Las unidades hospitalarias, los departamentos académicos en una universidad, una caja de determinado producto, etc., son conglomerados naturales. También existen los conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los conglomerados son áreas geográficas suele hablarse de "muestreo por áreas". Muestreo no probabilístico Mediante esta técnica de muestreo, en comparación del muestreo probabilístico las muestras no se recogen por medio de procesos donde a los sujetos se les brinden las mismas posibilidades de ser seleccionados.  Muestreo por cuotas Mediante este método los investigadores se encargan de incluir en la muestra solo a un grupo determinado de sujetos que cumplen con ciertos requisitos o condiciones específicas. Ejemplo No. 6: Seleccionar 50 estudiantes de la carrera de ingeniería industrial, que ya hayan cursado el cuarto ciclo de la carrera y que tengan promedio arriba del 75 por ciento. Se eligen a los primeros 50 que cumplan con estas condiciones. Este tipo de muestreo se utiliza especialmente en las encuestas de opinión  Muestreo intencional Mediante este método, el investigador se encarga de elegir de acuerdo con sus propios criterios o alcances a los sujetos que formaran parte de la muestra. Ejemplo No. 7: Realizar un sondeo pre-electoral en una región en donde anteriormente la tendencia de voto ha estado orientada a un candidatos específico. 

Muestreo por bola de nieve

En este método se hace contacto con algún sujeto en específico y este se encargará de buscar a otros sujetos o nuevos participantes consecutivamente. Haciéndolo de esta forma hasta cumplir con el tamaño de muestra o cantidad de sujetos que se necesitan. Ejemplo No. 8: Realizar estudios con poblaciones marginales, con delincuentes, tipos de enfermos para conocer el nivel de participación social.  Muestreo discrecional Mediante este método, se aplica una técnica parecida a la del método intencional, pues el investigador recluta a los sujetos según sus criterios; pero en este caso, los busca de acuerdo con lo que piensen que estos sujetos puedan aportar a la investigación. Ejemplo No. 9: Seleccionar a cajeros de un banco en un estudio sobre el comportamiento del usuario ante el pago de impuestos.  Muestreo por Juicio El investigador selecciona a los individuos a través de su criterio profesional. Puede basarse en la experiencia de otros estudios anteriores o en su conocimiento sobre la población y el comportamiento de esta frente a las características que se estudian.

Estadística rama de las matemáticas que estudia la variabilidad, así como el proceso aleatorio que la genera siguiendo leyes de probabilidad. Como parte de la matemática, la estadística es una ciencia formal deductiva, con un conocimiento propio, dinámico y en continuo desarrollo obtenido a través del método científico formal. En ocasiones, las ciencias fácticas necesitan utilizar técnicas estadísticas durante su proceso de investigación factual, con el fin de obtener nuevos conocimientos basados en la experimentación y en la observación. En estos casos, la aplicación de la estadística permite el análisis de datos provenientes de una muestra representativa, que busca explicar las correlaciones y dependencias de un fenómeno físico o natural, de ocurrencia en forma aleatoria o condicional. Ejemplos de estadística  Las elecciones para diputados nacionales en México indican un 28,87% de los votos para el Partido Revolucionario Institucional, un 20,86% para el Partido

 

Acción Nacional, un 10,74% para el Partido de la Revolución Democrática y un 7,16% para el Partido Verde Ecologista. El porcentaje de población por encima de los 60 años en Canadá pasó del 17,03 en 2002 al 21,3% en 2013, con un crecimiento promedio del 0,20% anual. Dentro del hospital donde se realizó la muestra, puede comprobarse que de los casos de infecciones intrahospitalarias, el 40% involucra infecciones urinarias, el 25% se produce por heridas quirúrgicas, el 15% son infecciones respiratorias y el 10% están asociadas al cateterismo.

Estadística para estimar parámetros En inferencia estadística se llama estimación al conjunto de técnicas que permiten dar un valor aproximado de un parámetro de una población a partir de los datos proporcionados por una muestra. Por ejemplo, una estimación de la media de una determinada característica de una población de tamaño N podría ser la media de esa misma característica para una muestra de tamaño n. Ejemplo

Parámetros Normalmente, al efectuar un estudio estadístico de una V.A, los datos que nos encontramos son muy numerosos y están desordenados. En consecuencia, es necesario efectuar un proceso de reducción y ordenación, que me permitan manejarlos de manera más sencilla y práctica. Este proceso, va a conllevar una pérdida de la información ofrecida originalmente por los datos, que puede llevar a errores. Sin embargo, esto va a permitir la caracterización de los datos y sobre todo, la comparación de distintas muestras entre sí. Habitualmente se agrupan los parámetros en las siguientes categorías: Medidas de posición. Se trata de valores de la variable estadística que se caracterizan por la posición que ocupan dentro del rango de valores posibles de esta. Entre ellos se distinguen:  Las medidas de tendencia central: medias, moda y mediana.  Las medidas de posición no central: cuantiles (cuartiles, deciles y percentiles). Medidas de dispersión.

Resumen la heterogeneidad de los datos, lo separados que estos están entre sí. Hay dos tipos, básicamente:  Medidas de dispersión absolutas, que vienen dadas en las mismas unidades en las que se mide la variable: recorridos, desviaciones medias, varianza, y desviación típica.  Medidas de dispersión relativa, que informan de la dispersión en términos relativos, como un porcentaje. Se incluyen entre estas el coeficiente de variación, el coeficiente de apertura, los recorridos relativos y el índice de desviación respecto de la mediana. Medidas de forma. Su valor informa sobre el aspecto que tiene la gráfica de la distribución. Entre ellas están los coeficientes de asimetría y los de curtosis. Otros parámetros. Además, y con propósitos más específicos, existen otros parámetros de uso en situaciones muy concretas, como son las proporciones, los números índice, las tasas y el coeficiente de Gini.

Simbología Símbolos

Descripción La media muestral, que se refiere a la muestra media o media empírica, así como a la covarianza de la muestra con las estadísticas que se calculan con base en una colección de datos en una o más variables de tipo aleatorio. Se refiere a cada uno de los valores que se observan en las variables.



• S2

Se refiere a la varianza simple.

•r

Simboliza la coeficientes.

• kr

Simboliza el cúmulo de las muestras. Parámetros de población

simple

correlación

de

•μ

Se refiere a la población como tal.

• σ2

Simboliza la varianza de la población.

•ρ

Simboliza la correlación de la población

• κr

Simboliza los cúmulos de población.

•n

Simboliza el número de elementos en una distribución de la muestra. La letra griega Alpha simboliza la intercepción o un error de tipo I. La letra griega beta simboliza vertiente o un error de tipo II. La letra griega sigma simboliza la desviación estándar de la población. La letra s significa la desviación estándar de la muestra. La letra s al cuadrado simboliza la varianza de la muestra.

•α •β •σ •s • s2

Símbolos estadísticos de mayor uso •C

•U • SC •N

Simboliza la distribución, y también es conocida como la distribución para una variable independiente Se refiere a la distribución que no es lo mismo que y también es conocida como variable dependiente. Simboliza todos los elementos (generalmente números) en una distribución. Simboliza el número de elementos una distribución poblacional.

Estimación El objetivo principal de la estadística inferencial es la estimación, esto es que mediante el estudio de una muestra de una población se quiere generalizar las conclusiones al total de la misma. Como vimos en la sección anterior, los estadísticos varían mucho

dentro de sus distribuciones muestrales, y mientras menor sea el error estándar de un estadístico, más cercanos serán unos de otros sus valores. Supongamos que debes sumar una serie de números. Puedes redondear cada sumando a la centena más cercana para estimar la suma. Ejemplo Problema Estimar la suma 1,472 + 398 + 772 + 164 redondeando cada número a la centena más cercana. 1,472….1,500 398……. 400

Primero, redondea cada número a la centena más cercana.

772……..800 164……..200

1,5 0 0 400 800 + 200 2,9 0 0 Respuesta

Luego, suma todos los números redondeados.

La estimación es 2,800.

En el ejemplo de arriba, la suma exacta es 2,806. Nota lo cerca que está del estimado, el cual es mayor por 94.

Estimadores

Un estimador es un estadístico (una función de la muestra) utilizado para estimar un parámetro desconocido de la población. El nivel de confianza es la probabilidad de que a priori el verdadero valor del parámetro quede contenido en el intervalo. En la práctica, los intervalos de estimadores con distribuciones simétricas suelen indicarse dando el valor del estimador puntual utilizado como centro del intervalo y un valor que debe sumarse y restarse para obtener el límite superior e inferior; por ejemplo: equivale a

Propiedades 

Sesgo: Se denomina sesgo de un estimador a la diferencia entre la esperanza (o valor esperado) del estimador y el verdadero valor del parámetro a estimar. Es deseable que un estimador sea insesgado o centrado, es decir, que su sesgo sea nulo por ser su esperanza igual al parámetro que se desea estimar. para cualquier i=1...n



Consistencia: Si no es posible emplear estimadores de mínima varianza, el requisito mínimo deseable para un estimador es que a medida que el tamaño de la muestra crece, el valor del estimador tienda a ser el valor del parámetro poblacional, propiedad que se denomina consistencia.



Eficiencia: Un estimador es más eficiente o más preciso que otro estimador, si la varianza del primero es menor que la del segundo.



Robustez: El estimador θ ^ será un estimador robusto del parámetro θ si la violación de los supuestos de partida en los que se basa la estimación (normalmente, atribuir a la población un determinado tipo de función de distribución que, en realidad, no es la correcta), no altera de manera significativa los resultados que éste proporciona.



Suficiencia: Se dice que un estimador es suficiente cuando resume toda la información relevante contenida en la muestra, de forma que ningún otro estimador pueda proporcionar información adicional sobre el parámetro desconocido de la población. Por ejemplo, la media muestral sería un estimador suficiente de la media poblacional, mientras que la moda no lo sería.



Invariancia: Se dice que un estimador es invariante cuando el estimador de la función del parámetro coincide con la función del estimador del parámetro,

Prueba de Hipótesis Un contraste o test de hipótesis es una técnica de Inferencia Estadística que permite comprobar si la información que proporciona una muestra observada concuerda (o no) con la hipótesis estadística formulada sobre el modelo de probabilidad en estudio y, por tanto, se puede aceptar (o no) la hipótesis formulada. Una hipótesis estadística es cualquier conjetura sobre una o varias características de interés de un modelo de probabilidad. Tipos 

La Hipótesis Nula, denotada como H0 siempre especifica un solo valor del parámetro de la población si la hipótesis es simple o un conjunto de valores si es compuesta (es lo que queremos desacreditar). H0: µ = µ0



La Hipótesis Alternativa, denotada como H1 es la que responde nuestra pregunta, la que se establece en base a la evidencia que tenemos. Puede tener cuatro formas:

H1: µ = µ H1: µ < µ0 H1: µ > µ0 H1: µ Diferente de µ0 

La Región de Rechazo es el conjunto de valores tales que, si la prueba estadística cae dentro de este rango, decidimos rechazar la Hipótesis Nula.



La Estadística de Prueba es una estadística que se deriva del estimador puntual del parámetro que estemos probando y en ella basamos nuestra decisión acerca de si rechazar o no rechazar la Hipótesis Nula.

Related Documents

Reporte
June 2020 22
Reporte
December 2019 68
Reporte
May 2020 32
Reporte
August 2019 67
Reporte
May 2020 27

More Documents from ""

Reporte (1.1).pdf
October 2019 17
Cuadro Comparativo.docx
December 2019 10
Dibujo Montea 1.docx
April 2020 7
Hiburan Dalam Jurnalisme
November 2019 16
Sist Nervioso Central.docx
November 2019 12