Estadistica Aplicada 1

  • May 2020
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Estadistica Aplicada 1 as PDF for free.

More details

  • Words: 2,409
  • Pages: 12
REPUBLICA BOLIVARIANA DE VENEZUELA MINISTERIO DEL PODER POPULAR PARA LA EDUCACIÓN SUPERIOR UNIVERSIDAD NACIONAL EXPERIMENTAL SIMÓN RODRÍGUEZ NUCLEO MARACAY

Profesora: Irlanda Álvarez

Participante: María López C.I 12.482.108

Maracay, 30 de Julio de 2009

PARÁMETROS

Los parámetros son elementos que proporcionan información al cmdlet, ya sea mediante la identificación de un objeto y sus atributos sobre el que actuar o mediante el control de la realización de las tareas del cmdlet. El nombre del parámetro va precedido de un guión (-) y seguido por el valor del parámetro del modo siguiente: Verb-Noun -ParameterName <ParameterValue> EJEMPLO: En este sencillo ejemplo, el guión delante del nombre del parámetro indica al Shell de administración de Exchange que la palabra que sigue inmediatamente al guión es un parámetro que se pasa al cmdlet y que la siguiente palabra independiente después del parámetro es el valor de dicho parámetro.

ESTIMADOR En estadística, un estimador es un estadístico (esto es, una función de la muestra) usado para estimar un parámetro desconocido de la población. Para cada parámetro pueden existir varios estimadores diferentes. En general, escogeremos el estimador que posea mejores propiedades que los restantes, como insesgadez, eficiencia, convergencia y robustez (consistencia). El valor de un estimador proporciona lo que se denomina en estadística una estimación puntual del valor del parámetro en estudio. En general, se suele preferir realizar una estimación mediante un intervalo, esto es, obtener un intervalo [a,b] dentro del cual se espera esté el valor real del parámetro con un cierto nivel de confianza. Utilizar un intervalo resulta más informativo, al proporcionar información sobre el posible error de estimación, asociado con la amplitud de dicho intervalo. El nivel de confianza es la probabilidad de que a priori el verdadero valor del parámetro quede contenido en el intervalo.

EJEMPLOS:

Ejemplo 1: Si se desea conocer el precio medio de un artículo (el parámetro desconocido) se recogerán observaciones del precio de dicho artículo en diversos establecimientos (la muestra) y la media aritmética de las observaciones puede utilizarse como estimador del precio medio. Ejemplo 2: En la práctica, en los intervalos suelen indicarse dando el valor del estimador puntual utilizado como centro del intervalo y un valor que debe sumarse y restarse para obtener el límite superior e inferior, por ejemplo: Equivale a

ESTIMACIÓN Se llama estimación al conjunto de técnicas que permiten dar un valor aproximado de un parámetro de una población a partir de los datos proporcionados por una muestra. Por ejemplo, una estimación de la media de una determinada característica de una población de tamaño N podría ser la media de esa misma característica para una muestra de tamaño n.1 La estimación se divide en tres grandes bloques, cada uno de los cuales tiene distintos métodos que se usan en función de las características y propósitos del estudio: •

Estimación puntual:2 o

Método de los momentos;

o

Método de la máxima verosimilitud;

o

Método de los mínimos cuadrados;



Estimación por intervalos.



Estimación bayesiana.

ESTIMACIÓN PUNTUAL

Si a partir de las observaciones de una muestra se calcula un solo valor como estimación de un parámetro de la población desconocido, el procedimiento se denomina estimación puntual. EJEMPLO: Queremos estimar la nota media de los alumnos de bachiller en la asignatura de matemáticas que notaremos

. Sea X la variable aleatoria que indica la

nota obtenida por cada estudiante. Tomamos una muestra de tamaño n y denotamos

la nota media de la muestra. Si al tomar una muestra de 100

estudiantes obtenemos que la media es 6´2, este número lo tomaríamos como estimativo de

. Decimos que 6´2 es una estimación puntual de

.

ESTIMACIÓN POR INTERVALOS Consiste en la obtención de un intervalo dentro del cual estará el valor del parámetro estimado con una cierta probabilidad. En la estimación por intervalos se usan los siguientes conceptos: Intervalo de confianza El intervalo de confianza es una expresión del tipo [θ1, θ2] ó θ1 ≤ θ ≤ θ2, donde θ es el parámetro a estimar. Este intervalo contiene al parámetro estimado con una determinada certeza o nivel de confianza. Pero a veces puede cambiar este intervalo cuando la muestra no garantiza un axioma o un equivalente circunstancial. Variabilidad del Parámetro Si no se conoce, puede obtenerse una aproximación en los datos aportados por la literatura científica o en un estudio piloto. También hay métodos para calcular el tamaño de la muestra que prescinde de este aspecto. Habitualmente se usa como medida de esta variabilidad la desviación típica poblacional y se denota σ. Error de la estimación Es una medida de su precisión que se corresponde con la amplitud del intervalo de confianza. Cuanta más precisión se desee en la estimación de un parámetro, más

estrecho deberá ser el intervalo de confianza y, si se quiere mantener o disminuir el error, más ocurrencias deberán incluirse en la muestra estudiada. En caso de no incluir nuevas observaciones para la muestra, más error se comete al aumentar la precisión. Se suele llamar E, según la fórmula E = θ2 - θ1. Limite de Confianza Es la probabilidad de que el verdadero valor del parámetro estimado en la población se sitúe en el intervalo de confianza obtenido. El nivel de confianza se denota por (1-α), aunque habitualmente suele expresarse con un porcentaje ((1-α) ·100%). Es habitual tomar como nivel de confianza un 95% o un 99%, que se corresponden con valores α de 0,05 y 0,01 respectivamente. Valor α También llamado nivel de significación. Es la probabilidad (en tanto por uno) de fallar en nuestra estimación, esto es, la diferencia entre la certeza (1) y el nivel de confianza (1-α). Por ejemplo, en una estimación con un nivel de confianza del 95%, el valor α es (100-95)/100 = 0,05. Valor crítico Se representa por Zα/2. Es el valor de la abscisa en una determinada distribución que deja a su derecha un área igual a α/2, siendo 1-α el nivel de confianza. Normalmente los valores críticos están tabulados o pueden calcularse en función de la distribución de la población. Por ejemplo, para una distribución normal, de media 0 y desviación típica 1, el valor crítico para α = 0,05 se calcularía del siguiente modo: se busca en la tabla de la distribución ese valor (o el más aproximado), bajo la columna "Área"; se observa que se corresponde con -1,64. Entonces Zα/2 = 1,64. Si la media o desviación típica de la distribución normal no coinciden con las de la tabla, se puede realizar el cambio de variable t =(X-μ)/σ para su cálculo. Con estas definiciones, si tras la extracción de una muestra se dice que "3 es una estimación de la media con un margen de error de 0,6 y un nivel de confianza del 99%", podemos interpretar que el verdadero valor de la media se encuentra entre 2,7 y 3,3, con una probabilidad del 99%. Los valores 2,7 y 3,3 se obtienen restando y sumando,

respectivamente, la mitad del error, para obtener el intervalo de confianza según las definiciones dadas. Para un tamaño fijo de la muestra, los conceptos de error y nivel de confianza van relacionados. Si admitimos un error mayor, esto es, aumentamos el tamaño del intervalo de confianza, tenemos también una mayor probabilidad de éxito en nuestra estimación, es decir, un mayor nivel de confianza. CARACTERISTICAS DE UN BUEN ESTIMADOR Las características de un buen estimador puntual son insesgabilidad, consistencia o exactitud, eficiencia o precisión y suficiencia. •

Insesgabilidad: Un estimador puntual es insesgado si la media de la distribución muestral del estadístico (esperanza matemática del estadístico) es igual al parámetro por estimar; es decir, si estadístico cualquiera y , entonces



es un

es el parámetro correspondiente y si

es un estimador insesgado de

.

Consistencia o exactitud: Por lo general un estimador no es idéntico al parámetro que se estima, existe una diferencia entre ellos que es el error de muestreo, pero si se aumenta el tamaño de la muestra suficientemente, la probabilidad de que esta diferencia sea mayor que un número fijo



tenderá a cero.

Eficiencia o precisión: Un estimador

es más eficiente que

, si la varianza del primero es menor que la del segundo ( •

de θ ).

Suficiencia: Se dice de manera intuitiva que un estimador es suficiente, si transmite tanta información de la muestra como sea posible acerca del parámetro, de modo que se proporciona mayor

información por cualquier otro estimador calculado de la misma muestra: y si se obtiene el valor de un estadístico suficiente los valores de muestra mismos no proporcionan más información sobre el parámetro. Por ejemplo, tanto la media (

) como la mediana como el

centro de amplitud (C.A.) se pueden usar como estimadores de embargo, sólo la media

; sin

toma en cuenta cada valor o toda la

información de la muestra, mientras que el centro de amplitud sólo toma en cuenta el primer y último valor, y la mediana es una medida de tendencia central de posición. Así pues, la media es un estimador suficiente para

.

EJEMPLO: 1- El ejemplo 9.3,

y

, de donde se concluye que

son estimadores in sesgados de

y

, respectivamente. Sin embargo, si se usa

para estimar la varianza de una muestra, entonces

y

. Esto se puede demostrar

fácilmente como se ve a continuación

2- El ejemplo 9.3

y Md son estimadores in sesgados de

consistentes; sin embargo,

, de donde

y también

es un estimador más

eficiente que Md para estimar . INTERVALO DE CONFIANZA Las líneas verticales representan 50 construcciones diferentes de intervalos de confianza para la estimación del valor μ Se llama intervalo de confianza en estadística a un par de números entre los cuales se estima que estará cierto valor desconocido con una determinada probabilidad de acierto. Formalmente, estos números determinan un intervalo, que se calcula a partir de datos de una muestra, y el valor desconocido es un parámetro poblacional. La

probabilidad de éxito en la estimación se representa por 1 - α y se denomina nivel de confianza. En estas circunstancias, α es el llamado error aleatorio o nivel de significación, esto es, una medida de las posibilidades de fallar en la estimación mediante tal intervalo.1 EJEMPLO: Intervalo de confianza para la media de una población De una población de media μ y desviación típica σ se pueden tomar muestras de n elementos. Cada una de estas muestras tiene a su vez una media ( ). Se puede demostrar que la media de todas las medias muéstrales coincide con la media poblacional:2 Pero además, si el tamaño de las muestras es lo suficientemente grande, 3 la distribución de medias muéstrales es, prácticamente, una distribución normal (o gaussiana) con media μ y una desviación típica dada por la siguiente expresión:

. Esto se representa como sigue:

Si

estandarizamos, se sigue que: LÍMITES DE CONFIANZA Los dos límites que definen el intervalo dentro del que presumiblemente se encuentran un parámetro poblacional que se estime. ERROR DE ESTIMACIÓN Y RIESGO El error estándar de la estimación designado por sYX mide la disparidad “promedio” entre los valores observados y los valores estimados de. Se utiliza la siguiente formula. Debemos entonces calcular los valores de para cada ciudad sustituyendo en la ecuación los valores de los porcentajes de graduados de cada ciudad estudiada.

EJEMPLO: YX

7.6 23.9 8.0 −0.4 0.16

4.2 7.2 4.6 −0.4 0.16

4.4 6.0 4.4 0.0 0.00

4.9 6.7 4.5 0.4 0.16

5.4 10.2 5.2 0.2 0.04

7.0 17.0 6.6 0.4 0.16

1.29

6.2 12.5 5.7 0.5 0.25

Syx = 0.46 (decenas de miles $)

3.8 6.3 4.4 −0.6 0.36 Como esta medida trata de resumir la disparidad entre lo observado y lo estimado, es decir, trata de medir la diferencia promedio entre lo observado y lo estimado ó esperado de acuerdo al modelo, puede considerarse como un indicador del grado de precisión con que la ecuación de regresión, describe la relación entre las dos variables. TAMAÑO DE LA MUESTRA En Estadística el tamaño de la muestra es el número de sujetos que componen la muestra extraída de una población, necesarios para que los datos obtenidos sean representativos de la población. EJEMPLO: En el proyecto de Al Haouz en Marruecos, se ha calculado que cerca del 30% (0,3) de los niños de la zona del proyecto padecen de malnutrición crónica. Este dato se basa en estadísticas nacionales sobre malnutrición en las zonas rurales. Utilizando los valores estándar indicados supra se efectúa el cálculo siguiente:

Calcula: n=

1.96² x .3(1-.3) .05²

n=

3.8416 x .21 .0025

n=

.8068 .0025

n=

322.72 ~ 323

MEDIA POBLACIONAL La media de una población es un parámetro (una característica medible de una población), así como la amplitud de variación (la diferencia entre el valor más grande y el más pequeño en un conjunto de datos). A partir de datos en vivo, los que no han sido agrupados en una distribución de frecuencias o en una representación de tallo y hoja, la media de una población es: Suma de todos los valores de la población X Media de una población = = Número de valores en la población N Donde: Representa la media de población N nº total de elementos en la población X cualquier valor en particular •

sumatoria

PROPORCIÓN POBLACIONAL En poblaciones dicotómicas con una proporción puntual del parámetro

de éxitos el estimador

es la proporción muestral de éxitos, p, que coincide con la

media de la muestra cuando se codifica como 1 la característica que se considera como éxito y 0 la que se considera no éxito. A partir de un tamaño muestral moderadamente grande el estadístico p tiene una distribución aproximadamente normal. El intervalo de confianza para la proporción poblacional está centrado en la proporción muestral;

siendo sus límites superior e inferior correspondiente al grado de confianza 1-

donde z /2 es el valor crítico de la distribución normal tipificada y

es el error típico de la proporción. Para obtener el intervalo de confianza y contrastar hipótesis sobre la proporción una alternativa consiste en tratar a la proporción

como la media poblacional de una

variable dicotómica codificada como se ha descrito anteriormente (éxito=1, no éxito=0) y la secuencia es: EJEMPLO: •

Para el intervalo de confianza:

Analizar Estadísticos Descriptivos Explorar



Para contrastar la hipótesis nula

Analizar Comparar medias

Prueba T para una muestra. Utilizando este criterio los resultados numéricos no coinciden exactamente con los que se obtendrían aplicando la expresión del error típico de la proporción; no obstante la discrepancia es despreciable si el número de observaciones es suficientemente grande.

Related Documents

Estadistica 1
August 2019 26
Estadistica 1
December 2019 58
Estadistica
November 2019 25