VARIABLES ALEATORIAS CONTINUAS Estimación puntual Una estimacióó n puntual del valór de un paraó metró póblaciónal descónócidó (cómó puede ser la media μ , ó la desviacióó n estaó ndar σ ), es un nuó meró que se utiliza para apróximar el verdaderó valór de dichó paraó metró póblaciónal. A fin de realizar tal estimacióó n, tómaremós una muestra de la póblacióó n y calcularemós el paraó metró muestral asóciadó ( x para la media, s para la desviacióó n estaó ndar, etc.). El valór de este paraó metró muestral seraó la estimacióó n puntual del paraó metró póblaciónal. Pór ejempló, supóngamós que la cómpanñ íóa Sónytrón desea estimar la edad media de lós cómpradóres de equipós de alta fidelidad. Selecciónan una muestra de 100 cómpradóres y calculan la media de esta muestra, este valór seraó un estimadór puntual de la media de la póblacióó n. ¿Queó própiedades debe cumplir tódó buen estimadór? Insesgado: Un estimadór es insesgado cuandó la media de su distribucióó n muestral asóciada cóincide cón la media de la póblacióó n. Estó ócurre, pór ejempló: cón el De varianza mínima: La variabilidad de un estimadór viene determinada pór el cuadradó de su ´x desviacióó n estaó ndar. En el casó del estimadór , su desviacióó n estaó ndar
Observar que cuantó mayór sea el tamanñ ó de la muestra n , menór seraó la variabilidad del estimadór x y de p´, pór tantó, mejór seraó n nuestras estimaciónes. Ejemplo: En una muestra de 300 universitariós el 80% ha respóndidó que asiste semanalmente al cine. Entre que valóres se encuentra, cón un nivel de cónfianza del 95%, la própórcióó n de universitariós que acude tódas las semanas al cine. Sólucióó n: En las tablas de la Nórmal encóntramós que el valór de la variable que deja pór debajó una próbabilidad de 0,975 es 1,96. Sustituyendó en la expresióó n del intervaló de cónfianza para una própórcióó n:
Estimación por intervalo Dada una póblacióó n X, que sigue una distribucióó n cualquiera cón media � y desviacióó n estaó ndar .
2. Pór ótra parte, el Teórema de Chebyshev nós dice que, en una distribucióó n nórmal, apróximadamente un 95% de lós datós estaban situadós a una distancia inferiór a dós desviaciónes estaó ndar de la media.
Pór tantó, eó sta uó ltima fóó rmula nós da un intervaló de valóres tal que la próbabilidad de que la media de la póblacióó n � esteó cóntenida en eó l es de 0,95. Este tipó de intervalós se llaman intervalos de confianza de un paraó metró póblaciónal. El nivel de confianza (1 - α) del intervaló es la próbabilidad de que eó ste cóntenga al paraó metró póblaciónal. En el ejempló anteriór, el nivel de cónfianza era del 95% (α = 0,05). Ejemplo: La lectura de una muestra aleatória móstrarón una media de 174.5 cm y una desviacióó n estaó ndar de 6.9 cm. Determine un intervaló de cónf ianza del 98% para la altura prómedió de tódós lós estudiantes.
ESTIMACIÓN BAYESIANA DE PROPORCIONES En un gran nuó meró de fenóó menós que pueden incluirse dentró de lós llamadós prócesós de Bernóuilli el paraó metró p (Próbabilidad de óbtener un eó xitó en la prueba) puede entenderse cómó la própórcióó n de individuós que póseen cierta caracteríóstica .Pensemós en las situaciónes en las que las pruebas implicadas en el prócesó cónsistan en la extraccióó n aleatória (muestreó aleatórió) de individuós de una cierta póblacióó n y la cóntemplacióó n de si póseen ó nó una cierta caracteríóstica En muchas situaciónes praó cticas la própórcióó n cón la que se da una caracteríóstica en una póblacióó n nós es descónócida y sin embargó puede resultar necesarió determinarla ó "estimarla ". Para elló pódemós cónsiderar la realizacióó n de una serie de ensayós cónsistentes en la extraccióó n de individuós y la determinacióó n de cuaó ntós
de ellós póseen, la caracteríóstica. Si nó muestreamós a la tótalidad de lós individuós de la póblacióó n la própórcióó n nó pódraó determinarse cón absóluta certeza. Sin embargó, las teó cnicas estadíósticas nós pueden ayudar a estimar la própórcióó n descónócida cón un ciertó gradó de próbabilidad. Baó sicamente eó ste es un casó particular de un tipó de teó cnica de inferencia estadíóstica que se cónóce cón el nómbre de estimacióó n . Pódemós utilizar para la estimacióó n uó nicamente la infórmacióó n suministrada pór la muestra (Estimacióó n claó sica) ó bien pótemós utilizar ademaó s de la infórmacióó n muestral ótrós tipós de infórmaciónes nó muestrales , que pódríóan incluir experiencias anterióres, apreciaciónes de expertós , ideas de tipó subjetivó, la ópinióó n del investigadór ó la del "jefe" ó el "cliente" .En este segundó casó es necesarió utilizar meó tódós Bayesianós de Estimacióó n. Nó pretendemós ahóra tratar cón prófundidad las teó cnicas de la estadíóstica Bayesiana, ni siquiera las teó cnicas de estimacióó n, en general, sinó sóó ló hacer una pequenñ a intróduccióó n a su utilidad. Lós meó tódós Bayesianós de inferencia reciben este nómbre pór que són capaces de sintetizar la infórmacióó n muestral y la llamada "infórmacióó n a prióri" (nó muestral) utilizandó el Teórema de Bayes. El primer presupuestó de la estimacióó n Bayesiana es que la infórmacióó n inicial que se dispóne sóbre el paraó metró que se quiere estimar (en nuestró casó el paraó metró p -la própórcióó n de una caracteríóstica- puede, expresarse a traveó s de una cierta distribucióó n de próbabilidad que se llama distribucióó n a prióri ó distribucióó n inicial. Puede cónsiderarse que el paraó metró puede tómar un cónjuntó numerable de valóres pósibles ó bien que puede tómar valóres cómprendidó en un ciertó intervaló ó en tóda la recta real. En el primer casó la distribucióó n a prióri seraó discreta y en el segundó cóntinua. Unó de lós mayóres próblemas de la estadíóstica bayesiana es , habitualmente , el hechó de póder cónstruir la distribucióó n a prióri a partir de la infórmacióó n inicial ,peró aquíó nó nós platearemós el próblema. Cónsiderandó la infórmacióó n dispónible antes de realizar ninguna experiencia, la estimacióó n del paraó metró p deberaó realizarse a partir de la distribucióó n a prióri. La manera de óbtener un valór cóncretó para la estimacióó n del paraó metró es algó que debe plantearse, en general, cónsideradó una cierta funcióó n de peó rdida asóciada al errór de la estimacióó n .Aquíó cónsideraremós la funcióó n de peó rdida maó s habitual: la peó rdida cuadraó tica .La estimacióó n que minimiza la peó rdida cuadraó tica es la media de la distribucióó n Asíó pues antes de hacer ninguna experiencia cónsideraremós la distribucióó n a prióri de p cómó tóda la infórmacióó n dispónible; y el mejór resumen de esta infórmacióó n , y pór tantó la estimacióó n inicial : la media de la distribucióó n a prióri:
Esta primera estimacióó n de p puede mejórarse utilizandó la infórmacióó n muestral : utilizandó lós resultadós óbtenidós , en cierta experiencia cónsisten en la extraccióó n aleatória de algunós individuós de la póblacióó n. Supóngamós que realizamós una muestra de tamanñ ó n (extraemós n individuós) y óbtenemós x resultadós del tipó que nós interesa. Dependiendó de ló que valga el paraó metró p el resultadó óbtenidó seraó maó s ó menós verósíómil. Esa verósimilitud de la muestra nós vendraó dada pór la próbabilidad de óbtener x resultadós eó xitó en n pruebas en funcióó n de lós pósibles valóres del paraó metró p descónócidó: Asíó L(x}= P(x/p).
Para cada pósible valór del paraó metró p esta próbabilidad pódraó calcularse . Nó seraó ótra cósa que la funcióó n de cuantíóa de x en una distribucióó n dicótóó mica , Binómial, geómeó trica ,Binómial Negativa , ó Hipergeómeó trica (inclusó Póissón ,aunque eó sta sea un prócesó de óbservacióó n) cón paraó metró p el valór de cada una de las alternativas . Se trataraó de una distribucióó n dicótóó mica , binómial , etc seguó n las cóndiciónes en las que se realice el muestreó (una ó varias pruebas, cón repósicióó n ó nó, un nuó meró fijó de extracciónes, ó extracciónes hasta que se próduzcan 1 u ótró nuó meró fijó de eó xitós) Para sintetizar la infórmacióó n a prióri y la infórmacióó n muestral nós planteamós determinar las próbabilidades de cada pósible valór de p sabiendó que tras muestrear n individuós se han óbtenidó x eó xitós:
que aplicandó el Teórema de Bayes seraó :
A la distribucióó n que asigna a cada pósible valór del paraó metró la próbabilidad de ese el valór cóndiciónada a que la experiencia nós ha dadó x eó xitós en n pruebas se la cónóce cómó distribucióó n a pósterióri ó distribucióó n final. Esta distribucióó n nós da tóda la infórmacióó n dispónible acerca del paraó metró descónócidó p, tantó la inicial cómó la empíórica. Y a partir de ella pódremós realizar una segunda estimacióó n mejórada del valór del paraó metró que seraó la media de la distribucióó n a pósterióri:
Ejempló: Supóngamós que la própórcióó n de persónas que nó tienen teleó fónó en su casa es descónócida. Peró que. basaó ndónós en lós datós de ótras ciudades similares pódemós supóner que se encuentra entre 0,05 y 0,01 cón las siguientes próbabilidades asóciadas.
en principió la estimacióó n inicial seríóa Para mejórar esta infórmacióó n realizamós una encuesta al azar preguntandó a las persónas si tienen teleó fónó . Resultandó que de 20 preguntadas sóó ló una nó teníóa teleó fónó. La próbabilidad de que de 20 persónas 1 nó tenga teleó fónó (cómó la póblacióó n es muy grande nó imparta que nó haya reemplazamientó) nós vendraó dada pór la funcióó n de cuantíóa (para X=l) en una B{20,p), (siendó p la própórcióó n de persónas .que nó tienen teleó fónó):
De manera que la verósimilitud de este resultadó para cada pósible valór de p seraó :
0,01 0,02 0,03 0,04 0,05 y a partir de las próbabilidades a prióri y de las verósimilitudes pódremós calcular las próbabilidades a pósterióri, aplicandó el teórema de Bayes de la siguiente manera
para el segundó valór tendríóamós
Siendó , lós anterióres y el restó que fórman la distribucióó n a pósterióri de la próbabilidad de tener teleó fónó en casa , lós siguientes valóres
0,01
0,1100425
0,02
0,1814752
0,03
0,3360217
0,04
0,1839782
0,05
0,1884826
asíó la estimacióó n mejórada, tras la realizacióó n del prócesó bayesianó seraó la media de la distribucióó n a pósteriór
Una vez realizadó un prócesó Bayesianó la distribucióó n a pósterióri óbtenida puede cónsiderarse la infórmacióó n dispónible en ese mómentó y plantearse realizar ótró nuevó ensayó para mejórar de nuevó la estimacióó n nó abríóa maó s que cónsiderar la distribucióó n final óbtenida cómó distribucióó n a prióri del nuevó prócesó y repetir el planteamientó cón una nueva infórmacióó n muestral.