Guia Ceneval

  • May 2020
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Guia Ceneval as PDF for free.

More details

  • Words: 15,937
  • Pages: 47
Probabilidad La probabilidad mide la frecuencia con la que se obtiene un resultado (o conjunto de resultados) al llevar a cabo un experimento aleatorio, del que se conocen todos los resultados posibles, bajo condiciones suficientemente estables. La teoría de la probabilidad se usa extensamente en áreas como la estadística, la física, la matemática, la ciencia y la filosofía para sacar conclusiones sobre la probabilidad de sucesos potenciales y la mecánica subyacente de sistemas complejos.

Historia El estudio científico de la probabilidad es un desarrollo moderno. Los juegos de azar muestran que ha habido un interés en cuantificar las ideas de la probabilidad durante milenios, pero las descripciones matemáticas exactas de utilidad en estos problemas sólo surgieron mucho después. Según Richard Jeffrey, "Antes de la mitad del siglo XVII, el término 'probable' (en latín probable) significaba aprobable, y se aplicaba en ese sentido, unívocamente, a la opinión y a la acción. Una acción u opinión probable era una que las personas sensatas emprenderían o mantendrían, en las circunstancias."1 Aparte de algunas consideraciones elementales hechas por Girolamo Cardano en el siglo XVI, la doctrina de las probabilidades data de la correspondencia de Pierre de Fermat y Blaise Pascal (1654). Christiaan Huygens (1657) le dio el tratamiento científico conocido más temprano al concepto. Ars Conjectandi (póstumo, 1713) de Jakob Bernoulli y Doctrine of Chances (1718) de Abraham de Moivre trataron el tema como una rama de las matemáticas. Véase El surgimiento de la probabilidad (The Emergence of Probability) de Ian Hacking para una historia de los inicios del desarrollo del propio concepto de probabilidad matemática. La teoría de errores puede trazarse atrás en el tiempo hasta Opera Miscellanea (póstumo, 1722) de Roger Cotes, pero una memoria preparada por Thomas Simpson en 1755 (impresa en 1756) aplicó por primera vez la teoría para la discusión de errores de observación. La reimpresión (1757) de esta memoria expone los axiomas de que los errores positivos y negativos son igualmente probables, y que hay ciertos límites asignables dentro de los cuales se supone que caen todos los errores; se discuten los errores continuos y se da una curva de la probabilidad. Pierre-Simon Laplace (1774) hizo el primer intento para deducir una regla para la combinación de observaciones a partir de los principios de la teoría de las probabilidades. Representó la ley de la probabilidad de error con una curva y = φ(x), siendo x cualquier error e y su probabilidad, y expuso tres propiedades de esta curva: 1. es simétrica al eje y; 2. el eje x es una asíntota, siendo la probabilidad del error igual a 0; 3. la superficie cerrada es 1, haciendo cierta la existencia de un error. Dedujo una fórmula para la media de tres observaciones. También obtuvo (1781) una fórmula para la ley de facilidad de error (un término debido a Lagrange, 1774), pero una

que llevaba a ecuaciones inmanejables. Daniel Bernoulli (1778) introdujo el principio del máximo producto de las probabilidades de un sistema de errores concurrentes. El método de mínimos cuadrados se debe a Adrien-Marie Legendre (1805), que lo introdujo en su Nouvelles méthodes pour la détermination des orbites des comètes (Nuevos métodos para la determinación de las órbitas de los cometas). Ignorando la contribución de Legendre, un escritor irlandés estadounidense, Robert Adrain, editor de "The Analyst" (1808), dedujo por primera vez la ley de facilidad de error,

siendo c y h constantes que dependen de la precisión de la observación. Expuso dos demostraciones, siendo la segunda esencialmente la misma de John Herschel (1850). Gauss expuso la primera demostración que parece que se conoció en Europa (la tercera después de la de Adrain) en 1809. Demostraciones adicionales se expusieron por Laplace (1810, 1812), Gauss (1823), James Ivory (1825, 1826), Hagen (1837), Friedrich Bessel (1838), W. F. Donkin (1844, 1856) y Morgan Crofton (1870). Otros personajes que contribuyeron fueron Ellis (1844), De Morgan (1864), Glaisher (1872) y Giovanni Schiaparelli (1875). La fórmula de Peters (1856) para r, el error probable de una única observación, es bien conocida. En el siglo XIX, los autores de la teoría general incluían a Laplace, Sylvestre Lacroix (1816), Littrow (1833), Adolphe Quetelet (1853), Richard Dedekind (1860), Helmert (1872), Hermann Laurent (1873), Liagre, Didion, y Karl Pearson. Augustus De Morgan y George Boole mejoraron la exposición de la teoría. En 1930 Andréi Kolmogorov desarrolló la base axiomática de la probabilidad utilizando teoría de la medida. En la parte geométrica (véase geometría integral) los colaboradores de The Educational Times fueron influyentes (Miller, Crofton, McColl, Wolstenholme, Watson y Artemas Martin). Teoría La probabilidad constituye un importante parametro en la determinación de las diversas casualidades obtenidas tras una serie de eventos esperados dentro de un rango estadístico. Existen diversas formas como método abstracto, como la teoría Dempster-Shafer y la teoría de la relatividad numérica, esta última con un alto grado de aceptación si se toma en cuenta que disminuye considerablemente las posibilidades hasta un nivel mínimo ya que somete a todas las antiguas reglas a una simple ley de relatividad. Así mismo es la parte de ley

Aplicaciones Dos aplicaciones principales de la teoría de la probabilidad en el día a día son en el análisis de riesgo y en el comercio de los mercados de materias primas. Los gobiernos

normalmente aplican métodos probabilísticos en regulación ambiental donde se les llama "análisis de vías de dispersión", y a menudo miden el bienestar usando métodos que son estocásticos por naturaleza, y escogen qué proyectos emprender basándose en análisis estadísticos de su probable efecto en la población como un conjunto. No es correcto decir que la estadística está incluida en el propio modelado, ya que típicamente los análisis de riesgo son para una única vez y por lo tanto requieren más modelos de probabilidad fundamentales, por ej. "la probabilidad de otro 11-S". Una ley de números pequeños tiende a aplicarse a todas aquellas elecciones y percepciones del efecto de estas elecciones, lo que hace de las medidas probabilísticas un tema político. Un buen ejemplo es el efecto de la probabilidad percibida de cualquier conflicto generalizado sobre los precios del petróleo en Oriente Medio - que producen un efecto dominó en la economía en conjunto. Un cálculo por un mercado de materias primas en que la guerra es más probable en contra de menos probable probablemente envía los precios hacia arriba o hacia abajo e indica a otros comerciantes esa opinión. Por consiguiente, las probabilidades no se calculan independientemente y tampoco son necesariamente muy racionales. La teoría de las finanzas conductuales surgió para describir el efecto de este pensamiento de grupo en el precio, en la política, y en la paz y en los conflictos. Se puede decir razonablemente que el descubrimiento de métodos rigurosos para calcular y combinar los cálculos de probabilidad ha tenido un profundo efecto en la sociedad moderna. Por consiguiente, puede ser de alguna importancia para la mayoría de los ciudadanos entender cómo se cálculan los pronósticos y las probabilidades, y cómo contribuyen a la reputación y a las decisiones, especialmente en una democracia. Otra aplicación significativa de la teoría de la probabilidad en el día a día es en la fiabilidad. Muchos bienes de consumo, como los automóviles y la electrónica de consumo, utilizan la teoría de la fiabilidad en el diseño del producto para reducir la probabilidad de avería. La probabilidad de avería también está estrechamente relacionada con la garantía del producto. Se puede decir que no existe una cosa llamada probabilidad. También se puede decir que la probabilidad es la medida de nuestro grado de incertidumbre, o esto es, el grado de nuestra ignorancia dada una situación. Por consiguiente, puede haber una probabilidad de 1 entre 52 de que la primera carta en un baraja de cartas es la J de diamantes. Sin embargo, si uno mira la primera carta y la reemplaza, entonces la probabilidad es o bien 100% o 0%, y la elección correcta puede ser hecha con precisión por el que ve la carta. La física moderna proporciona ejemplos importantes de situaciones determinísticas donde sólo la descripción probabilística es factible debido a información incompleta y la complejidad de un sistema así como ejemplos de fenómenos realmente aleatorios. En un universo determinista, basado en los conceptos newtonianos, no hay probabilidad si se conocen todas las condiciones. En el caso de una ruleta, si la fuerza de la mano y el periodo de esta fuerza es conocido, entonces el número donde la bola parará será seguro. Naturalmente, esto también supone el conocimiento de la inercia y la fricción de la ruleta, el peso, lisura y redondez de la bola, las variaciones en la velocidad de la mano durante el movimiento y así sucesivamente. Una descripción probabilística puede entonces ser más práctica que la mecánica newtoniana para analizar el modelo de las

salidas de lanzamientos repetidos de la ruleta. Los físicos se encuentran con la misma situación en la teoría cinética de los gases, donde el sistema determinístico en principio, es tan complejo (con el número de moléculas típicamente del orden de magnitud de la constante de Avogadro ) que sólo la descripción estadística de sus propiedades es viable. La mecánica cuántica, debido al principio de indeterminación de Heisenberg, sólo puede ser descrita actualmente a través de distribuciones de probabilidad, lo que le da una gran importancia a las descripciones probabilísticas. Algunos científicos hablan de la expulsión del paraíso.[cita requerida] Otros no se conforman con la pérdida del determinismo. Albert Einstein comentó estupendamente en una carta a Max Born: Jedenfalls bin ich überzeugt, daß der Alte nicht würfelt. (Estoy convencido de que Dios no tira el dado). No obstante hoy en día no existe un medio mejor para describir la física cuántica si no es a través de la teoría de la probabilidad. Mucha gente hoy en día confunde el hecho de que la mecánica cuántica se describe a través de distribuciones de probabilidad con la suposición de que es por ello un proceso aleatorio, cuando la mecánica cuántica es probabilística no por el hecho de que siga procesos aleatorios sino por el hecho de no poder determinar con precisión sus parámetros fundamentales, lo que imposibilita la creación de un sistema de ecuaciones determinista.

Población y muestra 

Población es el conjunto de todos los elementos que son objeto del estudio estadístico.



Muestra es un subconjunto, extraído de la población (mediante técnicas de muestreo), cuyo estudio sirve para inferir características de toda la población.



Individuo es cada uno de los elementos que forman la población o la muestra.

Muestreo Muestreo es la técnica utilizada en la selección de una muestra a partir de una población. Distinguimos dos tipos fundamentales de muestreo:



Muestreo no probabilístico: En este tipo de muestreo, puede haber clara influencia de la persona o personas que seleccionan la muestra o simplemente se realiza atendiendo a razones de comodidad. Salvo en situaciones muy concretas, en la que los errores cometidos no son grandes, debido a la homogeneidad de la población, en general no es un tipo de muestreo riguroso y científico, dado que no todos los elementos de la población pueden formar parte de la muestra. Por ejemplo, si hacemos una encuesta telefónica por la mañana, las personas que no tienen teléfono o que están trabajando, no podrán formar parte de la muestra.



Muestreo probabilístico: En este tipo de muestreo, todos los individuos de la población pueden formar parte de la muestra, tienen probabilidad positiva de formar parte de la muestra. Por lo tanto es el tipo de muestreo que deberemos utilizar en nuestras investigaciones, por ser el riguroso y científico.

Muestreo Probabilístico En el contexto de muestreo probabilístico, existen varias posibilidades de obtención de una muestra: 

Muestreo aleatorio simple



Muestreo aleatorio estratificado.



Muestreo aleatorio simple En un muestreo aleatorio simple todos los individuos tienen la misma probabilidad de ser seleccionados. La selección de la muestra puede realizarse a través de cualquier mecanismo probabilístico en el que todos los elementos tengan las mismas opciones de salir. Por ejemplo uno de estos mecanismos es utilizar una tabla de números aleatorios, o también con un ordenador generar números aleatorios, comprendidos entre cero y uno, y multiplicarlos por el tamaño de la población. Este es el que vamos a utilizar.

Muestreo aleatorio estratificado Es frecuente que cuando se realiza un estudio interese estudiar una serie de subpoblaciones (estratos) en la población, siendo importante que en la muestra haya representación de todos y cada uno de los estratos considerados. El muestreo aleatorio simple no nos garantiza que tal cosa ocurra. Para evitar esto, se saca una muestra de cada uno de los estratos. Hay dos conceptos básicos: 

Estratificación: El criterio a seguir en la formación de los estratos será formarlos de tal manera que haya la máxima homogeneidad en relación a la variable a estudio dentro de cada estrato y la máxima heterogeneidad entre los estratos.



Afijación: Reparto del tamaño de la muestra en los diferentes estratos o subpoblaciones. Existen varios criterios de afijación entre los que destacamos: 1. Afijación igual: Todos los estratos tienen el mismo número de elementos en la muestra. 2. Afijación proporcional: Cada estrato tiene un número de elementos en la muestra proporcional a su tamaño.

Muestreo en estadística En estadística se conoce como muestreo a la técnica para la selección de una muestra a partir de una población. Al elegir una muestra se espera que sus propiedades sean extrapolables a la población. Este proceso permite ahorrar recursos, obteniendo resultados parecidos que si se realizase un estudio de toda la población. Cabe mencionar que para que el muestreo sea válido y se pueda realizar un estudio fiable (que represente a la población), debe cumplir ciertos requisitos, lo que lo convertiría en una muestra representativa.

En el muestreo, si el tamaño de la muestra es más pequeño que el tamaño de la población, se puede extraer dos o más muestras de la misma población. Al conjunto de muestras que se pueden obtener de la población se denomina espacio muestral. La variable que asocia a cada muestra su probabilidad de extracción, sigue la llamada distribución muestral.

Técnicas de muestreo Existen dos métodos para seleccionar muestras de poblaciones: el muestreo no aleatorio o de juicio y el muestreo aleatorio o de probabilidad. En este último todos los elementos de la población tienen la oportunidad de ser escogidos en la muestra. Una muestra seleccionada por muestreo de juicio se basa en la experiencia de alguien con la población. Algunas veces una muestra de juicio se usa como guía o muestra tentativa para decidir como tomar una muestra aleatoria más adelante. Las muestras de juicio contribuyen con el análisis estadístico el cual es necesario para hacer muestras de probabilidad.

Muestreo probabilístico Forman parte de este tipo de muestreo todos aquellos métodos para los que puede calcularse la probabilidad de extracción de cualquiera de las muestras posibles. Este conjunto de técnicas de muestreo es el más aconsejable, aunque en ocasiones no es posible optar por él. En este caso se habla de muestras probabilísticas, pues no es razonable hablar de muestras representativas dado que no conocemos las características de la población.

Muestreo aleatorio simple Es la extracción de una muestra de una población finita, en el que el proceso de extracción es tal que garantiza a cada uno de los elementos de la población tiene la misma oportunidad de ser incluidos en dicha muestra. Esta condición garantiza la representatividad de la muestra porque si en la población un determinado porcentaje de individuos presenta la característica A, la extracción aleatoria garantiza matemáticamente que por término medio se obtendrá el mismo porcentaje de datos muestrales con esa característica. El muestreo aleatorio simple puede ser de tres tipos: Sin reposición de los elementos: cada elemento extraído se descarta para la subsiguiente extracción. Por ejemplo, si se extrae una muestra de una "población" de bombillas para estimar la vida media de las bombillas que la integran, no será posible medir más que una vez la bombilla seleccionada. Con reposición de los elementos: las observaciones se realizan con reemplazamiento de los individuos, de forma que la población es idéntica en todas las extracciones. En poblaciones muy grandes, la probabilidad de repetir una extracción es tan pequeña que el muestreo puede considerarse sin reposición aunque, realmente, no lo sea.

con reposicion multiple: En poblaciones muy grandes, la probabilidad de repetir una extracción es tan pequeña que el muestreo puede considerarse sin reposición. Cada elemento extraído se descarta para la subsiguiente extracción. Para realizar este tipo de muestreo, y en determinadas situaciones, es muy útil la extracción de números aleatorios mediante ordenadores, calculadoras o tablas construidas al efecto. tambien muestreo es donde se recopilan datos por medio de un metodo cientifico como lo puede mencionar la dr.l.espinal de inglaterra como por ejemplo el numero de datos de un salon

Muestreo estratificado Consiste en la división previa de la población de estudio en grupos o clases que se suponen homogéneos con respecto a característica a estudiar. A cada uno de estos estratos se le asignaría una cuota que determinaría el número de miembros del mismo que compondrán la muestra. Dentro de cada estrato se suele usar la técnica de muestreo sistemático, ya que con aquella suelen ser las técnicas más usadas en la practica. Según la cantidad de elementos de la muestra que se han de elegir de cada uno de los estratos, existen dos técnicas de muestreo estratificado: •

Asignación proporcional: el tamaño de cada estrato en la muestra es proporcional a su tamaño en la población.



Asignación óptima: la muestra recogerá más individuos de aquellos estratos que tengan más variabilidad. Para ello es necesario un conocimiento previo de la población.

Por ejemplo, para un estudio de opinión, puede resultar interesante estudiar por separado las opiniones de hombres y mujeres pues se estima que, dentro de cada uno de estos grupos, puede haber cierta homogeneidad. Así, si la población está compuesta de un 55% de mujeres y un 45% de hombres, se tomaría una muestra que contenga también esa misma proporción. Para una descripción general del muestreo estratificado y los métodos de inferencia asociados con este procedimiento, suponemos que la población está dividida en h subpoblaciones o estratos de tamaños conocidos N1, N2,...,Nh tal que las unidades en cada estrato sean homogéneas respecto a la característica en cuestión. La media y la varianza desconocidas para el i-ésimo estrato son denotadas por mi y s12, respectivamente.

Muestreo sistemático Se utiliza cuando el universo o población es de gran tamaño, o ha de extenderse en el tiempo. Primero hay que identificar las unidades y relacionarlas con el calendario (cuando proceda). Luego hay que calcular una constante, que se denomina coeficiente de elevación K= N/n; donde N es el tamaño del universo y n el tamaño de la muestra. Determinar en qué fecha se producirá la primera extracción, para ello hay que elegir al

azar un número entre 1 y K; de ahí en adelante tomar uno de cada K a intervalos regulares. Ocasionalmente, es conveniente tener en cuenta la periodicidad del fenómeno. Esto quiere decir que si tenemos un determinado número de personas que es la población y queremos escoger de esa población un númeno más pequeño el cual es la muestra, dividimos el número de la población por el número de la muestra que queremos tomar y el resultado de esta operación será el intervalo, entonces escogemos un número al azar desde uno hasta el número del intervalo, y a partir de este número escogemos los demás siguiendo el orden del intervalo.

Muestreo por estadios múltiples Esta técnica es la única opción cuando no se dispone de lista completa de la población de referencia o bien cuando por medio de la técnica de muestreo simple o estratificado se obtiene una muestra con unidades distribuidas de tal forma que resultan de difícil acceso. En el muestreo a estadios múltiples se subdivide la población en varios niveles ordenados que se extraen sucesivamente por medio de un procedimiento de embudo. El muestreo se desarrolla en varias fases o extracciones sucesivas para cada nivel. Por ejemplo, si tenemos que construir una muestra de profesores de primaria en un país determinado, éstos pueden subdividirse en unidades primarias representadas por circunscripciones didácticas y unidades secundarias que serían los propios profesores. En primer lugar extraemos una muestra de las unidades primarias (para lo cual debemos tener la lista completa de estas unidades) y en segundo lugar extraemos aleatoriamente una muestra de unidades secundarias de cada una de las primarias seleccionadas en la primera extracción.

Muestreo por conglomerados Técnica similar al muestreo por estadios múltiples, se utiliza cuando la población se encuentra dividida, de manera natural, en grupos que se supone que contienen toda la variabilidad de la población, es decir, la representan fielmente respecto a la característica a elegir, pueden seleccionarse sólo algunos de estos grupos o conglomerados para la realización del estudio. Dentro de los grupos seleccionados se ubicarán las unidades elementales, por ejemplo, las personas a encuestar, y podría aplicársele el instrumento de medición a todas las unidades, es decir, los miembros del grupo, o sólo se le podría aplicar a algunos de ellos, seleccionados al azar. Este método tiene la ventaja de simplificar la recogida de información muestral. Cuando, dentro de cada conglomerado, se extraen los individuos que formarán parte de la muestra por m.a.s., el muestreo se llama bietápico. Las ideas de estratificación y conglomerados son opuestas. El primer método funciona mejor cuanto más homogénea es la población respecto del estrato, aunque más diferentes son éstos entre sí. En el segundo, ocurre lo contrario. Los conglomerados deben presentar toda la variabilidad, aunque deben ser muy parecidos entre sí.

Homogeneidad de las poblaciones o sus subgrupos Homogéneo siginifica, en el contexto de la estratificación, que no hay mucha variabilidad. Los estratos funcionan mejor cuanto más homogéneos son cada uno de ellos respecto a la característica a medir. Por ejemplo, si se estudia la estatura de una población, es bueno distinguir entre los estratos mujeres y hombres porque se espera que, dentro de ellos, haya menos variabilidad, es decir, sean menos heterogéneos. Dicho de otro modo, no hay tantas diferencias entre unas estaturas y otras dentro del estrato que en la población total. Por el contrario, la heterogeneidad hace inútil la división en estratos. Si se dan las mismas diferencias dentro del estrato que en toda la población, no hay por qué usar este método de muestreo. En los casos en los que existan grupos que contengan toda la variabilidad de la población, lo que se construyen son conglomerados, que ahorran algo del trabajo que supondría analizar toda la población. En resumen, los estratos y los conglomerados funcionan bajo principios opuestos: los primeros son mejores cuanto más homogéneo es el grupo respecto a la característica a estudiar y los conglomerados, si representan fielmente a la población, esto es, contienen toda su viariabilidad, o sea, son heterogéneos.

Muestreo juicio Aquél para el que no puede calcularse la probabilidad de extracción de una determinada muestra.Se busca seleccionar a individuos que se juzga de antemano tienen un conocimiento profundo del tema bajo estudio, por lo tanto, se considera que la información aportada por esas personas es vital para la toma de decisiones.

Muestreo por cuotas Es la técnica más difundida sobre todo en estudios de mercado y sondeos de opinión. En primer lugar es necesario dividir la población de referencia en varios estratos definidos por algunas variables de distribución conocida (como el género o la edad). Posteriormente se calcula el peso proporcional de cada estrato, es decir, la parte proporcional de población que representan. Finalmente se multiplica cada peso por el tamaño de n de la muestra para determinar la cuota precisa en cada estrato. Se diferencia del muestreo estratificado en que una vez determinada la cuota, el investigador es libre de elegir a los sujetos de la muestra dentro de cada estrato.

Muestreo de Clandestinidad Indicado para estudios de poblaciones clandestinas, minoritarias o muy dispersas pero en contacto entre sí. Consiste en identificar sujetos que se incluirán en la muestra a partir de los propios entrevistados. Partiendo de una pequeña cantidad de individuos que cumplen los requisitos necesarios estos sirven como localizadores de otros con características análogas.

Muestreo subjetivo por decisión razonada En este caso las unidades de la muestra se eligen en función de algunas de sus características de manera racional y no casual. Una variante de esta técnica es el muestreo compensado o equilibrado, en el que se seleccionan las unidades de tal forma que la media de la muestra para determinadas variables se acerque a la media de la población. Estadística CONCEPTOS: Población: Es todo conjunto de elementos, finito o infinito, definido por una o más características, de las que gozan todos los elementos que lo componen, y sólo ellos. En muestreo se entiende por población a la totalidad del universo que interesa considerar, y que es necesario que esté bien definido para que se sepa en todo momento que elementos lo componen. No obstante, cuando se realiza un trabajo puntual, conviene distinguir entre población teórica: conjunto de elementos a los cuales se quieren extrapolar los resultados, y población estudiada: conjunto de elementos accesibles en nuestro estudio. Censo: En ocasiones resulta posible estudiar cada uno de los elementos que componen la población, realizándose lo que se denomina un censo, es decir, el estudio de todos los elementos que componen la población. La realización de un censo no siempre es posible, por diferentes motivos: a) economía: el estudio de todos los elementos que componen una población, sobre todo si esta es grande, suele ser un problema costoso en tiempo, dinero, etc.; b) que las pruebas a las que hay que someter a los sujetos sean destructivas; c) que la población sea infinita o tan grande que exceda las posibilidades del investigador. Si la numeración de elementos, se realiza sobre la población accesible o estudiada, y no sobre la población teórica, entonces el proceso recibe el nombre de marco o espacio muestral. Concepto de muestreo El muestreo es una herramienta de la investigación científica. Su función básica es determinar que parte de una realidad en estudio (población o universo) debe examinarse con la finalidad de hacer inferencias sobre dicha población. El error que se comete debido a hecho de que se obtienen conclusiones sobre cierta realidad a partir de la observación de sólo una parte de ella, se denomina error de muestreo. Obtener una muestra adecuada significa lograr una versión simplificada de la población, que reproduzca de algún modo sus rasgos básicos. Muestra: En todas las ocasiones en que no es posible o conveniente realizar un censo, lo que hacemos es trabajar con una muestra, entendiendo por tal una parte representativa de la población. Para que una muestra sea representativa, y por lo tanto útil, debe de reflejar las similitudes y diferencias encontradas en la población, ejemplificar las características de la misma. Cuando decimos que una muestra es representativa indicamos que reúne aproximadamente las características de la población que son importantes para la investigación. a. Población Los estadísticos usan la palabra población para referirse no sólo a personas si no a todos los elementos que han sido escogidos para su estudio. b. Muestra Los estadísticos emplean la palabra muestra para describir una porción escogida de la población. Matemáticamente, podemos describir muestras y poblaciones al emplear mediciones como la Media, Mediana, la moda, la desviación estándar. Cuando éstos términos describen una muestra se denominan estadísticas. -1-

Una estadística es una característica de una muestra, los estadísticos emplean letras latinas minúsculas para denotar estadísticas y muestras. 2. - Tipos de muestreo Los autores proponen diferentes criterios de clasificación de los diferentes tipos de muestreo, aunque en general pueden dividirse en dos grandes grupos: métodos de muestreo probabilísticos y métodos de muestreo no probabilísticos. Terminología

• •

Población objeto: conjunto de individuos de los que se quiere obtener una información. Unidades de muestreo: número de elementos de la población, no solapados, que se van a estudiar. Todo miembro de la población pertenecerá a una y sólo una unidad de muestreo.



Unidades de análisis: objeto o individuo del que hay que obtener la información.



Marco muestral: lista de unidades o elementos de muestreo.



Muestra: conjunto de unidades o elementos de análisis sacados del marco.

Muestreo probabilístico Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamaño n tienen la misma probabilidad de ser elegidas. Sólo estos métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra extraída y son, por tanto, los más recomendables. Dentro de los métodos de muestreo probabilísticos encontramos los siguientes tipos: El método otorga una probabilidad conocida de integrar la muestra a cada elemento de la población, y dicha probabilidad no es nula para ningún elemento. Los métodos de muestreo no probabilisticos no garantizan la representatividad de la muestra y por lo tanto no permiten realizar estimaciones inferenciales sobre la población. (En algunas circunstancias los métodos estadísticos y epidemiológicos permiten resolver los problemas de representatividad aun en situaciones de muestreo no probabilistico, por ejemplo los estudios de casocontrol, donde los casos no son seleccionados aleatoriamente de la población.) Entre los métodos de muestreo probabilísticos más utilizados en investigación encontramos:



Muestreo aleatorio simple



Muestreo estratificado



Muestreo sistemático



Muestreo polietápico o por conglomerados -2-

Muestreo aleatorio simple: El procedimiento empleado es el siguiente: 1) se asigna un número a cada individuo de la población y 2) a través de algún medio mecánico (bolas dentro de una bolsa, tablas de números aleatorios, números aleatorios generados con una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario para completar el tamaño de muestra requerido.

Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la población que estamos manejando es muy grande. Muestreo aleatorio sistemático: Este procedimiento exige, como el anterior, numerar todos los elementos de la población, pero en lugar de extraer n números aleatorios sólo se extrae uno. Se parte de ese número aleatorio i, que es un número elegido al azar, y los elementos que integran la muestra son los que ocupa los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el resultado de dividir el tamaño de la población entre el tamaño de la muestra: k= N/n. El número i que empleamos como punto de partida será un número al azar entre 1 y k. El riesgo este tipo de muestreo está en los casos en que se dan periodicidades en la población ya que al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una homogeneidad que no se da en la población. Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son varones y los 5 últimos mujeres, si empleamos un muestreo aleatorio sistemático con k=10 siempre seleccionaríamos o sólo hombres o sólo mujeres, no podría haber una representación de los dos sexos. Muestreo aleatorio estratificado: Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y suelen reducir el error muestral para un tamaño dado de la muestra. Consiste en considerar categorías típicas diferentes entre sí (estratos) que poseen gran homogeneidad respecto a alguna característica (se puede estratificar, por ejemplo, según la profesión, el municipio de residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de interés estarán representados adecuadamente en la muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarán parte de la muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado de la población. (Tamaño geográfico, sexos, edades,...). La distribución de la muestra en función de los diferentes estratos se denomina afijación, y puede ser de diferentes tipos: Afijación Simple: A cada estrato le corresponde igual número de elementos muéstrales. Afijación Proporcional: La distribución se hace de acuerdo con el peso (tamaño) de la población en cada estrato. Afijación Optima: Se tiene en cuenta la previsible dispersión de los resultados, de modo que se considera la proporción y la desviación típica. Tiene poca aplicación ya que no se suele conocer la desviación. -3Muestreo aleatorio por conglomerados: Los métodos presentados hasta ahora están pensados para seleccionar directamente los elementos de la población, es decir, que las unidades muéstrales son los elementos de la población. En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la población que forman una unidad, a la que llamamos conglomerado. Las unidades hospitalarias, los departamentos universitarios, una caja de determinado producto, etc., son conglomerados naturales. En otras ocasiones se pueden utilizar conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los conglomerados son áreas geográficas suele hablarse de "muestreo por áreas". El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de conglomerados (el necesario para alcanzar el tamaño muestral establecido) y en investigar después todos los elementos pertenecientes a los conglomerados elegidos. -4-

Métodos de muestreo no probabilísticos A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso y se acude a métodos no probabilísticos, aun siendo conscientes de que no sirven para realizar generalizaciones, pues no se tiene certeza de que la muestra extraída sea representativa, ya que no todos los sujetos de la población tienen la misma probabilidad de se elegidos. En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea representativa. · Muestreos No Probabilísticos:

• •

de Conveniencia de Juicios



por Cuotas



de Bola de Nieve



Discrecional

Muestreo por cuotas: También denominado en ocasiones "accidental". Se asienta generalmente sobre la base de un buen conocimiento de los estratos de la población y/o de los individuos más "representativos" o "adecuados" para los fines de la investigación. Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene el carácter de aleatoriedad de aquél. En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de individuos que reúnen unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y residentes en Gijón. Una vez determinada la cuota se eligen los primeros que se encuentren que cumplan esas características. Este método se utiliza mucho en las encuestas de opinión. Muestreo opinático o intencional: Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas" mediante la inclusión en la muestra de grupos supuestamente típicos. Es muy frecuente su utilización en sondeos preelectorales de zonas que en anteriores votaciones han marcado tendencias de voto. Muestreo casual o incidental: Se trata de un proceso en el que el investigador selecciona directa e intencionadamente los individuos de la población. El caso más frecuente de este procedimiento el utilizar como muestra los individuos a los que se tiene fácil acceso (los profesores de universidad emplean con mucha frecuencia a sus propios alumnos). Bola de nieve: Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos, etc. -5Muestreo Discrecional · A criterio del investigador los elementos son elegidos sobre lo que él cree que pueden aportar al estudio. · Ej. : muestreo por juicios; cajeros de un banco o un supermercado; etc. Ventajas e inconvenientes de los distintos tipos de muestreo probabilístico

CARACTERISTICAS

VENTAJAS



Se selecciona una muestra de tamaño n de una población de N unidades, cada elemento Aleatorio simple tiene una probabilidad de inclusión igual y conocida de n/N.

Sencillo y de fácil comprensión.

Requiere que se posea de antemano un listado • Cálculo rápido de completo de toda la medias y varianzas. población. Cuando se trabaja con muestras • Se basa en la teoría pequeñas es posible que no represente a la estadística, y por población tanto existen adecuadamente. paquetes informáticos para analizar los datos



Conseguir un listado de los N elementos de la población

Fácil de aplicar.



No siempre es necesario tener un listado de toda la población.

Determinar tamaño muestral n.

Si la constante de muestreo está asociada con el fenómeno de interés, las estimaciones Cuando la población obtenidas a partir de la está ordenada muestra pueden contener siguiendo una sesgo de selección tendencia conocida, asegura una cobertura de unidades de todos los tipos.

Definir un intervalo k= N/n. Sistemático Elegir un número aleatorio, r, entre 1 y k (r= arranque aleatorio).



Seleccionar los elementos de la lista.



Estratificado

Conglomerados

En ciertas ocasiones resultará conveniente estratificar la muestra según ciertas variables de interés. Para ello debemos conocer la composición estratificada de la población objetivo a hacer un muestreo. Una vez calculado el tamaño muestral apropiado, este se reparte de manera proporcional entre los distintos estratos definidos en la población usando una simple regla de tres.

Tiende a asegurar que la muestra represente adecuadamente a la población en función de unas variables seleccionadas.







Se realizan varias fases de muestreo sucesivas (polietápico) La necesidad de listados de las unidades de una etapa se limita a aquellas unidades de muestreo seleccionadas en la etapa anterior.

INCONVENIENTES





Se ha de conocer la distribución en la población de las variables utilizadas para la estratificación.

Se obtienen estimaciones más precisa

Su objetivo es conseguir una muestra lo más semejante posible a la población en lo que a la o las variables estratificadoras se refiere. Es muy eficiente cuando la población es muy grande y dispersa. No es preciso tener un listado de toda la población, sólo de



El error estándar es mayor que en el muestreo aleatorio simple o estratificado.



El cálculo del error estándar es

las unidades primarias de muestreo.

complejo.

-7encuesta: Método de obtener datos de una población o muestra, sin ejercer control alguno sobre los factores que pueden afectar las características de interés o resultados de la encuesta. encuesta por muestreo Es una encuesta en la que participa sólo una porción de la población

Variable es una característica (magnitud, vector o número) que puede ser medida, adoptando diferentes valores en cada uno de los casos de un estudio.

Clasificación de las variables En un estudio científico, podemos clasificar las variables según la escala de medición o la influencia que asignemos a unas variables sobre otras y por esta razón, se pueden clasificar como sigue: •

Según su escala de medición: o Variables cualitativas: Son las variables que expresan distintas cualidades, características o modalidad. Cada modalidad que se presenta se denomina atributo o categoría y la medición consiste en una clasificación de dichos atributos. Las variables cualitativas pueden ser ordinales y nominales. Las variables cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos valores posibles como sí y no, hombre y mujer o son politómicas cuando pueden adquirir tres o más valores. Dentro de ellas podemos distinguir: 1. Variable cualitativa ordinal: La variable puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo, leve, moderado, grave 2. Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio de orden como por ejemplo los colores o el lugar de residencia. o Variables cuantitativas: Son las variables que se expresan mediante cantidades numéricas. Las variables cuantitativas además pueden ser: 1. Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los distintos valores específicos que la variable pueda asumir. Ejemplo: El número de hijos (1, 2, 3, 4, 5). 2. Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo especificado de valores. Por ejemplo el peso (2.3 kg, 2.4 kg, 2.5 kg...) o la altura (1.64 m, 1.65 m, 1.66



m...), que solamente está limitado por la precisión del aparato medidor, en teoría permiten que siempre exista un valor entre dos cualesquiera. Según la influencia que asignemos a unas variables sobre otras, podrán ser: o Variables independientes: Son las que el investigador escoge para establecer agrupaciones en el estudio, clasificando intrínsecamente a los casos del mismo. Un tipo especial son las variables de , que modifican al resto de las variables independientes y que de no tenerse en cuenta adecuadamente pueden alterar los resultados por medio de un sesgo. o Variables dependientes: Son las variables de respuesta que se observan en el estudio y que podrían estar influenciadas por los valores de las variables independientes.

Variable Independiente: es aquella característica o propiedad que se supone ser la causa del fenómeno estudiado. En investigación experimental se llama así, a la variable que el investigador manipula. Variable Dependiente: Hayman (1974 : 69) la define como propiedad o característica que se trata de cambiar mediante la manipulación de la variable independiente. La variable dependiente es el factor que es observado y medido para determinar el efecto de la variable independiente. Variable Interviniente: Son aquellas características o propiedades que de una manera u otra afectan el resultado que se espera y están vinculadas con las variables independientes y dependientes. Variable Moderadora: Según Tuckman: representan un tipo especial de variable independiente, que es secundaria, y se selecciona con la finalidad de determinar si afecta la relación entre la variable independiente primaria y las variables dependientes.

Toda situación o experimento se puede clasificar en: a) Aquellos en los cuales en igualdad de condiciones ocurren siempre de la misma manera, se conocen como: Experimento Deterministico

b) Aquellos donde el resultado no siempre ocurre de la misma manera se conocen como: Experimentos Aleatorios Ejemplos: 1. 2. 3. 4. 5. 6. 7. 8.

Lanzar un dado Encender una vela Marcar el 82-10-55 Lanzar una moneda Lanzar una nuez a una ardilla Presentar un examen Tomar un taxi a la Universidad Pintarse las uñas

ALEATORIO DETERMINISTICO DETERMINISTICO ALEATORIO ALEATORIO ALEATORIO DETERMINISTICO DETERMINISTICO

Según el grado de conocimiento que tengamos sobre los posibles resultados de un experimento podemos clasificarlo como determinista, aleatorio o casual. El resultado de un experimento casual no está sujeto a ninguna regla, el de un experimento determinista está predeterminado antes de su realización. En cambio, en un experimento aleatorio, antes de su realización, conocemos de antemano todos sus posibles resultados, pero no el resultado concreto que vamos a obtener, aunque se observan regularidades al repetir varias veces el experimento. El conjunto de todos los resultados posibles de un experimento aleatorio recibe el nombre de espacio muestral y normalmente se representa por ejemplo, si

. Por

lanzamos dos veces un dado nuestro espacio muestral tiene 36 elementos y coincide con

.

Cualquier subconjunto del espacio muestral recibe el nombre de suceso. Los sucesos elementales son aquéllos que sólo tienen un elemento. El espacio muestral, , recibe el nombre de suceso seguro y el conjunto imposible. En el experimento anterior, podríamos considerar, por ejemplo, el suceso:

el de suceso

Utiliza los distintos botones de la animación para obtener distintos sucesos asociados al experimento consistente en extraer una ficha de un dominó.

Experimento. Es un fenómeno observable perfectamente definido. Los fenómenos observables se pueden clasificar en:

• •

Deterministicos. Se puede predecir el resultado. Aleatorios. No se puede predecir el resultado.

Espacio Muestral (Resultados). Es el conjunto de todos los posibles resultados que hay en un fenómeno aleatorio. El espacio muestral se clasifica en: Espacio muestral Discreto. Es aquel donde se puede contar el número de posibles resultados. Espacio muestral Continuo. No se puede enumerar los posibles resultados, debido a que, el espacio muestral continuo esta definido sobre la recta de los números reales. Evento. Es un conjunto de resultados que tiene cierta característica común. Los eventos pueden ser: Evento seguro. Es aquel que tiene todos los posibles resultados. Evento imposible. Es aquel que no tiene un posible resultado. Evento complementario. Es aquel evento que esta compuesto por los eventos que no están en este evento. Eventos mutuamente excluyentes. Para que un evento sea mutuamente excluyente debe cumplirse que A"B=Ø. Evento colectivamente exhaustivo. Un conjuntos de eventos E1, E2,...En son colectivamente exhaustivos cuando E1U E2.... UEn= S, donde S es el espacio muestral.

Probabilidad de eventos simples (páginas 374–377) NOMBRE ______________________________________ FECHA ____________ PERÍODO ____ Guía de estudio para padres y alumnos © Glencoe/McGraw-Hill 66 Matemáticas: Aplicaciones y conceptos, Curso 3

Una lista de todos los resultados posibles se llama espacio muestral. La probabilidad te permite medir la factibilidad de un evento.

P(evento) _ Probabilidad • Cuando es imposible de que ocurra un evento, su probabilidad es 0. • Cuando se está seguro de que ocurrirá un evento, su probabilidad es 1.

Una bolsa contiene 4 canicas rojas y 3 azules. Si se saca una canica de la bolsa al azar, ¿cuál es P(azul)? P(azul) es la probabilidad de sacar una canica azul. Hay 3 maneras de sacar una canica azul. Hay 4 _ 3 ó 7 resultados posibles. P(azul) _ ó como un decimal, 0.4_2_8_5_7_1_

Prueben esto juntos 1. ¿Cuál es la probabilidad de que se tire un 2. ¿Cuál es la probabilidad de que se cubo numerado y el resultado sea 3 ó 4? lance una piedra y caiga en el primer AYUDA: Encuentren el número de los resultados cuadro de un tablero de 8 cuadros? de 3 ó 4 y dividan ese número entre el número AYUDA: Hay 8 resultados posibles. total de los resultados posibles.

Enuncia la probabilidad de cada resultado en forma de fracción y decimal. 3. Se escoge aleatoriamente una persona vestida de rojo de un grupo de 5 personas que visten de rojo y 4 personas que visten de azul. 4. Se escoge una pelota de tenis verde de una bolsa que contiene 4 pelotas verdes, 7 amarillas y 5 blancas. 5. Un mes escogido al azar comienza con la letra A. 6. Un número de un dígito positivo elegido al azar es par. Estos números se han escrito separadamente en tarjetas y los han puesto juntos en un sombrero: 1, 2, 2, 3, 4, 5, 5, 5, 6, 6, 7, 8, 9, 10. Una persona saca un número al azar sin mirar dentro del sombrero. Calcula la probabilidad de cada resultado. 7. P(1) 8. P(3 ó 10) 9. P(no 5) 10. P(6) 11. Prueba estandarizada de práctica En una baraja de 52 naipes, hay 13 naipes de

cada grupo: corazones, diamantes, espadas y clubes. ¿Cuál es la probabilidad de que el primer naipe que se baraje sea una espada? A 0.13 B 0.25 C 0.50 D 0.35 3_7 número de resultados favorables ____ número de resultados posibles Respuestas: 1. ; 0.3_ 2. ; 0.125 3. ; 0.5_ 4. ; 0.25 5. ; 0.16_ 6. ; 0.4_ 7. 8. 9. 10. 11. B 1 _7 11 _14 1_7 1_ 14 4_9 1_6 1_4 5_9 1_8 1_3 7. 8. 4. 5. A C 6. C AC A B B B B 3.

Cuenta resultados

(páginas 380–383)

NOMBRE ______________________________________ FECHA ____________ PERÍODO ____ Guía de estudio para padres y alumnos © Glencoe/McGraw-Hill 67 Matemáticas: Aplicaciones y conceptos, Curso 3

Un modo de calcular el número posible de resultados es a través de un diagrama de árbol. También puedes calcular el número total de resultados al multiplicar usando el principio de contar. Principio Si un evento M puede ocurrir de m maneras y lo sigue un evento N que puede de contar ocurrir de n maneras, entonces el evento M seguido del evento N puede ocurrir de m _ n maneras.

La Donna va a adoptar un perrito del centro de refugio de animales. El centro de refugio de animales agrupa a sus perros según su género (macho o hembra) y según su tamaño (pequeño, mediano o grande). Usa un diagrama de árbol y el principio de contar para calcular el número de selecciones o posibles resultados que tiene La Donna. Usa un diagrama de árbol. Usa el principio de contar. selecciones selecciones _ resultados de género _ de tamaño 2_3_6 Hay 6 posibles resultados.

Prueben esto juntos 1. Un restaurante ofrece tres ensaladas diferentes y seis tipos de aderezos de ensalada. ¿Cuántas selecciones de ensalada con aderezos hay? AYUDA: Multipliquen.

Usa un diagrama de árbol o el principio de contar para calcular el número de posibles resultados.

2. Colin puede escoger de entre una camiseta negra, café o azul y unos pantalones negros, azules o grises. 3. Reiko escoge semillas de millo, avena, abrojo o girasol para sus comederos de gorriones, pinzones o palomas. 4. Un restaurante ofrece huevos cocidos de tres diferentes maneras con una selección de papas fritas o croquetas. 5. Prueba estandarizada de práctica Olga tiene las opciones de cinco bolígrafos de colores para caligrafía y papel simple, de hilo o pergamino. ¿Cuántas selecciones posibles de bolígrafos y papel tiene? A 15 B 8 C 10 D 12 hembra pequeña hembra mediana hembra grande macho pequeño macho mediano macho grande pequeño mediano grande pequeño mediano grande hembra macho Género Tamaño Resultado Respuestas: 1. 18 2. 9 3. 12 4. 6 5. A 7. 8. 4. 5. A C 6. C AC A B B B B 3.

Permutaciones

(páginas 384–387)

NOMBRE ______________________________________ FECHA ____________ PERÍODO ____ Guía de estudio para padres y alumnos © Glencoe/McGraw-Hill 68 Matemáticas: Aplicaciones y conceptos, Curso 3

Un arreglo o listado cuyo orden es importante se llama permutación.

Usa P(n, r ) para representar una permutación. P(n, r ) significa el número Representa de permutaciones de n cosas tomadas r a la vez. permutaciones P(n, r) _ n _ (n _ 1) _ (n _ 2) _ … _ (n _ r _ 1) Por ejemplo, P(8, 3) _ 8 _ 7 _ 6 ó 336.

La notación n! (n factorial) significa el producto de todos los números empezando con n y contando al revés hasta 1. Por ejemplo, 4! _ 4 _ 3 _ 2 _ 1, ó 24. Se define 0! como 1. Hay 5 corredores en una carrera de 400 metros. Al primer, segundo y tercer lugar se le premiará con una cinta. ¿De cuántas maneras posibles se puede premiar con las cintas? Debes seleccionar 3 de 5 corredores.

P(5, 3) _ 5 _ 4 _3 n _ 5 y r _ 3, así que n _ r _ 1 _ 3 _ 60 Hay 60 maneras de premiar con las cintas.

Prueben esto juntos Calculen cada valor. 1. P(6, 3) 2. 6! Calcula cada valor. 3. P(5, 5) 4. P(8, 4) 5. P(13, 5) 6. 8! 7. 0! 8. 5! 9. 2! 10. 9! 11. P(15, 1) 12. P(10, 5) 13. Mascotas ¿De cuántas maneras puedes seleccionar 5 perros de un grupo de 7 para entrar en 5 eventos diferentes en un concurso de perros? 14. Prueba estandarizada de práctica Hay 12 niños preescolares esperando usar 4 piezas diferentes de equipo de patio de recreo. ¿De cuántas maneras puede distribuir la profesora el equipo para 4 alumnos? A 11,880 B 479,001 C 24 D 48 Respuestas: 1. 120 2. 720 3. 120 4. 1,680 5. 154,440 6. 40,320 7. 1 8. 120 9. 2 10. 362,880 11. 15 12. 30,240 13. 2,520 14. A 7. 8. 4. 5. A C 6. C AC A B B B B 3.

Combinaciones

(páginas 388–391)

NOMBRE ______________________________________ FECHA ____________ PERÍODO ____ Guía de estudio para padres y alumnos © Glencoe/McGraw-Hill 69 Matemáticas: Aplicaciones y conceptos, Curso 3

Un arreglo o listado cuyo orden no es importante se llama combinación.

Para calcular el número de combinaciones de n cosas tomadas r a la vez, Calcula o C(n, r ), divide el número de permutaciones P(n, r ) entre el número de combinaciones maneras en que r cosas pueden arreglarse, lo cual es r !. C(n, r) _

A Calcula C(3, 2). B Calcula C(5, 3). C(3, 2) _ C(5, 3) _ __ _ ó 3 _ ó 10

Prueben esto juntos Calculen cada valor. 1. C(5, 2) 2. C(12, 4) 3. C(16, 3) 4. C(8, 5) AYUDA: Calculen el número de permutaciones primero, luego dividan entre r !.

Calcula cada valor. 5. C(10, 6) 6. C(4, 2) 7. C(7, 4) 8. C(11, 5) 9. C(6, 3) 10. C(4, 4) 11. C(1, 1) 12. C(100, 1) Determina si cada situación es una permutación o una combinación. 13. escoger 3 clips de papel de una caja de 100 14. agarrar 5 pelotas de tenis de una cesta de 10 15. seis pájaros posados en un alambre telefónico

16. escoger 4 marcadores de colores de una caja de 8 diferentes colores 17. cinco bicicletas estacionadas en un puesto de 10 bicicletas 18. Compras Un mercado tiene 15 sabores de chicles. Nate compra tres sabores de chicle cada vez que visita el mercado. ¿Cuántas combinaciones diferentes de tres sabores de chicle puede comprar Nate? 19. Prueba estandarizada de práctica El señor Begay tiene 8 insectos para que los estudien los alumnos. ¿Cuántos grupos diferentes de 3 insectos puede estudiar un alumno? A 8 B 70 C 28 D 56 60 _6 6_2 5 _ 4 _3 _3_2_1 3 _2 _2_1 P(5, 3) _3! P(3, 2) _2!

P(n, r)_r !

Respuestas: 1. 10 2. 495 3. 560 4. 56 5. 210 6. 6 7. 35 8. 462 9. 20 10. 1 11. 1 12. 100 13. combinación 14. combinación 15. permutación 16. combinación 17. permutación 18. 455 19. D 7. 8. 4. 5. A C 6. C AC A B B B B 3.

Probabilidad y eventos compuestos (páginas 396–399)

NOMBRE ______________________________________ FECHA ____________ PERÍODO ____ Guía de estudio para padres y alumnos © Glencoe/McGraw-Hill 70 Matemáticas: Aplicaciones y conceptos, Curso 3

Cuando calculas probabilidades, a menudo tienes que tomar en consideración dos o más eventos, conocidos como eventos compuestos. En un evento compuesto, si el segundo evento no depende del resultado del primer evento, entonces los eventos son independientes. Si el resultado de un evento de un evento compuesto influye en el otro evento, entonces los eventos son dependientes.

La probabilidad de que ocurran dos eventos independientes se Probabilidad de dos calcula multiplicando la probabilidad del primer evento por la eventos independientes probabilidad del segundo evento. P(A y B) _ P(A) _ P(B) Si dos eventos A y B son dependientes, entonces la probabilidad Probabilidad de dos de que ocurran los dos eventos es igual al producto de la

eventos dependientes probabilidad de A por la probabilidad de B después de ocurrir A. P(A y B) _ P(A) _ P(B dado A)

A ¿Cuál es la probabilidad de obtener B Una bolsa contiene tres canicas rosadas y dos dos caras seguidas al tirar una moradas. ¿Cuál es la probabilidad de sacar de la moneda? bolsa dos canicas moradas seguidas si no se devuelve la primera canica? El sacar la primera canica cambia el número de canicas dentro de la bolsa, lo cual cambia la probabilidad del segundo evento. Estos son eventos dependientes. P(morada y morada) _ P(morada) _ P(morada después de otra morada) P(morada y morada) _ _ P(morada y morada) _ ó La probabilidad de sacar dos canicas moradas seguidas es de .

Se usan veinte tarjetas de un juego. Cinco son rojas, cinco son azules, cuatro son verdes y seis son amarillas. Una vez que se saca una tarjeta, ésta no se reemplaza. Calcula la probabilidad de cada resultado. 1. dos tarjetas azules seguidas 2. una tarjeta verde y luego una tarjeta amarilla 3. Prueba estandarizada de práctica Sarita tiene cuatro billetes de $1 y tres de $10 en su billetera. ¿Cuál es la probabilidad de que al sacar dos billetes seguidos, saque uno de $10 cada vez? Asume que Sarita no reemplaza el primer billete. A B C D 12 _ 49 6_ 49 2_7 1_7 1_ 10 1_ 10 2_ 20 1_4 2_5 Respuestas: 1. 2. 3. A 6 _ 95 1_ 19 7. 8. 4. 5. A C 6. C AC A B B B B 3.

La primera vez que se tira la moneda no afecta la segunda vez que se tira, así que estos eventos son independientes. P(caras y caras) _ P(caras) _ P(caras)

P(caras y caras) _ _ P(caras y caras) _ La probabilidad de obtener dos caras seguidas al tirar una moneda es de . 1 _4 1_4 1_2 1_2

Probabilidad experimental

(páginas

400–403)

NOMBRE ______________________________________ FECHA ____________ PERÍODO ____ Guía de estudio para padres y alumnos © Glencoe/McGraw-Hill 71 Matemáticas: Aplicaciones y conceptos, Curso 3

Sabes que debido a que un cubo numerado tiene seis posibles resultados, la probabilidad de obtener un uno al lanzar un cubo es de _ 1 6 _.

Este tipo de probabilidad se llama probabilidad teórica. Pero si lanzas un cubo un cierto número de veces, la fracción de las veces que obtienes un uno puede que no sea exactamente de . Este tipo de probabilidad se llama probabilidad experimental. Clarise llevó a cabo un experimento para averiguar su probabilidad de acertar un tiro durante un partido de básquetbol. Clarise acertó 40 de sus 100 tiros libres. ¿Cuál es la probabilidad experimental de acertar un tiro libre? probabilidad experimental _ Por lo tanto, su probabilidad experimental de acertar un tiro libre es de ó .

1. Si lanzas una carta de béisbol, ¿cuál es la probabilidad experimental de que caerá con el dibujo cara arriba? 2. Has lanzado la carta 40 veces y aterriza con el dibujo cara arriba 24 veces. ¿Cuál es la probabilidad experimental de que caiga la carta cara arriba? 3. Svetalana y Lenora juegan con un cubo numerado. Basándote en los resultados de los lanzamientos indicados en la gráfica, ¿qué número es más probable que saque Svetlana la próxima vez? 4. Genética Gregor cultiva arvejas como pasatiempo. Algunas de sus arvejas siempre producen flores blancas. Otras siempre producen flores rojas. Como experimento, Gregor polinizó una flor blanca con polen de una flor roja. La flor blanca cruce polinizada produjo 8 semillas. a. Si los tratos genéticos tales como el color de las flores tienen la misma posibilidad de

ocurrir, ¿cuántas de esas 8 semillas esperarías que crecieran en plantas con flores rojas? b. Si tres de las 8 semillas crecen en plantas con flores rojas, ¿cuál es la probabilidad experimental de que una semilla crezca en una planta con flores rojas? 5. Prueba estandarizada de práctica Celia tiene una bolsa de 10 canicas. Algunas son azules y otras son amarillas. Ella sacó una canica de la bolsa 100 veces, reemplazando la canica cada vez que la sacaba. Si sacó una canica azul 78 de 100 veces, ¿cuántas canicas azules es más probable que se encuentren en la bolsa? A3B8C7D9 16 12 8 4 0 2 Resultados al lanzar dos cubos numerados Número de lanzamientos 3 4 5 6 7 8 9 10 11 12 2_5 40 _100 número de tiros libres acertados ____ número de tiros libres intentados

1_6

Respuestas: 1. 2. 3. 8 4a. 4 4b. 5. B 3 _8 3_5 1_2 7. 8. 4. 5. A C 6. C AC A B B B B 3.

Usa muestreo para predecir (páginas 406–409) NOMBRE ______________________________________ FECHA ____________ PERÍODO ____ Guía de estudio para padres y alumnos © Glencoe/McGraw-Hill 72 Matemáticas: Aplicaciones y conceptos, Curso 3

Si quieres hacer una predicción sobre un grupo grande de personas, puedes usar un grupo más pequeño o muestra de un grupo más grande. El grupo grande del cual tomaste tu muestra se llama población. Para asegurarte de que tu información representa a la población, la muestra debe obtenerse al azar. Una muestra al azar le da a todos la misma posibilidad de ser seleccionados. El club de matemáticas de la escuela les preguntó a varios alumnos al azar lo que les gusta comer de merienda durante su recreo de la tarde. Tres

alumnos dijeron que les gusta comer panecillos, cinco dijeron fruta y uno dijo que roscas. A ¿Cuál es el tamaño de la muestra? B ¿Qué porcentaje prefirió panecillos?

Suma el número de personas a quienes 3 de 9 dijeron que les gustan los panecillos. les preguntaron. 3 _ 5 _ 1 _ 9 _ ó 33 %

C Basado en su encuesta, ¿aproximadamente D ¿Fue una muestra apropiada el grupo cuántos alumnos de los 1,200 en la escuela de alumnos que el club encuestó? preferirían panecillos para la merienda? Los alumnos encuestados por el club de _ 1,200 _ 400 matemáticas probablemente no fueron una Así que cerca de 400 alumnos preferirían muestra apropiada porque había muy pocos alumnos encuestados en comparación con panecillos. el número total de alumnos en la escuela.

1. La escuela media Brushy Creek es una nueva escuela con 800 alumnos. El director les preguntó a algunos alumnos de sus preferencias sobre la nueva mascota de la escuela. Los resultados indicaron que 22 prefieren un águila, 36 prefieren un tigre y 42 prefieren un armadillo. a. ¿Cuál es el tamaño de la muestra? b. ¿Qué porcentaje quería que el armadillo fuese la mascota de la escuela? 2. Biología Cada mes por tres años, una biólogo ha pescado 30 peces en un lago y examinado su sangre para ver si existe contaminación de plomo. En tres años, la biólogo ha descubierto 270 peces con contaminación de plomo. Si ella desea examinar 40 peces el próximo mes en vez de 30, ¿cuántos predices que tendrán plomo en su sangre?

DISTRIBUCI´ON BINOMIAL Y DISTRIBUCI´ON NORMAL 3.1. Introducci´on

Estudiaremos en este tema dos de las distribuciones de probabilidad m´as importantes y que son imprescindibles a la hora de adentrarnos en el estudio de la inferencia estad ´ıstica. La distribuci´on

binomial es uno de los primeros ejemplos de las llamadas distribuciones discretas (que s´olo pueden tomar un n´umero finito, o infinito numerable, de valores). Fue estudiada por Jakob Bernoulli (Suiza, 1654-1705), qui´en escribi´o el primer tratado importante sobre probabilidad, “Ars conjectandi” (El arte de pronosticar). Los Bernoulli formaron una de las sagas de matem ´aticos m´as importantes de la historia. La distribuci´on normal es un ejemplo de las distribuciones continuas, y aparece en multitud de fen´omenos sociales. Fue estudiada, entre otros, por J.K.F. Gauss (Alemania, 1777-1855), uno de los m´as famosos matem´aticos de la historia. La gr´afica de la distribuci´on normal en forma de campana se denomina Campana de Gauss.

3.2. La distribuci´on binomial o de Bernoulli

La distribuci´on binomial est´a asociada a experimentos del siguiente tipo: - Realizamos n veces cierto experimento en el que consideramos s´olo la posibilidad de ´exito o fracaso. - La obtenci´on de ´exito o fracaso en cada ocasi´on es independiente de la obtenci´on de ´exito o fracaso en las dem´as ocasiones. - La probabilidad de obtener ´exito o fracaso siempre es la misma en cada ocasi´on. Ve´amoslo con un ejemplo Tiramos un dado 7 veces y contamos el n´umero de cincos que obtenemos. .Cu´al es la probabilidad de obtener tres cincos?. Este es un t´ıpico ejemplo de distribuci´on binomial, pues estamos repitiendo 7 veces el experimento de lanzar un dado. .Cu´al es nuestro ´exito?. Evidentemente, sacar un 5, que es en lo que nos fijamos. El fracaso, por tanto, ser´a no sacar 5, sino sacar cualquier otro n´umero. Por tanto, ´Exito = E = “sacar un 5” =⇒ p(E) = 1 6 Fracaso = F = “no sacar un 5” =⇒ p(F) = 5 6 Para calcular la probabilidad que nos piden, fij´emonos en que nos dicen que sacamos 3 cincos y por lo tanto tenemos 3 ´exitos y 4 fracasos, .de cu´antas maneras pueden darse estas posibilidades?. Podr´ıamos sacar 3 cincos en las 3 primeras tiradas y luego 4 tiradas sin sacar cinco, es decir: EEEFFFF Pero tambi´en podr´ıamos sacar EFEFFFE, es decir que en realidad estamos calculando de cu´antas 38 CAP´ITULO 3. DISTRIBUCI ´ ON BINOMIAL Y DISTRIBUCI ´ ON NORMAL 39 maneras se pueden ordenar 4 fracasos y 3 ´exitos. Recordando las t´ecnicas combinatorias, este problema se reduce a calcular las permutaciones con elementos repetidos: P3,4

= 7! 3! ・ 4! = 7・6・5 3・2・1 = 35formas Y por tanto, como p(E) = 1 6 y tengo 3 ´exitos y p(F) = 5 6 y tengo 4 fracasos: p(tener 3 ´exitos y 4 fracasos) = 35 ・ 1 6・ 1 6・ 1 6・ 5 6・ 5 6・ 5 6・ 5 6 = 0_0781 Formalizando lo obtenido, en una variable binomial con 7 repeticiones y con probabilidad de ´exito 1 6 , la probabilidad de obtener 3 ´exitos es 0’0781, y lo expresar´ıamos: Bin_7; 1 6_, entonces p(X = 3) = 0_0781 Como repetir este proceso ser´ıa bastante penoso en la mayor´ıa de los casos, lo mejor es recurrir a la siguiente f´ormula que expresa la probabilidad de obtener cierto n´umero de ´exitos en una distribuci´on binomial: Definici´on de distribuci´on binomial: Si realizamos n veces un experimento en el que podemos obtener ´exito, E, con probabilidad p y fracaso, F, con probabilidad q (q = 1 − p), diremos que estamos ante una distribuci´on binomial de par´ametros n y p, y lo representaremos por Bin(n;p). En este caso la probabilidad de obtener k ´exitos viene dada por: p(X = k) = _n k_・ pk ・ q(n−k) 7

Nota: Observar que las probabilidades de ´exito y fracaso son complementarias, es decir, q = 1-p y p = 1-q, por lo que basta saber una de ellas para calcular la otra. Ejemplo: Antes ten´ıamos Bin_7; 1 6_, y quer´ıamos calcular p(X=3) (obtener 3 ´exitos). Aplicando la f´ormula: p(X = 3) = _7 3_・ _1 6_3 ・ _5 6_4 = 0_0781 Ejemplo: Supongamos que la probabilidad de que una pareja tenga un hijo o una hija es igual. Calcular la probabilidad de que una familia con 6 descendientes tenga 2 hijos. En este caso ´Exito = E = “tener hijo” y p(E) = 0’5. Fracaso = F = “tener hija” y p(F) = 0’5. Estamos por tanto ante una binomial Bin(6;0’5) y nos piden p(X=2). Si aplicamos la f´ormula es: p(X = 2) = _6 2_ ・ (0_5)2 ・ (0_5)4 = 0_2344 Nota: La elecci´on de ´exito o fracaso es subjetiva y queda a elecci´on de la persona que resuelve el problema, pero teniendo cuidado de plantear correctamente lo que se pide. En el caso concreto del ejemplo anterior, si: ´Exito = “ tener hija”, como nos piden la probabilidad de que una familia con 6 hijos tenga 2 hijos, si el ´exito es tener hija hemos de plantearnos cu´al es la probabilidad de tener 4 ´exitos (4 hijas), es CAP´ITULO 3. DISTRIBUCI ´ ON BINOMIAL Y DISTRIBUCI ´ ON NORMAL 40 decir: p(X = 4) = _6 4_ ・ (0_5)4 ・ (0_5)2 = 0_2344 Evidentemente sale lo mismo, pero hay que ser consecuente a la hora de elegir el ´exito y el fracaso y la pregunta que nos hagan.

3.2.1. El uso de las tablas de la distribuci´on binomial

La distribuci´on binomial se encuentra tabulada por lo que es f´acil calcular probabilidades sin necesidad de hacer demasiadas cuentas. Para usar las tablas de la distribuci ´on binomial es necesario conocer: - El n´umero de veces que se realiza el experimento (n). - La probabilidad de ´exito (p). - El n´umero de ´exitos (k). La probabilidad p se busca en la primera fila (valores desde 0’01 hasta 0’5).

El n´umero de veces que se realiza el experimento, en la primera columna (valores desde 2 a 10) y el n´umero de ´exitos a su lado. Por ejemplo en el caso anterior, Bin (6;0’5) , p(X=2), la columna p=0’5 es la ´ultima, y cuando n=6 y k=2 encontramos 0’2344, el valor que hab´ıamos calculado. Nota importante: El caso en que p > 0_5, no se encuentra tabulado. La raz´on es bien sencilla. Si p > 0_5, entonces q < 0_5 y basta intercambiar los papeles de ´exito y fracaso para que podamos utilizar la tabla. Ejemplo: La probabilidad de que un alumno de 2 de Bachillerato apruebe las Matem ´aticas es de 0’7. Si consideramos un grupo de 8 alumnos, .cu´al es la probabilidad de que cinco de ellos aprueben las Matem´aticas?. Si ´exito = “aprobar” y fracaso = “suspender”, entonces p = 0’7 y q = 0’3. Tenemos, por tanto, una Bin(8;0’7). Nos piden calcular p(X=5), que no se puede calcular mediante las tablas porque p = 0’7 y s´olo tenemos hasta p = 0’5. Por tanto si intercambiamos ´exito = “suspender” y fracaso =“aprobar” entonces p = 0’3, q = 0’7, es decir la nueva binomial es Bin(8;0’3) y nos piden que aprueben 5 de 8, es decir que suspendan 3 de 8 o lo que es lo mismo, que tengamos 3 ´exitos, p(X=3), y buscando en la tabla es p(X=3) = 0’2541. Tambi´en, desde luego podr´ıamos haber utilizado la f´ormula desde el principio, utilizar la Bin(8;0’7) y olvidarnos de tablas para hacer: p(X = 5) = _8 5_ ・ (0_7)5 ・ (0_3)3 = 0_254 º

3.2.2. Probabilidadesa cumuladas

Es posible que nos pidan no s´olo la probabilidad de que ocurran un cierto n ´umero de ´exitos en concreto, sino que ocurran como mucho “k” ´exitos o preguntas similares. En el ejemplo anterior, por ejemplo, podr´ıan pedirnos: a) .Cu´al es la probabilidad de que aprueben como mucho 2 alumnos?. Si ´exito = aprobar y fracaso = suspender, p= 0’7 y q = 0’3, entonces nos piden p(X ≤ 2). En este caso, basta pensar en que para que aprueben 2 alumnos como mucho, puede que aprueben 2, 1 o ninguno, es decir: p(X ≤ 2) = p(X = 0)+p(X = 1)+p(X = 2) = 0_0001 + 0_0012 + 0_01 = 0_1013 (haz las cuentas) b) .Cu´al es la probabilidad de que aprueben entre 3 y 6 alumnos (inclusive)?. CAP´ITULO 3. DISTRIBUCI ´ ON BINOMIAL Y DISTRIBUCI ´ ON NORMAL 41 Del mismo modo: p(3 ≤ X ≤ 6) = p(X = 3)+p(X = 4)+p(X = 5)+p(X = 6) = = 0_0467 + 0_1361 + 0_2541 + 0_2965 = 0_7334 Hemos de tener en cuenta que para la distribuci´on binomial, en las tablas s ´olo se admiten valores

hasta n=10 (10 repeticiones del experimento). Para valores de n > 10, inevitablemente hemos de utilizar la f´ormula. Ejemplo: Los alumnos de cierta clase se encuentran en una proporci´on del 67% que estudian ingl´es y el resto franc´es. Tomamos una muestra de 15 alumnos de la clase, calcular: a) Probabilidad de que al menos encontremos tres alumnos de ingl´es. b) Probabilidad de que los 15 alumnos estudien ingl´es. c) Probabilidad de que estudien ingl´es entre 7 y 10 alumnos. Si ´exito = estudiar ingl´es, p = 0’67 y fracaso = estudiar franc´es, q = 10’67 = 0’33. Manejamos por tanto una Bin(15;0’67) a) p(X ≥ 3) = p(X = 3)+p(X = 4)+p(X = 5)+p(X = 6)+. . .+ p(X = 15). Una opci´on es calcular estas 13 probabilidades y sumarlas. Como hay que aplicar la f´ormula para calcular cada una, la tarea se puede hacer bastante larga. Otra opci´on, m ´as sencilla, es pasar al complementario. El complementario de encontrar al menos 3 alumnos de ingl´es es encontrar como mucho 2 alumnos de ingl´es, p(X ≤ 2). Es decir, p(X ≥ 3) = 1 − p(X <3) = 1 − p(X ≤ 2) = 1 − (p(X = 0)+p(X = 1)+p(X = 2)) y s´olo tenemos que calcular 3 probabilidades: p(X = 0) ≈ 0 , p(X=1) = 0’000001, p(X=2) = 0’000026 (!compru´ebalo!). Por lo cual, p(X ≥ 3) = 1 − (0 + 0_000001 + 0_000026) = 1 − 0_000027 = 0_999973 b) p(X=15) = 0’0025 (aplica la f´ormula). c) p(7 ≤ X ≤ 10) = p(X = 7)+p(X = 8)+p(X = 9)+p(X = 10) = = 0_0549 + 0_1114 + 0_1759 + 0_2142 = 0_5564.

3.2.3. Media y desviaci´on t´ıpica en una distribuci´on binomial

Aunque no se demostar´a, en una distribuci´on binomial Bin(n;p), el n ´umero esperado de ´exitos o media, viene dado por  ̄x = n ・ p. (Recordemos que la media es una medidad de centralizaci´on). La desviaci´on t´ıpica, σ , que es una medida de dispersi´on y mide lo alejados que est´an los datos de la media, viene dada por σ = √n ・ p ・ q. CAP´ITULO 3. DISTRIBUCI ´ ON BINOMIAL Y DISTRIBUCI ´ ON NORMAL 42

3.3. La distribuci´on Normal

Al estudiar aspectos tan cotidianos como: - Caracteres morfol´ogicos de individuos ( personas, animales, plantas) de una misma raza. como tallas, pesos, envergaduras, etc. - Caracteres fisiol´ogicos, como el efecto de una misma dosis de un f ´armaco, o de una misma cantidad de abono. - Caracteres sociol´ogicos, como el consumo de ciertos productos por individuos de un mismo grupo

humano. - Caracteres psicol´ogicos, como el cociente intelectual, grado de adaptaci ´on a un medio. - Caracteres f´ısicos, como la resistencia a la rotura de ciertas piezas. . . todos ellos tienen en com´un que se distribuyen “normalmente”. .Qu´e quiere decir esta expresi´on?. Pu´es, por ejemplo, si hacemos una estad´ıstica para conocer la altura de 1400 mujeres y representamos los resultados en un diagrama de barras, obtenemos: Figura 3.1: Distribuci´on de estaturas de 1400 mujeres Las gr´aficas de este tipo son muy corrientes: Hay pocos individuos en los extremos y un aumento paulatino hasta llegar a la parte central del recorrido, donde est´a la mayor ´ıa de ellos. Definici´on: Diremos que una distribuci´on de probabilidad sigue una distribuci´on normal de media x y desviaci´on t´ıpica σ, y lo representaremos por N(x; σ) cuando la representaci´on gr´afica de su funci´on de densidad es una curva positiva continua, sim´etrica respecto a la media, de m´aximo en la media, y que tiene 2 puntos de inflexi´on , situados a ambos lados de la media (x − σ y x + σ respectivamente) y a distancia de σ ella, es decir de la forma: Figura 3.2: Distribuci´on normal N(x; σ). El m´aximo est´a en (x, 1 √2·π·σ2 ) CAP´ITULO 3. DISTRIBUCI ´ ON BINOMIAL Y DISTRIBUCI ´ ON NORMAL 43 Dependiendo de los valores que tomen x y σ, la gr´afica de esta funci´on puede ser m´as o menos alargada, achatada, etc..., pero en cualquier caso siempre tiene las mismas condiciones de simetr´ıa, continuidad, etc rese˜nadas anteriormente. El concepto de funci´on de densidad introducido anteriormente no se estudiar´a con profundidad. Baste decir que la funci´on de densidad determina la forma de cada distribuci´on de probabilidad. En el caso de la distribuci´on normal de par´ametros x y σ, dicha funci´on viene dada por: f(x) = 1 √2 ・ π ・ σ2 ・ e−(x−x)2 2·σ2

Propiedad: El ´area encerrada bajo la curva normal N(x; σ) siempre es 1. La demostraci´on de este resultado no es nada sencilla e implica el uso de resultados matem´aticos que exceden el nivel de este curso. De entre todas las curvas normales N(x; σ), la m´as sencilla, usada y conocida es aquella que tiene por media 0 y por desviaci´on t´ıpica 1, N(0, 1). Esta normal est´andar se suele representar por Z. La gr´afica de esta curva se denomina campana de Gauss y se puede observar en la figura: Figura 3.3: Distribuci´on normal N(0; 1). El m´aximo est´a en (0, 1 √2·π ) Su funci´on de densidad ser´a: f(x) =

1 √2 ・ π ・ e−x2 2

Puesto que el ´area bajo esta curva normal es 1, podemos definir una probabilidad de la siguiente manera: Para un valor cualquiera k, definimos la probabilidad de que la distribuci´on Z, N(0;1) , sea menor o igual que k como: p(Z ≤ k)= “ ´Area encerrada bajo la curva normal N(0,1) desde −∞ hasta k” (es decir la parte rayada de la figura siguiente). Figura 3.4: ´Area encerrada por la curva normal desde −∞ hasta k Ahora bien, .c´omo calcular dicha ´area?. F´acil: Dichas ´areas o probabilidades se encuentran tabuladas. CAP´ITULO 3. DISTRIBUCI ´ ON BINOMIAL Y DISTRIBUCI ´ ON NORMAL 44

3.3.1. Uso de las tablas de la distribuci´on normal N(0;1)

La normal N(0;1) se encuentra tabulada, para valores a partir de 0 y hasta 3’99. Si por ejemplo queremos calcular p(Z ≤ 2_78), hemos de realizar los pasos: 1. Buscar la parte entera y las d´ecimas en la primera columna (en este caso 2’7). 2. Buscar las cent´esimas en la primera fila (en este caso 8). 3. En el punto com´un a la fila y la columna que hemos encontrado, tenemos la probabilidad buscada, en este caso 0’9973. Por tanto p(Z ≤ 2_78) = 0_9973. Si queremos calcular una probabilidad de un valor mayor que 3’99, basta fijarse en que las probabilidades correpondientes a valores tales como 3’62 y mayores ya valen 0’9999 (pr ´acticamente 1). Por eso, para estos valores mayores que 3’99, diremos que la probabilidad es aproximadamente 1. As´ı: p(Z ≤ 5_62) ≈ 1 aunque no aparezca en la tabla. Por otra parte, fij´emonos en que en este tipo de distribuciones no tiene sentido plantearse probabilidades del tipo p(Z=k), ya que siempre valen 0, al no encerrar ning´un ´area. Por tanto, si nos pidiesen p(Z=3’2), basta decir que p(Z=3’2)=0. Este tipo de distribuciones en las cuales la probabilidad de tomar un valor concreto es 0 se demoniman distribuciones continuas, para diferenciarlas de otras en las que esto no ocurre, como por ejemplo la binomial, que es una distribuci´on discreta. As´ı, al pasar al complementario, si tenemos Z ≥ k, su complementario ser´a Z < k, pero como incluir k no influye en la probabilidad,al calcular probabilidades podemos escribir: p(Z ≥ k) = 1 − p(Z < k) = 1 − p(Z ≤ k) S´olo se puede hacer esto en distribuciones continuas, en el caso de la binomial esto no se puede hacer y hay que ser cuidadosos con el paso al complementario. Ejercicio: Buscar en la tabla de la normal est´andar N(0;1) las probabilidades: a) p(Z ≤ 1_15) b) p(Z ≤ 0_5) c) p(Z ≤ 0_82) d) p(Z ≤ 1_05) e) p(Z ≤ 4_27)

f) p(Z ≤ 18_09)

3.3.2. C´alculo de otrasp robabilidades 1. Si k es positivo y queremos calcular p(Z ≥ k), es decir el ´area rayada: Figura 3.5: p(Z ≥ k). Basta pasar al complementario basta pasar al complementario, es decir: p(Z ≥ k) = 1−p(Z ≤ k) y esta ´ultima probabilidad ya se encuentra tabulada. Ejercicio: Calcular p(Z ≥ 0_3) y p(Z ≥ 2_07). CAP´ITULO 3. DISTRIBUCI ´ ON BINOMIAL Y DISTRIBUCI ´ ON NORMAL 45 2. Si k es positivo y queremos calcular p(Z ≤ −k), es decir el ´area: por simetr´ıa, p(Z ≤ −k) = Figura 3.6: p(Z ≤ −k).Las probabilidades de valores negativos no est´an tabuladas p(Z ≥ k) y ´esta se calcula como en el caso anterior. Se puede observar la igualdad de ´areas en la figura: Figura 3.7: p(Z ≤ −k) = p(Z ≥ k). La simetr´ıa permite reducir este caso al anterior Ejercicio: Calcular p(Z ≤ −0_78) y p(Z ≤ −3_2). 3. Si k es positivo y queremos calcular p(Z ≥ −k), es decir el ´area rayada: Figura 3.8: p(Z ≥ −k) entonces, por simetr´ıa p(Z ≥ −k) = p(Z ≤ k): Figura 3.9: p(Z ≥ −k) = p(Z ≤ k).La simetr´ıa permite reducir este caso al que ya est´a tabulado Ejercicio: Calcular p(Z ≥ −0_96) y p(Z ≥ −1_01). CAP´ITULO 3. DISTRIBUCI ´ ON BINOMIAL Y DISTRIBUCI ´ ON NORMAL 46 4. Probabilidades comprendidas entre dos valores,p(k1 ≤ Z ≤ k2) ,es decir el ´area rayada: Figura 3.10: p(k1 ≤ Z ≤ k2). Probabilidad comprendida entre dos valores se calcula restando las ´areas: Figura 3.11: p(Z ≤ k2) en la primera imagen.p(Z ≤ k1) en la segunda. Al restar obtenemos el ´area pedida. Se quita la parte correspondiente a Z ≤ k1,p(Z ≤ k2) − p(Z ≤ k1). Ejercicio: Calcular p(−0_96 ≤ Z ≤ 1_49) y p(−1_32 ≤ Z ≤ −0_57). Ejercicio: Calcular p(Z=2), p(Z ≤ 2), p(Z ≥ 2), p(Z ≤ −2), p(Z ≥ −2), p(−2 ≤ Z ≤ 2), p(0_81 ≤ Z ≤ 1_33).

3.3.3. C´alculo de probabilidadesen normales N(x; σ)

Si no tenemos una distribuci´on N(0;1), sino una N(x; σ) cualquiera, .c´omo calcular probabilidades, si no tenemos tabla salvo para N(0;1)?. El siguiente resultado nos da la respuesta. Propiedad: Si X sigue una distribuci´on N(x; σ) , entonces la variable Z = X − x σ sigue una distribuci´on N(0,1). (El paso de la variable X −→ N(x; σ) a la Z −→ N(0;1) se denomina tipificaci ´on de la variable X). Ejemplo: Las estaturas de 600 soldados se distribuyen de acuerdo a una distribuci´on normal de media 168 y desviaci´on t´ıpica 8 cm. .Cu´antos soldados miden entre 166 y 170 cm?.

Sea X la distribuci´on de los soldados , X es una N(168,8). Nos piden p(166 ≤ X ≤ 170). Utilizando el resultado anterior, primero restamos x=168 en la desigualdad: p(166 ≤ X ≤ 170) = p(166 − 168 ≤ X − 168 ≤ 170 − 168) = p(−2 ≤ X − 168 ≤ 2) Y ahora dividimos entre σ = 8, con lo que acabamos de tipificar: p(166 ≤ X ≤ 170) = p(−2 ≤ X − 168 ≤ 2) = p_−2 8≤ X − 168 8≤ 2 8_ CAP´ITULO 3. DISTRIBUCI ´ ON BINOMIAL Y DISTRIBUCI ´ ON NORMAL 47 Llamando a X − 168 8 = Z, ´esta ya es normal N(0,1) y se encuentra en las tablas: p(166 ≤ X ≤ 170) = p(−0_25 ≤ Z ≤ 0_25) = p(Z ≤ 0_25) − p(Z ≤ −0_25) = = (tablas) = 0_5987 − 0_4013 = 0_1974. (pues p(Z ≤ −0_25) = p(Z ≥ 0_25) = 1 − p(Z ≤ 0_25) = 1 − 0_5987 = 0_4013). Ejercicios: 1) En una distribuci´on N(22,5), calcula: p(X ≤ 27),p(X ≥ 27),p(X ≥ 125), p(15 ≤ X ≤ 20), p(17 ≤ X ≤ 30). 2) Los pesos de 60 soldados siguen una distribuci´on N(67,5). Calcula la probabilidad de que el peso sea: a) mayor de 80 kg. b) 50 kg. o menos c) menos de 60 kg. d) 70 kg. e) Entre 60 y 70 kg inclusive.

3.3.4. Otro uso de las tablas

Hasta ahora nos han dado la distribuci´on normal N(0;1) y nos ped´ıan p(Z ≤ k) siendo k un cierto n´umero, y nos ped´ıan calcular dicha probabilidad. Ahora bien, otra pregunta puede ser: Dado que en una normal N(0;1) sabemos que p(Z ≤ k) = 0_9573, .qui´en es k?. La resoluci´on es bien sencilla. Basta buscar 0’9573 dentro de la tabla de la distribuci´on normal, y lo encontramos en el cruce de la fila 1’7 con la columna 2, y por lo tanto k debe ser 1’72. Ejercicio: Calcular k si: a) p(Z ≤ k) = 0_8078. b) p(Z ≥ k) = 0_0028. En caso de que el valor a buscar no aparezca directamente dentro de la tabla de la distribuci´on normal, pueden ocurrir dos posibilidades: a) Si el valor se encuentra entre dos valores de la tabla y a la misma distancia (aproximadamente) de cada uno de ellos, por ejemplo: p(Z ≤ k) = 0_7982. En este caso el valor buscado ser´a la media entre los valores extremos.

Si buscamos en la tabla este valor no aparece directamente, sino que se encuentra entre los valores 0’7967 (que corresponde a 0’83) y 0’7996 (que corresponde a 0’84). Por tanto el valor de k ser´a: k= 0_83 + 0_84 2 = 0_835 b) Si el valor est´a entre dos valores, pero muy cercano a uno de ellos, directamente tomamos este valor, por ejemplo: p(Z ≤ k) = 0_7970. El valor m´as cercano es 0’9767 (que corresponde a 0’83) y como el valor buscado est´a muy cerca de ´el, entonces directamente k=0’83. Si la distribuci´on no es normal N(0;1), sino N(x; σ), tendremos que tipificar previamente. Por ejemplo, si X sigue una normal N(6;3) y p(X ≤ k) = 0_9082, calcula k. Tipificando: p_X − 6 3≤ k−6 3 _ = 0_9082 −→ p_Z ≤ k−6 3 _ = 0_9082 Y buscando en la tabla, k−6 3 = 1_33 ⇒ k − 6 = 3_99 ⇒ k = 9_99 CAP´ITULO 3. DISTRIBUCI ´ ON BINOMIAL Y DISTRIBUCI ´ ON NORMAL 48 Ejercicios: 1. Calcular k si p(X ≤ k) = 0_6141 y X sigue una N(15,4). 2. De una variable normal N(x; σ) se sabe que p(X ≤ 7) = 0_9772 y p(X ≤ 6_5) = 0_8413. Calcular: a) x y σ. b) p(5_65 ≤ X ≤ 6_25) c) Eln´umero k tal que p(X >k) = 0_3 CAP´ITULO 3. DISTRIBUCI ´ ON BINOMIAL Y DISTRIBUCI ´ ON NORMAL 49

3.4. Relaci´on entre la distribuci´on binomial y la distribuci´on normal

Es un hecho comprobado que cuando tenemos una distribuci´on Bin(n;p), a medida que n crece, es dif´ıcil hacer uso de las f´ormulas y/o tablas. Por ejemplo, tiramos un dado 100 veces, calcular la probabilidad de obtener entre 20 y 33 cincos( inclusive). Si ´exito = obtener cinco entonces p = 1 6 y fracaso = no obtener cinco y q = 5 6 . Tenemos una Bin_100; 1

6_, y nos piden p(20 ≤ X ≤ 33). Es inviable aplicar las tablas (pues repetimos el experimento 100 veces) y tampoco la f´ormula pues es inviable calcular, por ejemplo, p(X = 32) = _100 32 _ ・ _1 6_32 ・ _5 6_68 .C´omo resolver el problema?. Del siguiente modo: Teorema Central del L´ımite: La distribuci´on binomial Bin(n;p) se aproxima a una curva normal de media x = n ・ p y desviaci´on t´ıpica σ = √n ・ p ・ q, cuando n tiende a ∞, es decir, cuando n se hace muy grande. La aproximaci´on se puede aplicar (es una buena aproximaci´on) s´olo si n es grande, en concreto n ≥ 30 y adem´as n ・ p ≥ 5 y n ・ q ≥ 5. Si no se cumplen estas condiciones NO podemos aproximar la binomial que tengamos por una distribuci´on normal. En caso de que podamos aproximar, debemos tener en cuenta que estamos pasando de una variable discreta (binomial) a una continua (normal), y por tanto son distribuciones diferentes. El “precio” que hay que pagar por pasar de una a otra se denomina “correcci´on por continuidad” y consiste en hacer determinados ajustes para que la aproximaci´on realizada sea lo m´as precisa posible. As´ı, si nos piden p(X=k) en una distribuci´on binomial X, y aproximamosX por una distribuci´on normal Y, no podemos calcular directamente p(Y=k) porque, como ya se ha comentado anteriormente, en una distribuci´on continua todas estas probabilidades valen 0. La correcci ´on por continuidad consiste en tomar un peque˜no intervalo de longitud 1 alrededor del punto k. De otro modo, si nos piden p(X=k) con X binomial, con la aproximaci´on normal Y deberemos calcular p(k − 0_5 ≤ Y ≤ k + 0_5). Del mismo modo se razona en el caso de probabilidades acumuladas en la binomial. Algunos ejemplos: Si nos piden p(X
aproximar una distribuci´on binomial por una normal. En el caso anterior,x = n ・ p = 100 6 = 16_67 y σ = √n ・ p ・ q = _500 36 = 3_73. De modo que, como n ≥ 30, n ・ p = 16_67 ≥ 5 y nq˙ = 83_33 ≥ 5, se pude aproximar la binomial por la normal, es decir: X −→ Bin_100; 1 6_ ≈ Y −→ N(16_67; 3_73) CAP´ITULO 3. DISTRIBUCI ´ ON BINOMIAL Y DISTRIBUCI ´ ON NORMAL 50 Entonces: p(20 ≤ X ≤ 33) _(_≈∗_)_ p(20 − 0_5 ≤ Y ≤ 33 + 0_5) = p_19_5 − 16_67 3_73 ≤ Y − 16_67 3_73 ≤ 33_5 − 16_67 3_73 _ = = p(0_89 ≤ Z ≤ 4_51) = p(Z ≤ 4_51) − p(Z ≤ 0_89) ≈ 1 − 0_8133 = 0_1867 Notemos que en el paso se˜nalado por (*) hemos cambiado X(binomial) por Y(normal) y se ha realizado la correcci´on por continuidad. El estudio de determinadas características de una población se efectúa a través de diversas muestras que pueden extraerse de ella. El muestreo puede hacerse con o sin reposición, y la población de partida puede ser infinita o finita. Una población finita en la que se efectúa muestreo con reposición puede considerarse infinita teóricamente. También, a efectos prácticos, una población muy grande puede considerarse como infinita. En todo nuestro estudio vamos a limitarnos a una población de partida infinita o a muestreo con reposición. Consideremos todas las posibles muestras de tamaño n en una población. Para cada muestra podemos calcular un estadístico (media, desviación típica, proporción,...) que variará de una a otra. Así obtenemos una distribución del estadístico que se llama distribución muestral. Las dos medidas fundamentales de esta distribución son la media y la desviación típica, también denominada error típico. Hay que hacer notar que si el tamaño de la muestra es lo suficientemente grande las distribuciones muestrales son normales y en esto se basarán todos los resultados que alcancemos.

Distribución muestral de medias Si tenemos una muestra aleatoria de una población N(µ σ), se sabe (Teorema del límite central) que la fdp de la media muestral es también normal con media µ y varianza σ2/n. Esto es exacto para poblaciones normales y aproximado (buena aproximación con n>30)

para poblaciones cualesquiera. Es decir media.

es el error típico, o error estándar de la

¿Cómo usamos esto en nuestro problema de estimación? 1º problema: No hay tablas para cualquier normal, sólo para la normal µ=0 y σ=1 (la llamada z); pero haciendo la transformación (llamada tipificación)

una normal de media µ y desviación σ se transforma en una z. Llamando zα al valor de una variable normal tipificada que deja a su derecha un área bajo la curva de α, es decir, que la probabilidad que la variable sea mayor que ese valor es α (estos son los valores que ofrece la tabla de la normal)

podremos construir intervalos de la forma

para los que la probabilidad es 1 - α.

Teniendo en cuenta la simetría de la normal y manipulando algebraícamente

que también se puede escribir

o, haciendo énfasis en que

es el error estándar de la media,

Recuérdese que la probabilidad de que µ esté en este intervalo es 1 - α. A un intervalo de este tipo se le denomina intervalo de confianza con un nivel de confianza del 100(1 - α)%, o nivel de significación de 100α%. El nivel de confianza habitual es el 95%, en cuyo caso α =0,05 y zα /2=1,96. Al valor estimador de µ.

se le denomina estimación puntual y se dice que

es un

Distribución muestral de proporciones Sea X una variable binomial de parámetros n y p (una variable binomial es el número de éxitos en n ensayos; en cada ensayo la probabilidad de éxito (p) es la misma, por ejemplo: número de diabéticos en 2000 personas). Si n es grande y p no está próximo a 0 ó 1 (np ≥ 5) X es aproximadamente normal con media

np y varianza npq (siendo q = 1 - p) y se puede usar el estadístico

(proporción

muestral), que es también aproximadamente normal, con error típico dado por

Teorema central del límite La distribución de medias muestrales tiende hacia una distribución normal, aunque las muestras procedan de una distribución no normal. Incrementando el número de muestras extraidas de la población, la distribución de sus medias tiende a normalizarse. (n > 30)

TEOREMA DEL LIMITE CENTRAL Si se obtiene una muestra de una población normal, entonces la media muestral tiene una distribución normal sin importar el tamaño de la muestra. Sin embargo, se puede demostrar que de hecho no importa el modelo de probabilidad del cual se obtenga la muestra; mientras la media y la varianza existan, la distribución de muestreo de X se aproximará a una distribución normal conforme n aumente. Lo anterior constituye uno de los más importantes teoremas en inferencia estadística y se conoce como TEOREMA DEL LIMITE CENTRAL. En muchos casos, puede concluirse en forma segura que la aproximación será buena mientras n > 30. Para mostrar la validez del teorema del limite central veamos el siguiente ejemplo Suponga que de una población consistente en los valores 0, 2, 4, 6 y 8, se toman muestras de tamaño 2 con remplazo. X Frecuencia Frecuencia Relativa 0 1 1/5 = .2 2 1 1/5 = .2 4 1 1/5 = .2 6 1 1/5 = .2 8 1 1/5 = .2 Solución: 1. 1. Paso Se calcula la media poblacional, la varianza y desviación estándar poblacional. n

µ=

µ

∑X i

N 0 + 2 + 4 + 6 +8 20 = =4 5 5

=

n

σ2 = ∑ i

( X − µ )2 N

σ2 =

( 0 − 4 ) 2 + ( 2 − 4 ) 2 + ( 4 − 4 ) 2 + ( 6 − 4 ) 2 + ( 8 − 4 ) 2 40 = =8 5 5

σ = 8 = 2.83

2. Paso

Gráfica de la distribución de frecuencia para la población

Gráfica de la Población 0.205

Frecuencia Relativa 0.200

0.195 0

1

2

3

4

5

6

7

8

X

Esta gráfica no puede considerarse acampanada o normal. 3. Paso Se toman muestras de tamaño dos con remplazo. Muestra 0, 0 0, 2 0, 4 0, 6 0, 8 2, 0 2, 2 2. 4 2, 6 2, 8

X

0 1 2 3 4 1 2 3 4 5

Muestra 4, 0 4, 2 4, 4 4, 6 4, 8 6, 0 6, 2 6, 4 6, 6 6, 8

X

2 3 4 5 6 3 4 5 6 7

Muestra 8, 0 8, 2 8, 4 8, 6 8, 8

X

4 5 6 7 8

4. Paso Se agrupa a las medias muéstrales en la tabla de frecuencia siguiente: X

0 1 2 3 4 5 6 7 8

F 1 2 3 4 5 4 3 2 1 5. Paso Se calcula la media poblacional de medias , la varianza de la medias y desviación estándar de las medias ó error estándar de las medias. N

µx = ∑ i

µx =

f (X ) N

1(0) + 2 (1) +3 ( 2 ) + 4 ( 3 ) + 5 ( 4) +4 ( 5 ) +3 ( 6 ) +2 ( 7 ) +1( 8 ) 100 = =4 25 25

N

σ x2 = ∑ i

σ x2 =

f ( X − µx ) 2 N

1(0 − 4 ) 2 + 2 (1 − 4 ) 2 + ............1( 8 − 4 ) 2 100 = =4 25 25

σx = 4 = 2

6. 6. Paso Gráfica de la distribución de frecuencia para la población de medias maestrales Gráfica de la Población 5 Frecuencias 4

3

2

1 0

1

2

3

4

5

6

7

8

Medias muestrales

7. Paso

Conclusión De la apariencia acampanada de la distribución de las medias, concluimos que es razonable aproximar la distribución muestral de por una distribución normal, una vez que se conoce la media y la desviación estándar de la distribución muestral. x

Parámetro El término parámetro puede hacer referencia a: •

Parámetro estadístico. En Estadística se trata de una función definida sobre valores numéricos de una población, como la media aritmética, una proporción o su desviación típica.

Related Documents

Guia Ceneval
May 2020 6
Horarios Ceneval
May 2020 4
Ceneval 2
October 2019 7
Ceneval 6.docx
June 2020 7