CONTENIDO CAPITULO 1.................................................................................................................................... 5 INTRODUCCION ............................................................................................................................. 5 DEFINICION ................................................................................................................................ 5 CLASIFICACION ........................................................................................................................... 5 Población ................................................................................................................................... 5 Muestra ..................................................................................................................................... 5 Variable ..................................................................................................................................... 6 CLASIFICACION DE VARIABLE...................................................................................................... 6 Dato u observación .................................................................................................................... 6 Estadígrafo ................................................................................................................................. 6 Parámetros ................................................................................................................................ 6 PROCESO DE LA ESTADISTICA ..................................................................................................... 6 CAPITULO 2.................................................................................................................................... 7 ORGANIZACIÓN, CLASIFICACION E INDICADORES MUESTRALES ..................................................... 7 Frecuencia Absoluta ................................................................................................................... 7 Frecuencia Absoluta Acumulada................................................................................................. 7 Frecuencia Relativa .................................................................................................................... 7 Frecuencia Relativa Acumulada .................................................................................................. 7 Frecuencia Relativa Porcentual .................................................................................................. 7 Frecuencia Relativa Porcentual Acumulada ................................................................................ 7 Cantidad de intervalos ............................................................................................................... 8 Rango ........................................................................................................................................ 8 Amplitud de los intervalos .......................................................................................................... 8 REPRESENTACION GRAFICA ........................................................................................................ 9 Diagrama de Barras. ................................................................................................................... 9 Diagrama de Sectores. ..............................................................................................................10 Histograma de Frecuencia. ........................................................................................................10 Polígono de Frecuencias. ...........................................................................................................10 Ojiva de Frecuencias. ................................................................................................................11 ESTADIGRAFOS CENTRALES. ......................................................................................................14 1
Media Aritmética.- ................................................................................................................14 Media Aritmética Ponderada.- ..............................................................................................15 Mediana.-..............................................................................................................................15 Moda.- ..................................................................................................................................16 Relación Media, Mediana y Moda.- .......................................................................................17 Medidas Centrales Secundarias.- ...........................................................................................18 MEDIDAS DE AGRUPACION.- .....................................................................................................21
CUARTILES: ....................................................................................................................21
DECILES.- .......................................................................................................................22
PERCENTILES.- ...............................................................................................................23
MEDIDAS DE DISPERSION.-........................................................................................................25 Medida de dispersión Absoluta .................................................................................................25 RANGO INTERCUARTICO .......................................................................................................25 RANGO SEMI INTERCUARTICO ...............................................................................................25 DESVIACION MEDIA:..............................................................................................................25 VARIANZA Y DESVIACION ESTANDAR .....................................................................................26 MEDIDAS DE DISPERSION RELATIVA.- ........................................................................................29 Coeficiente de Variación:.......................................................................................................29 Momentos de una Distribución de Frecuencias.- ...................................................................30 MEDIDAS O ESTADIGRAFOS DE DEFORMACION.- ......................................................................30 MEDIDAS DE ASIMETRIA.- .........................................................................................................31 CAPÍTULO 3...................................................................................................................................35 PROBABILIDADES ..........................................................................................................................35 Experimento: ............................................................................................................................35 CLASIFICACION.-....................................................................................................................35 DEFINICIÓN DE PROBABILIDAD.- ...............................................................................................36 ALGEBRA DE EVENTOS.- ............................................................................................................36 Axiomas de Probabilidad .......................................................................................................37 PROBABILIDAD CONDICIONAL.-.................................................................................................42 ÁRBOL DE PROBABILIDADES ......................................................................................................42 Teorema de la multiplicación ................................................................................................43 TEOREMA DE PROBABILIDAD TOTAL Y TEOREMA DE BAYES ......................................................46 2
Teorema de Probabilidad Total..............................................................................................47 Teorema de Bayes .................................................................................................................47 EVENTOS INDEPENDIENTES Y SECUENCIAS DE EXPERIMENTOS INDEPENDIENTES .....................50 CAPITULO 4...................................................................................................................................54 VARIABLE ALEATORIA UNIDIMENSIONAL ......................................................................................54 Introducción .............................................................................................................................54 Definición..................................................................................................................................54 VARIABLE ALEATORIA UNIDIMENSIONAL DISCRETA...................................................................54 VARIABLE ALEATORIA UNIDIMENSIONAL CONTINUA .................................................................54 VARIABLE ALEATORIA UNIDIMENSIONAL DISCRETA ...............................................................55 Función o Ley De Probabilidad ..................................................................................................56 VARIABLE ALEATORIA CONTINUA ..............................................................................................62 FUNCIONES MIXTAS ..................................................................................................................65 FUNCIONES DE VARIABLE ALEATORIA .......................................................................................65 ESPERANZA MATEMATICA ........................................................................................................66 VARIANZA DE UNA VARIABLE ALEATORIA..................................................................................66 DEFORMACIÓN .........................................................................................................................67 Coeficiente de Asimetría .......................................................................................................67 Coeficiente de Curtosis..........................................................................................................67 CAPITULO 5...................................................................................................................................74 DISTRIBUCIONES DISCRETAS MÁS IMPORTANTES .........................................................................74 Experimento de Bernoulli:.........................................................................................................74 DISTRIBUCION BINOMIAL ..........................................................................................................75 DISTRIBUCION GEOMETRICA .....................................................................................................77 DISTRIBUCION HIPERGEOMETRICA............................................................................................78 DISTRIBUCION DE POISSON .......................................................................................................80 CAPITULO 6...................................................................................................................................83 DISTRIBUCIONES CONTINUAS .......................................................................................................83
Distribución Exponencial:...............................................................................................84
DISTRIBUCION NORMAL............................................................................................................84 PROPIEDAD REPRODUCTIVA......................................................................................................87 TEOREMA CENTRAL DEL LÍMITE ................................................................................................87 3
APROXIMACION A LA NORMAL .............................................................................................92 APROXIMACIÓN DE LA BINOMIAL .........................................................................................92 APROXIMACIÓN DE POISSON ................................................................................................92 CAPITULO 7...................................................................................................................................94 VARIABLE ALEATORIA BIDIMENSIONAL .........................................................................................94 COVARIANZA.............................................................................................................................95
4
CAPITULO 1 INTRODUCCION DEFINICION: La estadística es la ciencia que se ocupa de organizar un conjunto de datos, clasificar para luego hallar un conjunto de estadígrafos que representan a la muestra con el objetivo de generalizar resultados hacia la población asociados a un margen de certidumbre de coadyuvar en la toma de decisiones y posteriores inferencias.
CLASIFICACION Son dos: -
Estadística Descriptiva. Organizar, clasificar y hallar indicadores Estadística Inferencial. Generalizar por inferencia los resultados hacia la población y encontrar los márgenes de seguridad.
Población: Es el conjunto universo que guarda todas las características de un objeto de estudio. FINITO
INFINITO
Muestra: Es un subconjunto de la población que es representativa y tiene todas las características del objeto de estudio al proceso de determinar la muestra se denomina “MUESTREO” y existe diferentes formas de muestreo. i. ii. iii. iv. v. vi.
Muestro por Atributo. Sabor, color, olor. Cualitativo. Muestro por Variable. Todas las características que se pueden medir: presión, temperatura y otros. Muestreo por Conglomerados. De la población se saca una muestra. Muestreo Estratificado. Divide a la población en grupos o categorías y luego analiza que grupo obtendrá la muestra. Muestreo Aleatorio. Está ligado al azar. Muestreos Mixtos. El conglomerado estratificado y el estratificado aleatorio.
Para determinar “n” tamaño de la muestra es necesario considerar la población “N” un margen de error (5 al 8%) una probabilidad asociada al margen de error según una distribución normal. Mayor de Significancia:
3% → Z
Probabilidades de éxito (p) y fracaso (q). p = q = 0,5. Preencuesta al 5 o 10%. Población: 5
¿ → SI → p ? → NO → q
Variable: Es la característica del objeto de estudio. CLASIFICACION DE VARIABLE
Variable Cuantitativa. Ponderable y medible: presión, temperatura, longitud, etc. Variable Cualitativa. No se puede medir: color, olor y sabor. Variable Discreta. Se adquiere un único valor dentro de un intermedio. Ejemplo: Cantidad de Producción. Variable Continua. Adquiere infinitos valores dentro de un intermedio.
Dato u observación. Valor numérico de la variable. Estadígrafo. Son indicadores que representan a la muestra: centrales, de dispersión y de deformación.
Parámetros. Son indicadores de la población. PROCESO DE LA ESTADISTICA 1) Obtener la información. Planificación. Encuesta (Estudios de mercados: Segmentos de población → Error). Entrevistas (Cantidad de productos que se produce, fuente entrevistada). Datos Históricos (Registro de los cambios que tiene variable, modelos de aplicación, mantenimiento y producción). 2) Organizar, clasificar y obtener indicadores. 3) Inferir resultados. → Control de Calidad. Indicador. Valor representativo de la muestra. (Estadígrafo) -
Razones: Relación de un subconjunto del universo. Proporciones: Razón en intervalos. Tazas: Son en porcentajes.
Índices. Cantidad de economía y precio. (Q.P.) Periodo Base.
6
CAPITULO 2 ORGANIZACIÓN, CLASIFICACION E INDICADORES MUESTRALES Los datos “xi” provenientes de un objeto de estudio deben clasificarse y organizarse según el criterio de preferencia.
Frecuencia Absoluta: Se define como la cantidad de veces que se repite un dato. Simbolizado por “fi”.
Frecuencia Absoluta Acumulada: Simbolizada por “Fi” se define como la sumatoria de las frecuencias absolutas anteriores e iguales al nivel de la i-ésima frecuencia absoluta. ∑
Frecuencia Relativa: Se define como la razón de la frecuencia absoluta a la cantidad total de observaciones. Simbolizada por “h i”.
Frecuencia Relativa Acumulada: Simbolizada por “Hi”. Se define como la sumatoria de las frecuencias relativas anteriores e iguales al nivel de la i-ésima hi. ∑
Frecuencia Relativa Porcentual:
Frecuencia Relativa Porcentual Acumulada:
Cuando la cantidad de observaciones “n” es menor a 60, los datos se ordenan en una tabla de frecuencias llamada de datos no agrupados.
7
Tabla de frecuencias DATOS Xi fi Fi hi Hi hi x 100% X1 f1 f1 h1 h1 h1 x 100% X2 f2 f1 + f2 h2 h1 + h2 h2 x 100% X3 f3 f1 + f2 + f3 h3 h1 + h2 + h3 h3 x 100% ...... ..... ...... ...... ...... ...... Xn ∑ Fi ∑ Hi fn hn hn x 100% Si n≥60 los datos deben agruparse previamente en intervalos. Intervalos Aparentes. [ Intervalos Reales. [
Hi x 100% h1 x 100% (h1+h2) x 100% (h1+h2+h3) x 100% ...... ∑ (Hi x 100%)
] ]
Es posible transformar un intervalo real en aparente restando y sumando la mitad de la unidad de la medida a cada límite.
Cantidad de intervalos. Simbolizada por: i. ii.
√
Entonces se trabaja por exceso o por defecto.
Por defecto Por exceso
Rango. Amplitud de los intervalos.
Simbolizada por “c”, puede ser amplitud
constante.
Se cumple: Puede ser la amplitud variable. “c” es distinto en cada intervalo y depende del investigador. Marca de Clase. Simbolizada por “Xi” y se define como el promedio de los límites de cada intervalo.
8
Con todo lo anterior se forma una tabla de frecuencia de datos agrupados. Marca
[Linf - Lsup] de Clase Xi X1 X2 X3 ...... Xn
L1 - L2 L2 - L3 L3 - L4 ...... ......
TOTAL
fi
Fi
hi
Hi
hi x 100%
Hi x 100%
f1 f2 f3 ..... fn n
f1 f1 + f2 f1 + f2 + f3 ...... n
h1 h2 h3 ...... hn 1
h1 h1 + h2 h1 + h2 + h3 ...... 1
h1 x 100% h2 x 100% h3 x 100% ...... hn x 100% 100%
h1 x 100% (h1+h2) x 100% (h1+h2+h3) x 100% ...... 100%
Datos e intervalo Propiedades. i. ii. iii. iv. v. vi.
∑ ∑ ∑
Las columnas de la tabla de frecuencia muestran en sí mismas indicadores objetivos. → →
.
REPRESENTACION GRAFICA
Evolución de la variable
Diagrama de Barras. Se pueden tener diagramas simples y dobles de barra. 10
10
8
8
6
6
4 2
4
0
2
1
2
3
Tiempo
4
Región 1
Región 2
0 1
2
3
4
9
Diagrama de Sectores. → →
10
7 6 5 4 3 2 1 0
8 Fi x Hi
fi x hi
Histograma de Frecuencia.
6
Creciente. Mayor que
4 2
Decreciente. Menor que
0 1 1
2 Linf
3
4
2
3
4
Hi
Polígono de Frecuencias.
10
Ojiva de Frecuencias.
Diagrama tallo y hojas. Ordenar los datos. TALLO HOJAS 1 1,2,5,6,6,8 2 0,3,5,8 3 3,4
11, 12, 15, 16, 16, 15, 20, 23, 25, 28, 33, 34 EJERCICIO 1. Los diámetros en [cm] de 50 cojinetes fabricados por una cierta compañía se muestran en la siguiente tabla. Se pide: a) Forme una tabla de frecuencias para datos agrupados. b) Que porcentaje de los cojinetes tiene un diámetro ente 0,532 y 0,542. c) Se sabe que el 25% de los cojinetes tiene una dimensión superior a “ ”, hallar el valor de “ ”. d) Que cantidad de cojinetes tiene un diámetro 0,525 y 0,538. e) Trace el histograma, el polígono de frecuencias absolutas y la ojiva menor que de frecuencias relativas acumuladas. 0,529 0,537 0,524 0,534 0,539 0,539 0,532 0,538
0,543 0,535 0,540 0,531 0,535 0,535 0,536
0,536 0,540 0,529 0,536 0,527 0,527 0,532
0,536 0,542 0,544 0,535 0,525 0,536 0,528
0,535 0,533 0,534 0,526 0,546 0,535 0,535
0,532 0,534 0,528 0,537 0,542 0,529 0,530
0,540 0,541 0,537 0,538 0,530 0,545 0,532
a) Diagrama de tallos y hojas TALLO 0,52 0,53 0,54
HOJAS 9,4,9,7,8,7,6,5,8 7,4,7,8,0,5,1,2,8,0,9,6,6,9,2,2,5,6,5,5,6,6,5,3,4,5,5,5,2,4,7 0,1,3,0,5,0,2,4,6,2 11
√
√
,
0,524-0,528 0,528-0,532 0,532-0,536 0,536-0,540 0,540-0,544 0,544-0,548 0,548-0,552
0,526 0,530 0,534 0,538 0,542 0,546 0,550
5 7 16 12 7 3 0 50
5 12 28 40 47 50 50
0,10 0,14 0,32 0,24 0,14 0,06 0 1
0,10 0,24 0,56 0,80 0,94 1 1
10% 14% 32% 24% 14% 6% 0% 100%
10% 24% 56% 80% 94% 100% 100%
1 0,90 0,76 0,44 0,20 0,06 0
b) %0,532 - 0,542 (
)
c) 25% dimensión superior De 0,552-0,548 es 0%. De 0,548 a 0,544 es 6%. De 0,544 a 0,540 es 14%. De 0,540 a 0,536 es 24%, necesitamos el 5 % superior. ( (
) ) ⁄
d) 0,525-0538 % De 0,524-0,528 es 5%. De 0,528 a 0,532 es 7%. De 0,532 a 0,536 es 16%. De 0,536 a 0,540 es 10%. (
)
(
)
12
e)
EJERCICIO 2. Se conoce los siguientes datos del peso de un grupo de estudiantes. Además se sabe que las frecuencias relativas de los intervalos 2 y 5 son iguales al igual que de los intervalos 1 y 4 con esos datos completar la tabla de frecuencias y determinar cuál es el porcentaje de estos clientes que tiene un peso por encima de los 45 kilos. Si el 35% tiene un peso entre 45 kilos hacia determinar el valor de . Intervalo: , 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 TOTAL
25 35 45 55 65
5 5 30 5 5 50
5 10 40 45 50
0,10 0,10 0,60 0,10 0,10 1
0,10 0,20 0,80 0,90 1
13
b) % > 45 kilogramos. De 70 a 60 kilogramos es el 10%. De 60 a 50 kilogramos es el 10%. De 50 a 40 kilogramos es el 60%, buscamos el porcentaje mayor a los 45 kilogramos. (
)
c) 45% < x < 35% estimado. De 60 a 50 kilogramos es el 10%. De 50 a 40 kilogramos es el 60%, buscamos el porcentaje mayor a los 45 kilogramos hasta (35%). De 45 a 50 kilogramos es el 30%. El 5% está entre 50 y . (
)
ESTADIGRAFOS CENTRALES. Denominados también medidas de tendencia central muestran valores centrales del conjunto de datos sobre los cuales están alrededor las observaciones. Los principales son:
Media Aritmética Mediana Moda Medidas Secundarias
Media Aritmética.- Simbolizada por “̅” y se define como el promedio de todas las observaciones para datos no agrupados. o DATOS NO AGRUPADOS. ∑ o DATOS AGRUPADOS. Se define como el promedio ponderado de las marcas de clase. ∑
∑
Dónde: k = cantidad de intervalos. = i-esima frecuencia absoluta 14
= i-esima frecuencia relativa = i-esima marca de clase n = cantidad de datos Ventajas y Desventajas - Es manipulable algebraicamente - Es de cálculo sencillo - Es sensible a valores extremos Propiedades: ( i. ∑
)
ii.
Si la variable Entonces:
tiene media :
iii.
Si
es la media
iv.
Si
es la media de
→
:
:
:
Media Aritmética Ponderada.- Se presenta cuando en “k” lugares distintos se ha hecho un mismo estudio con tamaño de muestra y sus propias medias aritméticas . Es posible hallar una media global llamada una media aritmética ponderada. ∑ ∑ En algunas ocasiones en lugar de “n” se utilizan factores de producción “ representan la importancia de una muestra respecto a las otras.
” que
Mediana.- Simbolizada por “ ̃” y se define como el valor central que divide la cantidad de datos en dos partes iguales. o DATOS NO AGRUPADOS i. Si: n = par ̃
15
̃
Ejemplo: ii.
Si: n = par
̃ ̃
Ejemplo: o a) b) c)
DATOS AGRUPADOS Calculamos n/2. Buscamos en la columna de Intervalo que contiene a: n/2 (Intervalo de la mediana) ̃
(
)
y si no tenemos “n”:
̃
(
)
Dónde: Cantidad de datos Límite inferior del intervalo de la mediana Frecuencia acumulada del intervalo de la mediana Frecuencia acumulada anterior al intervalo de la mediana y Frecuencia relativa y relativa anterior al intervalo de la mediana Amplitud del intervalo de la mediana Ventajas: Es de fácil cálculo Es las más óptima si existen datos extremos Desventajas: No es manipulable algebraicamente No toma en cuenta a todas las observaciones Moda.- Simbolizada por:” ( )” se define como el dato o valor que se repite más veces (aquel que tiene la mayor frecuencia absoluta). o
DATOS NO AGRUPADOS ( )
o
DATOS AGRUPADOS
16
frecuencia del intervalo modal frecuencia anterior al intervalo modal frecuencia posterior al
intervalo
moda
Entonces: ( )
(
)
Límite inferior del intervalo modal Amplitud del intervalo modal Ventajas y Desventajas -
Es de fácil cálculo. Se adecúa cuando existe intervalo que se repite mas veces. No siempres es un valor unico (bimodal, trimodal). No toma en cuenta a todas las observaciones.
Relación Media, Mediana y Moda.- Las tres medidas se relacionan por la siguiente manera:
17
( )
̃
̃
( )
Una ecuación empírica: (
( )
̃)
Medidas Centrales Secundarias.- Son las medidas asociadas a progresiones. Media Geométrica. o DATOS NO AGRUPADOS √ o DATOS AGRUPADOS √ ∏ Media Cuadrática. o DATOS NO AGRUPADOS √ o DATOS AGRUPADOS √ √
18
Media Armónica.
o DATOS NO AGRUPADOS
o DATOS AGRUPADOS ∑ ∑ EJERCICIO 3. Una distribución de frecuencias consta de 5 intervalos de clase e igual amplitud y de ellas se conocen los siguientes datos: . a) Completar la tabla de distribución de frecuencias. b) Hallar el valor de la media aritmética, mediana y moda. c) Calcular la media geométrica y cuadrática.
a) ,
-
12,5-17,5 17,5-22,5 22,5-27,5 27,5-32,5 32,5-37,5 TOTAL
15 20 25 30 35
20 30 10 30 20 110
20 50 60 90 110
0,182 0,273 0,09 0,273 0,182 1
300 600 250 900 700 2.750
4.500 12.000 6.250 27.000 24.500 74.250 →
19
∑
b) Media Aritmética: Mediana: ̃
(
)
.
( )
Moda:
.
( )
/
/
(
.
/
)
c) Media Geométrica √
√
Media Cuadrática √
√
EJERCICIO 4. Se tiene una población dividida en 2 grupos de diferentes tamaños, el primer grupo tiene un ingreso medio de Bs.- 8000 y el segundo tiene un ingreso medio de Bs.- 4000. Si el ingreso medio total es de Bs.- 2500. ¿Qué porcentaje de la población está en cada grupo? Cantidad 1er Grupo 2do Grupo
Media ( ) Bs.- 8000 Bs.- 4000
Media Aritmética Ponderada:
20
Pero:
(
) (
( )
) (
)
Además:
(
)
(
)
MEDIDAS DE AGRUPACION.-
Son valores que representan a las observaciones cuando se las agrupa de acuerdo a algún criterio predeterminado. Las medidas de agrupación más conocidas son:
Cuartiles Deciles Percentiles
CUARTILES: Son valores que representan a los datos cuando se los agrupa de
¼ en ¼; 25% en 25%.
Se los simboliza por “
”
21
En consecuencia:
𝑄
𝑛 𝑄
𝐿𝑖𝑛𝑓
𝐹𝑘
𝐹𝑘
𝐹𝑘
𝑛 𝑄
𝐿𝑖𝑛𝑓
𝐹𝑘
𝐹𝑘 𝐹𝑘
𝑥̃
o
𝑐
𝑐
o
𝑄
𝑄
𝐿𝑖𝑛𝑓
𝐿𝑖𝑛𝑓
𝐻𝑘
𝐻𝑘
𝑟
𝐻𝑘
𝑟
𝐻𝑘 𝐻𝑘
𝐻𝑘
𝑐
𝑐
DECILES.- Son valores que representan a los datos cuando se los acumula de 1/10 en 1/10; de 10% en 10%.
22
Entonces:
𝐷𝑠 𝑖𝑛
𝐷𝑖
𝐿𝑖𝑛𝑓
𝐹𝑘
𝐹𝑘 𝐹𝑘
𝑥̃ 𝑖
𝑐
𝐷𝑖
𝐿𝑖𝑛𝑓
𝐻𝑘
( 𝐻𝑘
𝐻𝑘
)
i = 1, 2, 3,… , 9
Donde
PERCENTILES.- Son valores que representan a los datos si se los acumula de 1/100 en 1/100 o en 1% en 1% y se simboliza “ ”.
Entonces:
𝑃 𝑖𝑛
𝑃𝑖
Dónde:
𝐿𝑖𝑛𝑓
𝐹𝑘
𝐹𝑘 𝐹𝑘
𝑥̃ 𝑖
𝑐
𝑃𝑖
𝐿𝑖𝑛𝑓
𝐻𝑘
𝐻𝑘 𝐻𝑘
𝑐
i = 1, 2, 3,… , 99
EJEMPLO 5. Se han elegido150 productos para analizar sus pesos en gramos los resultados están clasificados en la siguiente tabla. Si se sabe que la media aritmética es 2,14 y la medina es igual a 2,125 se pide: a) Reconstruir la tabla de frecuencias b) Hallar los dos cuartiles c) Encontrar el tercer decil y el 87vo percentil
23
Linf - Lsup 2,00 – 2,04 2,04 – 2,08 2,08 – 2,12 2,12 – 2,16 2,16 – 2,20 2,20 – 2,24 2,24 – 2,28 2,28 – 2,32 Total
x 2,02 2,06 2,10 2,14 2,18 2,22 2,26 2,30
f1 12 28 38 x = 25 y = 21 z = 17 9 8 150
̅ ̅
F 12 32 70 70+x 70+x+y 70+x+y+z 79+x+y+z 150
fi xi 24,24 41,28 79,8 2,14x 2,18y 2,22z 20,34 18,4
̃
∑
̅ ( ) ∑
También
( ) Por ultimo Mediana
̃
(
) (
En (2)
)
→
24
(
En (1)
)
(
)
→
b) (
)
→
→ (
)
→
→
Decil (
(
)
→
)
→
MEDIDAS DE DISPERSION.- Los estadígrafos de dispersión muestran cuan dispersos se encuentran las observaciones respecto a un valor central.
Medida de dispersión Absoluta RANGO INTERCUARTICO RANGO SEMI INTERCUARTICO
DESVIACION MEDIA: Se define como el promedio ponderado del valor absoluto de las desviaciones respecto a algún valor central:
25
(
)
|
∑
|
Generalmente se utiliza la media aritmética a la mediana:
( ̅)
∑
|
̅|
∑
( ̃)
|
̃|
La desventaja de la desviación media es que no toma en cuenta el signo de la desviación y no es manipulable algebraica.
VARIANZA Y DESVIACION ESTANDAR La varianza simbolizada por “ ” se define como el promedio ponderado de cualidad de la desviación de las marcas de clase respecto a la media aritmética. Existen dos formas de varianza de muestras y la poblacional.
Varianza Muestral:
∑ ( )
(
̅)
( )
Desviación estándar o Típica.- Se define como la raíz cuadrada de la varianza
∑ √
(
̅)
26
Varianza Poblacional.- Si el tamaño de la población es “N” y asumimos que: ̅
( )
(Media poblacional)
( )
∑
̅)
(
La desviación Estándar:
( )
∑ √
Si n>120
se considera
El hecho de asumir que
(
̅)
( )
̅
Implica validar la anterior afirmación mediante una previa de Hipótesis. Geométricamente la desviación estándar se la puede analizar a partir de los intervalos en una curva de frecuencias simétrica.
27
Se considera que [ ̅ ̅ ( ) ( ) ] se encuentra el 99,9999% de las observaciones. Una expresión más simple de la varianza muestral, le obtenemos de: (∑
( )
(∑
( )
(
̅
̅) )
∑
(∑
( )
∑ )
̅
)
𝑘
𝑆
(𝑥)
𝑛
(∑ 𝑓𝑖 𝑥𝑖
𝑛 𝑥̅ )
𝑖
Propiedades: i) ii) iii)
iv) v)
( ) ( ) (
)
(
)
( )
( )
28
VARIANZA GLOBAL.- Si se tienen “K” muestras de tamaño n 1 , n2, … nn con sus ̅̅̅̅ y sus respectivas varianzas propias medias aritméticas, ̅̅̅ ̅̅̅ ̅̅̅ ( ) ( ) todas de un mismo objeto de estudio es posible hallar ( ) ( ) una varianza a partir de;
𝑆
∑𝑘𝑖 (𝑛 (𝑥)
) 𝑆𝑖
(𝑥)
𝑀 Intravarianza
∑𝑘𝑖 𝑛𝑖 (𝑥 ̅̅̅ 𝑀𝑖
𝑥𝑝 )
intervarianza
Donde
̅̅̅̅
∑
̅̅̅
MEDIDAS DE DISPERSION RELATIVA.- Nos permite ponderar la dispersión con forma proporcional a la razón del porcentaje Coeficiente de Variación: ̅ Si el CV(x) > 50% esto significa alta dispersión, la concentración es baja, en consecuencia la media aritmética no es representativa. -
Si el CV(x) < 50 % significa baja dispersión por ello es alta concentración F 1 h1
F 1 h1
L1 CV > 50 %
L1 CV < 50 %
29
Momentos de una Distribución de Frecuencias.- Se define los momentos del grado “r” de una distribución de frecuencias:
∑
(
)
( )
VC valor elegido central Si el VC momentos respecto al origen:
∑ ̅
( )
∑ ̅
( )
∑ ̅
( )
Si el VC = ̅ ( ̅)
∑
∑
̅)
(
=0
̅)
(
( ̅)
( )
∑
(
̅)
( ̅)
MEDIDAS O ESTADIGRAFOS DE DEFORMACION.Buscan ponderar la deformación en horizontal o vertical de la curva de distribución de frecuencia.
30
MEDIDAS DE ASIMETRIA.- Ponderar el grado de deformación horizontal de la curva de distribución de frecuencia, mediante el llamado coeficiente de Frecuencia, mediante el llamado coeficiente de asimetría.
Existen dos coeficientes de Curtosis: ( Si
)
k1 > 0,263
→
Platicurtica
k1 = 0,263
→
Mesocurtica
k1 < 0,263
→
Leptocurtica
El segundo coeficiente de curtosis es:
( ̅) ( )
si
k2 = 3 Mesocurtica k2 > 3 Platiturca k2 < 3 Leptocurtica
EJEMPLO. Una compañía tiene 100 trabajadores profesionales; para el máximo el haber básico es de 450$ y el mínimo de 60 $ mensuales. Hay un 5% de practicantes que trabajan que perciben haberes inferiores a los 60 $, 15 profesionales perciben haberes inferiores a 250 $, el 85% de los profesionales perciben haberes inferiores a 400 $, con esta información calcular: a) Los dos cuartiles, el sexto decil y P88 b) ¿Cuántos trabajadores ganan mas de 200$? c) Las tres medidas centrales 31
d) EL coeficiente de variación e) El coeficiente de asimetría y curtosis Sol.
n=100 Haber básico es de 450 $ - Haber mínimo de 60 $ 5% de practicantes trabajan que perciben haber inferior a 60 $ 15 profesionales perciben haber inferior a 250 $ 85% tiene un haber inferior a 400 $
Linf – Lsup 0 - 60 60 - 250 250 - 400 400 - 450 Total
̅ 30 155 325 425
f1 5 10 70 15 100
a)
F1 5 15 85 100
h1 0,05 0,10 0,70 0,15 1
̅̅̅ 150 1550 22750 6375 30825
H1 0,05 0,15 0,85 1
f1
f1 ̅̅̅ 4500 240250 7393750 2709375 10347875
Q1 = n/4 = 100/25 =4 ( → → →
)
→ (
) (
→
) (
→ )
→
b)
32
(
) ∑
̅
c)
̃
→
̃
(
)
→
̃
MODA ( )
→
(
( )
(
)
(
)
)
→
d) ( )
*∑
̅ +
→
( )
→
( )
* ( )
( )
alto concentrado
̅
Coeficiente de Asimetría: ( ̅ ̃) (
)
( )
(
) +
(
(
) (
)
→ (
)
)
33
EJEMPLO. Una muestra de 130 alumnos se divide en dos subgrupos A y B. el profesor del subgrupo A encontró una calificación media de 14 con una desviación típica de 3 y el profesor del grupo B encontró una media de 12 pero olvido calcular la varianza. El coordinador del curso afirma que en el grupo B hay 70 estudiantes y la varianza global de ambos grupos es de 8. Calcular la desviación estándar del grupo B. Sol. ;
( )
Grupo A
Grupo B
̅
̅ ( )
( )
→
→
Media ponderada
̅
̅
)
∑(
( )
∑
( ̅
̅ )
( )
(
)
(
( )
(
) )
(
( )
)
) (
( )
)
( )
( ( )
(
→
(
)
) ( )
34
CAPÍTULO 3 PROBABILIDADES Experimento: Se define como la realización de un ensayo en el espacio muestral, cuyo resultado llamado evento o suceso puede ser predeterminado o no.
CLASIFICACION. Experimento determinístico: Son aquellos en los que el resultado se puede predecir mediante un modelo. Experimentos aleatorios: El resultado no es posible predecirlo hasta realizar el ensayo en consecuencia existe una probabilidad de que suceda o no. Ejemplo.- Control de calidad es muy aleatorio c/c
Si
Aproximado
No
En estadística nos interesa los experimentos aleatorios. Evento o suceso: Es un posible resultado de un experimento aleatorio, se da en un espacio muestral. Espacio Muestral: El conjunto universo que contiene a todos los posibles resultados de un experimento se simboliza “ Ω “. El espacio muestral puede determinarse por: -
Análisis Combinatorio: Permite hallar la cantidad y el orden (arreglo, permutación o combinación) Cardinal de un conjunto muestral: Cantidad de elementos del conjunto 35
-
Realización del experimento
DEFINICIÓN DE PROBABILIDAD.-
Existen
tres
maneras
de
definir
probabilidad
Definición de La Place: La probabilidad de un evento o suceso. A dentro del espacio muestral es la razón de la cantidad de veces en las que se puede dar el evento A a la cantidad de opciones disponibles en el espacio muestral. Se simboliza ( ) ( )
Definición de frecuencias: Si un evento o suceso A se repidte “f” veces de un total de ensayo “n” , la probabilidad de A es la frecuencia relativa ( )
Definición subjetiva: La probabilidad de un evento o suceso A viene dado por: ( ) ( ) ( )
ALGEBRA DE EVENTOS.- Al ser subconjunto, son susceptibles de
operarse mediante el álgebra de conjuntos.
⋃
⋂
* ⁄
* ⁄
+
+
36
*
+
*
+
*
+
En cardinales: (
)
( )
( (
) )
( ) ( )
( ) (
)
(
)
(
)
( ) ( )
(
)
( )
Axiomas de Probabilidad ( ) i. ( ) ( ) ii. ( ) ( ) ( ) ( ) iii. ( ) iv. ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( v.
)
(
)
EJEMPLO: Ocho personas compiten por un puesto publico los 4 primeros candidatos tienen la misma oportunidad de ganar, el quinto candidato tiene el doble de oportunidad que los candidatos anteriores y los 3 ultimos tienen el triple de oprtunidad que el quinto candidato.¿cual es la probabilidad que gane el quinto candidato? ( )
( )
( )
( )
( )
( )
( ) ( )
( )
Los eventos excluyentes P (1∩2)=0 , entonces:
37
( )
( )
( )
( )
( )
( )
(
Finalmente:
( )
( )
)
(
)
( ) (
( ) )
. /
EJEMPLO: Un muchacho parado en una esquina lanza una moneda si cae cara camina una cuadra al este, si caes sello camina una cuadra al oeste. En cada esquina repite la operación. Cuál es la probabilidad que despues de 6 lanzamientos este: a) En el punto de partida b) A dos cuadras del punto de partida Cara: 1 cuadra al este Moneda
Numero de tiros=6 Sello: 1 cuadra al oeste
a) A= Este en el punto de partida b) B= Este a dos cuadras del punto de partida a) Para el inciso tenemos: * + Entonces:
( ) b)
* + ( )
38
EJEMPLO: En una urna hay 2 bolas azules, una blanca y tres rojas. Se van a extraer al azar 2 bola. Calcule usted la probabilidad que las 2 bolas sean rojas o una blanca y otra azul. 2 azules 1 blanca
se extraen 2 bolas
3 rojas 6 total Para el espacio muestral:
A: 2 bolas son rojas
Finalmente:
B: 1 blanca y 1 azul
(
) (
( )
( )
(
)
)
EJEMPLO: El gerente de una planta situada en las orillas de un rio sabe que en un pleito que se avecina en la corte la compañía puede ser culpable de contaminar el rio, más aun él sabe que si lo encuentran culpable, la compañía tendrá que instalar un sistema de purificación, pagar un multa a ambos. Hasta ahora solo un 10% de la compañías en casos similares han tenido que pagar la multa e instalar un sistema de purificación; adicionalmente, cuando la decisión de la corte no obliga a las 2 penas, una compañía a tenido 3 veces la probabilidad de ser multada que de ser requerida para instalar un sistema de purificación. Si el 28% de las compañías han sido culpables. ¿Cuál es la probabilidad que esta compañía sea requerida para instalar un sistema de purificación? A= Instalar un sistema de purificación B= pagar la multa En un 10% tienen ambos castigos:
(
) 39
( ( )
) (
( )
) ( )
( )
(
Además:
(
)
* ( ) (
( )
)+
( )
(
)
( )
)
( )
( )
( )
( )
(
) ( )
Resolviendo sistema con (1) y (2) ( ) ( )
( ) ( )
( ) P(A)=0.145 EJEMPLO: Un vendedor está tratando de vender un artefacto a tres clientes. Sea A, B y C, los eventos de hacer una venta al primer, segundo y tercer cliente respectivamente. La probabilidad que el primer cliente o el segundo pero no el tercero comprarían es 0.65; la probabilidad que el primero y el segundo cliente comprarían es 0.20. La probabilidad que haya una venta al primero pero no al tercero es 0.25. La probabilidad que el segundo no compra pero el tercero si es 0.30 ¿Cuál es la probabilidad que solo uno de los dos primeros compran pero no el tercero? A= se vende al primer cliente B= se vende al segundo cliente C= se vende al tercer cliente Para el problema tenemos: )
((
)
(
)
(
) 40
(
(
))
( (
)
)
*,
(
)
((
)- ,
)-+
(
Por axiomas: )
)
(
(
)
,(
) (
(
)
((
(
)
* (
)
(
)
))+
(
(
)
(
)
( )
(
(
))
( )
(
Además:
)
) (
( )
((
) (
))
(
)
(
)
))
Por otro lado:
(
)
POP: ( ( )
( )
( )
)
(
)
(
)
(
)
Reemplazando los valores hallados: ( )
( )
( (
( )
)
(
)
(
)
((
)
)
( )
(
)
( )
(
(
)
(
)
)
Como no podemos determinar el valor directamente hallaremos el intervalo donde se encuentra la respuesta: Mínimo: ( )
(
)
Máximo: ( )
(
)
propiedad solicitada =0 1
propiedad solicitada=0.8 41
EJEMPLO: De 250 empleados 130 fuman cigarrillos. Hay 150 hombres trabajando de los cuales 85 fuman cigarrillos. Cuál es la probabilidad que un empleado seleccionado al azar:
HOMBRE MUJER TOTAL
a)
FUMA 85 45 130
NO FUMA 65 55 120
(
) (
a) No fume cigarrillos b) Sea mujer y fume cigarrillo c) Sea hombre o fume cigarrillos
TOTAL 150 100 250
(
)
( )
)
(
)
b) (
)
(
c)
) (
( )
( )
(
)
)
PROBABILIDAD CONDICIONAL.- Es la probabilidad de un evento A condicionada, sujeta a que un evento B ya ha sucedido. NOMENCLATURA: ( ⁄ )
(
) ( )
Dado que B ya ha sucedido pero: (
)
( ⁄ )
( )
( ⁄ )
Entonces
ÁRBOL DE PROBABILIDADES
42
Si en un espacio muestral existan B1, B2, B3, B4……BK eventos que se pueden dar a conocer dónde:
Es posible crear un árbol de probabilidades para un evento A común a todos ellos por lo que se tiene. Entonces para hallar la probabilidad de un evento A se multiplica y luego se suman las probabilidades de todas las ramas que conducen a A.
Teorema de la multiplicación ( Entonces
)
(
)
(
⁄ )
(
) ( )
( )
( )
Axiomas
(
⁄ )
( ⁄ )
( ⁄ ) ( ⁄ )
(
⁄ )
EJEMPLO: Suponga que 2 artefactos electrónicos defectuosos han sido incluidos en un embarque de 6 de estos artículos. El departamento de recepción de la compañía compradora empieza a probar los 6 artículos 1 a 1. Cuál es la probabilidad que: a) El ultimo articulo defectuoso sea encontrado en la cuarta prueba b) A lo más 4 artículos necesitan probarse para localizar los 2 defectuosos. 6 artículos
2 defectuosos 4 no defectuosos
A= el segundo defectuoso se obtenga en la cuarta prueba 43
B= a lo mas en la cuarta prueba se obtengan los 2 defectuosos
a) (
⁄
)
(
) (
)
( ) b) ( ) ( )
44
EJEMPLO: Un cazador tata de matar un oso la probabilidad que aparezca en un radio menor que R1 es de 0.10, entre un radio R1 y R2 es 0.3 y en un radio mayor a R2 es 0.2. Si aparece un oso en radio menor que R1 el cazador será capaz de matarlo con una probabilidad de 0.7; con una probabilidad de 0.5 si aparece en un radio entre R1 y R2; con una probabilidad de 0.2 si el radio es mayor que R2.¿Cuál es la probabilidad que el cazador mate al oso? (
)
(
) (
(
)
(
……………1)
⁄
)
(
)
)
…………….2)
…………………..3)
(
De 1:
) (
)
(
De 2:
(
)
)⁄ ( (
) )
(
De 3:
)
(
) (
( )
( )
)
(
)
Finalmente para P (mate) (
)
(
) (
(
( )
)
)
EJEMPLO: Se tiene 5 urnas numeradas del 1 al 5 y 5 bolas numeradas de 1 a 5. Se coloca al azar una bola en cada una. Cuál es la probabilidad de que: a) Al menos una bola sea colocada en la urna que tiene su numero b) Exactamente una bola sea colocada en la urna que tiene su mismo numero
45
A A= Exactamente 1 bola se coloca en la urna del mismo numero
( ) B= Al menos 1 ( )
( )
( )
( )
( )
TEOREMA DE PROBABILIDAD TOTAL Y TEOREMA DE BAYES Cuando un espacio muestral se divide en B1, B2, B3…Bk particiones siendo y se tiene un evento de A mediante
De la probabilidad condicional: ( ⁄ ) Despejando:
(
)
(
) ( )
( )
( ⁄ )
Entonces:
46
( )
(
)
(
)
(
)
(
(
)
)
(
)
(
)
(
)
Teorema de Probabilidad Total ( )
∑ ( )
( )
Si el evento A ha sucedido y se desea averiguar en cuál de las particiones se ha originado entonces se busca: ( ) ( )
(
)
(
( )
) ( )
Teorema de Bayes ( ) ( )
∑
( )
( )
. /
EJERCICIO. Una urna contiene 2 esferas blancas y 3 azules; una segunda urna contiene 3 blancas y 4 azules, se extrae aleatoriamente una esfera de la urna 1 y se la coloca en la segunda urna luego se extrae aleatoriamente una bola aleatoriamente de esta última urna. Calcular la probabilidad de que esta última sea blanca. Sol.
I
II
2B
3B
3A
4A
5 Total
7 Total
A = la bola extraída de la urna II sea blanca
47
𝑃 (𝐵) 𝑃 (𝐵)
𝑃 (𝐴)
𝑃 (𝐴)
( ) ( ) EJERCICIO. Tres máquinas I, II, III, se manufacturan el 35%,25% y el 40% de la producción total de un cierto artículo. Las maquinas producen el 3, 4,5 % de defectuosos respectivamente. Se toma un artículo al azar y resulta ser defectuoso. ¿Cuáles la probabilidad de que haya sido manufacturado en la maquina I, maquina II, maquina III? Sol. Maquina I Maquina II Maquina III
% Producción 35 25 40
% Defectuosos 3 4 5
Se toma al azar 1 y es defectuoso
𝑃 (𝐼)
𝑃(𝐼𝐼 ) 𝑃(𝐼𝐼𝐼 )
𝐷 𝑃( ) 𝐼 𝐷 𝑃( ) 𝐼𝐼 𝑃(
𝐷 ) 𝐼𝐼𝐼 48
( )
( )
( )
( )
( )
(
)
(
)
( ) ( ) . /
Pero: Por Bayes: ( )
( )
( )
( )
( )
(
)
( )
( ) ( )
(
)
( ( )
)
( )
( )
( )
( )
(
)
(
)
EJEMPLO. Una compañía de petróleo debe decidir, si taladra o no, un lugar determinado que la compañía tiene bajo contrato por investigaciones geológicas practicadas. Se sabe que existe una probabilidad de 0.45 que una formación tipo 1 se extiende bajo el lugar prefijado para taladrar; 0.3 de probabilidad que existe una formación tipo 2, 0.15 de probabilidad que existe una formación tipo 3 y 0.10 de tipo 4. Estudios anteriores indican que el petróleo se encuentra en un 30% de las veces en las formaciones de tipo 1, un 40% en el tipo 2, un 20% del tipo 3 y un 10% en tipo 4. Determinar la probabilidad de que s no se encuentra petróleo la formación fue hecha en el tipo 1 o en el tipo 4. Sol. % Formación Formación tipo 1 Formación tipo 2 Formación tipo 3 Formación tipo 4
0.45 0.30 0.15 0.10
Probabilidad de hallar petróleo 30 % 40 % 20 % 10 % 49
( ( (
)
(
(
) )
) (
( )
)
) (
)
( )
(
((
)
(
(
) ) (
)
)
(
)
(
)
(
)
) ( (
)
)
(
)
Por Bayes: (
)
(
( )
)
(
)
( ) (
(
( )
( (
)
(
) (
) (
)
( )
) (
)
)
)
.
/
EVENTOS INDEPENDIENTES Y SECUENCIAS DE EXPERIMENTOS INDEPENDIENTES Dos eventos A Y B se dice que son independientes si se cumple que: (
)
En consecuencia: ( )
( ) 50
Por tanto: ( )
( )
La existencia de uno no afecta a la probabilidad del otro entonces, lo único que se cumple verdaderamente es que: (
)
Por lo tanto: ( )
( )
( )
( )
En consecuencia: (
)
( )
( )
EJEMPLO. En tres establos A, B y C hay una epidemia que afecta a los cascos y a la boca del ganado, la proporción de ganados afectados son: respectivamente se escoge aleatoriamente una cabeza de ganado de cada establo: a) ¿Cuál es la probabilidad que exactamente uno de estos esté afectado por la epidemia? b) Si exactamente uno está afectado ¿Cuál es la probabilidad que provenga del establo B? Proporción Establo A
( )
Establo B
( )
Establo C
( )
a) E= uno está afectado
A
B
C
51
A, B, C Son independientes
( ) ( )
( ) (
. /
b)
)
(
)
( )
( )
( )
EJEMPLO. Un generador tiene 6 componentes disipadores de corriente parasitas eléctricas. La probabilidad de que desconecte el primer disipador es 0.6, para el segundo es 0.2 y 0.3 para cada uno de los restantes disipadores. Determinar la probabilidad que el generador este completamente desconectado si: a) Todos los disipadores están conectados en serie b) Los disipadores están conectados en serie paralelo con el esquema 1,4 o 2,5 o 3y6 Sol.
(
(
)
(
)
(
(
)
(
)
)
)
(
(
)
(
)
(
)
)
(
)
(
)
a) A= el generador esta desconectado si está en serie G= el generador esta desconectado GC= el generador está conectado 1
5
2
4
3
(
5
6
) 52
( )
(
b)
)
1
4
2
5
3
6
( )
(
)
( )
(
)
( )
(
)
( )
( (
(
) (
) (
( )
(
)
)
)
) ( )
(
)
53
CAPITULO 4 VARIABLE ALEATORIA UNIDIMENSIONAL Introducción Hasta el momento se ha visto las probabilidades de eventos específicos ahora vamos a buscar generalizar la probabilidad para todo evento en el espacio muestral.
Definición La variable aleatoria unidimensional es una función que a todo evento del espacio muestral un valor real.
W1
X1
W2
X2
W3
X = X (W)
X3
WK
XK
La variable aleatoria está asociada a una sola característica del espacio muestral. La forma de la función depende del investigador. Dependiendo del valor real asignado la variable aleatoria se clasifica en:
VARIABLE ALEATORIA UNIDIMENSIONAL DISCRETA Cuando el valor asignado es único dentro de un intervalo dominio en el espacio muestral. X
W1
W2
VARIABLE ALEATORIA UNIDIMENSIONAL CONTINUA Cuando es posible asignar infinitos valores dentro de un intervalo dominio en el espacio muestral.
54
W1
W2
EJEMPLO. Una caja contiene 5 transistores de radio, de las cuales do son defectuosos. Los transistores se prueban uno a uno hasta encontrar el segundo transistor defectuoso. Sea X variable aleatoria que representa el número de pruebas efectuadas. Sol. 5 Transistores
2 Defectuosos
y
3 No defectuosos
X = Cantidad de pruebas hasta encontrar el segundo defectuoso DX= {DD, NDD, DND, NNDD, NDND, DNDN, NNNDD} RX= {2, 3, 4, 5} Si X=4 ≈ {NNDD, NDND, DNND} Si x=3 ≈ {NDD, DND} VARIABLE ALEATORIA UNIDIMENSIONAL DISCRETA Es aquella que admite un único valor dentro de un intervalo.
W1
W2
EJEMPLO. Se vende 1000 números para un sorteo en el que hay un premio mayor de 50000 dólares, 4 premios de 10000 dólares, 5 premios de 1000 dólares. El numero cuesta 10 dólares. Si X es la variable que representa el beneficio neto al comprar un número. Hallar: a) El dominio de X b) El rango de X c) La probabilidad de cada uno de los elementos del rango de X Sol. 55
DX= {gane premio mayor, gane un premio de 10000, gane un premio de 1000, pierda todo} RX =
GPM GP de 10000 GP de 1000 Pierde
RX = {49990, 9990, 990, -10} (
)
(
)
(
) (
)
Función o Ley De Probabilidad Una función o ley de probabilidad es aquella función que asocia a todo valor de variable aleatoria un número real entre 0 y 1.
0
W1
X1
W2
p(x1)
X2
W3
p(x2)
X3
WK
XK
p(x3) p(xk) 1
A la función p(x) se le denomina “función de cuantía” y debe verificar: ∑ ( )
56
Se define la función de distribución o también llamada función acumulada de probabilidad a aquella que se define: ‖ ‖
( )
∑ ( )
Gráficamente: Función de cuantía
Función de distribución p(x2)
p(x0) p(x1)
p(xk)
1
p(x1) p(x0)
X0
X1 X2
X3
XK
X0
X1 X2
XK
Lo anterior se puede representar en una tabla: X p(x) P(X)
X0 p(x0) p(x0)
X1 p(x1) p(x0) + p(x1)
X2 p(x2)
…………. …………. ………….
X3 p(x3)
XK p(xK) 1
Propiedades: ) (
)
) ( ≥
(
)
) (
)
) (
(
) )
(
)
) (
)
(
)
(
)
(
)
) (
)
(
)
(
)
(
)
EJEMPLO. Hay 10 estudiantes inscritos en una clase de estadística dentro de los cuales tres tienen 19 años, cuatro tienen 20 años, uno tiene 21 años, uno tiene 24 años, y uno tiene 26 años. Sea X la variable aleatoria que representa el promedio de dos estudiantes seleccionados. Hallar la función de cuantía y distribución y graficar. 57
Sol. n = 10 estudiantes 3 tienen 19 años = A 4 tienen 20 años = B 1 tienen 21 años = C 1 tienen 24 años = D 1 tienen 26 años = E Ω = {AA, AB, AC, AD, AE, BB, BC, BD, BE, CD, CE, DE} RX = {19,19.5, 20, 21.5, 22.5, 20, 20.5, 22, 23, 22.5, 23.5, 25} (
)
(
)
(
)
(
)
(
)
(
)
(
)
(
) (
)
58
( X p(x)
19
19.5
20
)
20.5
21.5
22
22.5
23
23.5 25
1
P(x)
p(x) 12 9
3
4
3 444 1 1 x 1 44 43 39
35 31 28 24 15 3
59
EJEMPLO. La urna I contiene una ficha blanca y dos negras la urna II contiene tres fichas blancas y dos negras, la urna III contiene dos fichas blancas y tres negras, extraemos una ficha de cada urna y la llamamos X a la variable aleatoria que representa el número de fichas blancas extraídas. Determinar la función de cuantía y distribución de la variable aleatoria b) hallar la probabilidad acumulada para ≥ y para Sol. I
1 B; 2N
II
3 B; 2N
III
2 B; 3N
X= Numero de fichas blancas extraídas *
+
(
)
(
)
)
(
x
(
)
0
1
2
3
( ) ( )
60
p(x) 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0
x 0
0,5
1
1,5
2
2,5
3
3,5
p(x) 1,2 1 0,8 0,6 0,4 0,2 x
0 0
1
2
3
4
b) ( ≥
)
( ( ≥ ( ≥
(
)
(
)
(
)
) ) )
(
)
(
) 61
(
) (
)
VARIABLE ALEATORIA CONTINUA Es aquella donde "x" adquiere infinitos valores en un intervalo. La función o ley de probabilidad en variable aleatoria continua se denomina " función de densidad " y verifica.
∫ 𝑝(𝑥) 𝑑𝑥 𝑅𝑥
La función de la distribución o de la probabilidad acumulada se define como: ( )
∫
( )
Gráficamente:
En variable aleatoria continua i. ii. iii.
( ( ≥ (
) )
( )
) ( (
) )
(
)
EJEMPLO. Se tiene la siguiente función de densidad:
62
( )
{ (
)
a) Hallar el valor de la constante "a" tal que sea una función de densidad b) Hallar la función de distribución c) Hallar la probabilidad acumulada de
. ≥ / y
.
/
Solución ∫ ( )
∫
∫ (
1
(
)
0
( )
)
2 1
(
)
( )
∫
{
Función de distribución ,
-
( )
63
,
( )
∫
∫
( )
(
( ) ,
)
(
( )
,
( )
) (
)
( )
. ≥ /
a)
.
( ≥ )
/ ( )
( ≥ )
( )
( {
) ≥
64
.
b)
(
/
)
.
(
(
/
)
.
/
( )
)
FUNCIONES MIXTAS Algunos modelos de funciones de probabilidad manejan variable aleatorias discretas y continua al mismo tiempo en distintos intervalos, entonces: ( )
∑
( )
∑
⟦ ⟧
( )
∑
( )
∫
( )
FUNCIONES DE VARIABLE ALEATORIA ( ) como otra funcion de
Si "x" es una variable aleatoria se puede definir variable aletoria. x
Ω
y 𝑥
𝑤 𝑥
𝑤
𝑥𝑛
𝑤𝑛
𝑦 𝑦 𝑦𝑛
En consecuencia los eventos son equivalentes. (
)
( )
(
( ))
Eventos equivalentes 65
ESPERANZA MATEMATICA La esperanza matematica ( ) se defice como: ( )
∑
( )
∫
( )
en V.A.D.
( )
en V.A.C.
Se define el valor promedio esperado de la variable aleatoria "x" como ( ) PROPIEDADES ( ( (
i. ii. iii.
) )
( ) ( ) ) ( )
El valor esperado "u" es la media poblacional asociándole un intervalo de confianza.
VARIANZA DE UNA VARIABLE ALEATORIA La varianza de una variable aleatoria "x" simbolizada por Var(x) se define como: ( )
((
) )
Siendo u = Valor promedio esperado, entonces ( )
∑ (
( )
∫ (
) )
( )
en V.A.D.
( )
en V.A.C.
La desviación estandar de l a variable aleatoria es: ( )
√
( )
En consecuencia la varianza de la variable "x" luego de un proceso de inferencia se transforma en la varianza poblacional. Una expresión simplifica para la varianza la podemos hallar: ( ) ( )
(( (
)
) ) ( )
(
) -------
( ) 66
( )
(
)
PROPIEDADES ( ) ( ) ( ) ( )
i. ii. iii. iv.
( ) ( ) ( )
Otras medidas centrales de agrupación y deformación. AGRUPACIÓN Mediana ̃
(
/
)
Moda ( )
(
) presente un máximo
Percentil ( )
/
(
)
DEFORMACIÓN Coeficiente de Asimetría ( ) →{ ( ) Donde ∑( ( )
((
)
( )
) ) → ∫ ( {
)
( )
Coeficiente de Curtosis ( ) ( )
(
) ( )
→ {
EJERICICIO. En una feria se deben pagar 25 cts. para jugar en un juegoque consiste en lanzar anillos. Se dan tres anillos a una persona, la cual trata de 67
lanzarlos uno por uno hacia una clavija, si se logra ensartar dos anillos el premio es de 1 Bs.; si se ensartan los tres el premio es de 5 Bs. suponiendo que la probabilidad de ensartar en la clavita sea 0,10 por lanzada. a. ¿Cual es la ganancia esperada si se juega una vez, si se juega 10 veces? b. ¿Cual sera la mediana y moda de lanzamientos? c. Halla el coeficiente de curtosis Solución
𝑃𝑜
𝑃𝑓
1ro (
)
(
)
(
)
(
)
X p(x) P(x) Y
(
𝑃𝑜
𝑃𝑜
𝑃𝑓
𝑃𝑓
2do
3ro
) (
)
0 0,729 0,729 -0,25
1 0,081 0,810 -0,25
2 0,009 0,819 1
3 0,001 0,82 5
68
a. Ganancia esperada si se juega 1 sola vez ( )
∑
( )
(
)
( ≥
)
( ) ganancia pra 10 juegos ( ) b. Mediana ̃
( )
0,822 0,82 0,818 0,816 0,814 0,812 0,81 0,808 -1
0
1
2
3
4
5
6
c. K=? ( ) ( )
((
) ) ( )
Sabemos que ( )
(
)
(
) 69
( ) ( ) ((
) )
(
)
(
(( ( )
(
)
(
)
) )
) (
)
(
)
(
)
(
)
( )
EJERCICIO. Una estación de gasolina recibe semanalmente el combustible, las estadísticas anteriores fueron sugirieron que la distribución de probabilidad de las ventas semanales "x" en miles de galones esta dad por: ( )
{
a. Calcular la probabilidad de que las ventas semanales superen a 1500 galones b. Calcular limites del intervalo ( ) c. Encontrar los coeficientes de asimetría y curtosis Solución ( )
{
Como: 70
( )
∫
∫(
)
( )
∫ (
)
{
Hallando P(x) ( )
∫ (
)
( ) ( )
∫ (
)
∫ (
)
( )
( ) {
≥ (
a.
)
(
)
(
)
(
( ( (
) ) )
)
71
( )
b.
( )
∫
∫ ( (
)
( )
(
(
)
(
)
(
)
∫ (
(
)
)
(
)
(
)
)
∫ (
∫ (
)
)
) ( ) ( )
[
√
√ ( (
√
√
√
√
(
(
√
c.
( )
]
√
√
)
) )
(
(
√
( )
∫ ( )
√
))
((
(
)
)
√
(
)
)
(
√
)
)
y
(
)
(
∫ )
(
)
(
)
(
)
( ) ( ) ( )
(
∫ )
(
)
(
)
∫ (
(
) )
(
)
72
( ) ( ) ( )
→ ( ( ) ( )
√
) → (
√
)
73
CAPITULO 5 DISTRIBUCIONES DISCRETAS MÁS IMPORTANTES
Dentro las modelos de distribución discretas más importantes se tiene:
Experimento de Bernoulli: Si en un determinado ensayo p = probabilidad de éxito, entonces q = probabilidad de fracaso
Si la variable aleatoria “x” es igual a X = 0 fracaso X = 1 éxito La función de cuantía:
( ) x p(x) P(x)
0 q q
La función de distribución:
1 p 1
‖ ‖
( )
∑
El valor promedio esperado: ( )
∑
( )
La varianza: ( ) ( )
(
(
) ) ( )
∑( (
)
( )
) (
)
( )
74
DISTRIBUCION BINOMIAL Sucede cuando el ensayo de Bernoulli se repite “n” veces y la variable aleatoria “x” mide la cantidad de éxitos en los “n” ensayos. Entonces: ( )
. /
Dónde: La función de distribución:
‖ ‖
( )
∑. /
El valor promedio esperado es: La varianza: EJEMPLO. La probabilidad de hacer una venta de cierto artículo por un vendedor en un intento es . Cuál es la probabilidad de obtener: a) Exactamente 2 ventas en 3 intentos de ventas consecutivas. b) Por lo menos una venta en tres intentos de venta consecutivos. c) Cuantos intentos de venta consecutivos deben hacerse para obtener una seguridad de 0,9375 de obtener por lo menos una venta. Solución:
a) Exactamente 2 ventas de 3 intentos: ( )
( )( ) ( )
Si x=2 (
) (
( )( ) ( ) )
b) Por lo menos una venta en tres intentos: ( ≥ ) ( (
)
(
)
(
)
( ≥ )
→
)
( )( ) ( )
( ≥ )
c) 0,9375. Por lo menos 1 venta: 75
1 venta en “n” intentos ( ≥ ) ( ) ( ≥ ) ( ) ( )
. /( ) ( )
Si x=0 (
)
EJEMPLO. Suponga que la maquina A produce el doble de artículos que la maquina B y que la maquina C la mitad de artículos de la maquina B. Se sabe que el 6% de los artículos que produce A son defectuosos mientras que el 3% de los artículos producidos por las maquinas B y C son defectuosos. Si se reúne la producción de las tres máquinas en un solo almacén y se toma una muestra de 10 artículos. Calcular la probabilidad de: a) Obtener 3 artículos defectuosos. b) Por lo menos tres artículos defectuosos. Solución: Maquina A B C Total
Producción 2z z z/2 7/2 z
% Defectuosos 6 3 3
p = probabilidad de tener un defectuoso Por el teorema de probabilidad total
76
→ n=10 (
a)
)
( ).
(
)
( ≥ )
b) ( ≥ )
(
( )
(
/ .
/
)
(
) (
) )
( (
) ) (
)
( ≥ )
DISTRIBUCION GEOMETRICA También está referida al ensayo de Bernoulli, pero la cantidad de veces que se repite no es fija. Entonces la variable aleatoria “x” representa la cantidad de veces que se repite el ensayo hasta obtener el primer éxito. Entonces: ( ) La distribución: ‖ ‖
( )
∑
El valor promedio esperado es:
La varianza: EJEMPLO. Una fábrica de helados produce paletas cubiertas de chocolate que se venden a 6Bs.-, por una promoción se coloca una estrella en cada 50 paletas; si alguien comprara la paleta con estrella puede solicitar una paleta gratuita. ¿Cuántas paletas se debe comprar antes de lograr una gratis? Solución: → → → Se compran 49 paletas antes de la premiada. 77
(
) (
)
√
DISTRIBUCION HIPERGEOMETRICA Es propia de eventos o experimentos en los cuales de “N” elementos existe “M” de un tipo y “N-M” de un segundo tipo, si se extrae una muestra de tamaño “n”, la variable aleatoria “x” representa la cantidad de elementos del primer tipo dentro de la muestra, entonces la función de cuantía es : ( )( ) ( ) ( ) La función de distribución es: ‖ ‖
( )
∑
( )(
)
( )
El valor promedio esperado viene dado por: ( ) La varianza es: ( )(
)(
)
Aproximación a la Binomial Si n<<<<<
( ) ( )
. /
. /( ) (
)
EJEMPLO. Una fábrica emplea un patrón de aceptación en los artículos producidos antes de embarcarlos. El plan consta de dos etapas: cajas con 25 artículos son preparadas para su embarque tomándose 3 artículos como muestra para su revisión; si se encuentra alguno defectuoso, la caja regresa para inspeccionar el 100% de su contenido, en caso contrario se lo embarca. Cuál es la probabilidad de: a) Embarcar una caja que contenga 3 artículos defectuosos. b) Regresar una caja que contiene un solo artículo defectuoso. Solución:
78
{
→ { ( )
( )(
)
( )
a) ( )(
( )
(
)
( ) (
)
) (
(
)
)
b) ( )(
( )
)
( )
Rechazar x = 1 (
)
( )( ) ( ) (
)
EJEMPLO. Considere un sistema eléctrico que consiste en 6 focos conectados en serie de manera que ninguna prendera si uno de ellos es defectuoso. Si los focos de la instalación se seleccionan al azar de un lote de 100, 20 de los cuales son defectuosos. ¿Cuál es la probabilidad que funcionen todos los focos del sistema eléctrico? Solución N = 100 focos M = 20 defectuosos N-M = 80 no defectuosos
n=6 Enciende el sistema eléctrico: 6<<<<100 79
Utilizamos aproximación binomial: ( ) ( )
( )( ) ( )
)
( )( ) ( )
Si funciona x=0 (
( )
DISTRIBUCION DE POISSON Se da en aquellos eventos en los cuales se ha determinado una cantidad de eventos positivos en una determinada cantidad de opciones: La variable aleatoria “x” mide cuantos eventos son positivos en una determinada medida. ( )
( ) Dónde: t = cantidad de medida x = cantidad de eventos positivos Generalmente:
( )
( ) La función de distribución es:
‖ ‖
( )
∑
El valor promedio esperado: La varianza es: EJEMPLO. La probabilidad de que se haga una soldadura defectuosa en una conexión dada es . Considere un sistema de conexiones soldadas. Independientemente: a) ¿Cuál es la distribución de probabilidad del número de uniones defectuosas en el sistema, cuales son los parámetros? 80
b) ¿Cuál es la probabilidad de que no se presenten defectos en el sistema? Solución: t= conexiones soldadas p = soldaduras defectuosas en una conexión p= = 5 conexiones mal soldadas Binomial: p= (
y )
q= 1 -
( )( (
) (
)
)
EJEMPLO. Suponga que la página impresa de un libro contenga 40 líneas y que cada línea contiene 75 espacios. El linotipista de la imprenta comete un error en cada 6000 espacios en promedio. a) ¿Cuál es la distribución del número de errores por hoja? b) ¿Cuál es la probabilidad de que una página no contenga errores? c) ¿Cuál es la probabilidad que un capitulo de 16 páginas no contenga errores? Solución → → a) Entonces: → →
( )
(
( )
)
. /
b) Entonces: x = 0 (
) 81
Con dos errores: x = 2
c) Si
(
)
(
)
. /
(1 página no tiene errores) → ( )
(
(
)(
) (
(
) (
)
)(
)
)
82
CAPITULO 6 DISTRIBUCIONES CONTINUAS Los modelos de distribución en variable aleatoria continua son los siguientes: Distribución Uniforme: La función de densidad viene dada por:
( )
{
p(x )
𝑏
𝑎
a
x
b
La función de distribución es: ( )
∫
( )
∫
{
P( x)
1
a
b
x
83
El valor promedio esperado es:
La varianza es: (
)
Distribución Exponencial: Una variable aleatoria “x” cuyo promedio de eventos por unidad de medida es λ, se distribuye exponencialmente si se verifica: Función de densidad: ( )
≥
La función de distribución: ( )
∫
Por lo tanto: P(x) = [
]
si
x≥
El valor promedio esperado La varianza
=
La distribución exponencial se relaciona con el modelo de Poisson y ambos fundamentan la llamada Teoría de la Fiabilidad (base de mantenimiento) también se utiliza en Teoría de Colas y en las cadenas de Markov.
DISTRIBUCION NORMAL Una variable aleatoria “x” se distribuye normalmente con media “ ” y varianza “ cuando responde a la función de densidad. p (x) = {
. √
/
≥ }
84
Nomenclatura
x, N (
)
Si realizamos el cambio de variable: =z
(Variable aleatoria normal)
Entonces: ̅=
x=
= Var(x) = Var ( Var(x) = =
z=
=0
)
Var ( ) Var ( )
Var ( ) = 1
z N (0,1) ( )
p (z) = { √
}
La función de distribución: P(z) = ∫
dz
√
𝑧
0
no es resoluble por métodos analíticos pero si el método numérico
85
P( ≥
)
P(
)
P(
)
Entonces se forma la tabla de Distribución Normal: z - 3.9 - 3.8 . . . . . 1.5 1.57 . . . . 3.8 3.9
0.00
0.01
0.02
0.035
0.04
0.05
0.8413
P (z = 1.57) = 0.9413 de tablas La tabla también se puede utilizar para encontrar EJEMPLO. Si (
) =0.8413
dada su probabilidad.
Hallar
Si la probabilidad no se encuentra exactamente en tablas se realiza una interpolación lineal entre el anterior y posterior valor. z
P(z) p( ) p( ) p( )
=
+.
(
)
(
)
(
)
(
)
/(
)
Por ejemplo: Si P(z) 0.7580 0.7583 0.7611
z 0.7
(
) = 0.7583
Interpolando
86
= 0.7 +.
/(
)
=
PROPIEDAD REPRODUCTIVA Si se tiene , con N ( ); N (
variables aleatorias todas distribuidas normalmente ); N ( );…., N ( ).
Entonces la variable aleatoria y=
+
También se distribuye normalmente con: = =
Propiedad reproductiva
+
TEOREMA CENTRAL DEL LÍMITE Si se tiene n variables aleatorias distribuidas normalmente cada una es decir: (
)
(
) . . .
(
)
Entonces: z=
∑
∑
//
→
√∑
P(
) = P(
)
Teorema central del Limite Considerando la anterior relación
EJEMPLO. El número de días entre la facturación y el pago de las cuentas corrientes de crédito en una tienda de departamentos tiene una distribución normal
87
con una media de 18 días y desviación estándar de 4 días ¿Qué proporción de las facturas será pagada? a) b) c) d)
Entre 12 y 18 días. Entre 20 y 23 días. Dentro de cuantos días será pagado el 99.5% de las facturas. Entre cuales dos valores simétricamente distribuidos alrededor de la media recaerá el 98% de las facturas.
Solución = 18 a) (12 (12
=4 ) = P (x=18) – P(x=12) )=P(
=
)–P(
(12 ) = P ( = 0) – P( En tablas = 0.5 – 0.0668 (12
) = 0.4332
(12
) = 43.32%
b) (20
= -1.5)
) = P(x=23) – P(x=20)
(20
)=P(
=
)–P( =
(20
)=P( =
)– P ( =0.5)
(20
) = 0.8944 – 0.6915
(20
) = 0.2029
(20
) = 20.29%
c) P(z =
)
=
) = 0.9950
)
= 2.575
88
x= 18+4(2.575)
= 2.575
d)
P(
)
P(
P(
)
P(
P( P(
) )
) = 98 ≥
) = 98 %
P(
) = 98 %
= 0.9900
= 18 + 4(2.327) = 18 - 4(2.327) -
z= 2.327
=27.308 =8.092
EJEMPLO. El gerente de una producción de una fábrica piensa la vida útil de una maquina está distribuida con una media de 3000 horas. Si además piensa que hay una probabilidad de 0.5 de que la maquina dure 2632 horas o más 3368 ¿cuál es la desviación estándar? Solución = 3000 horas Menos de 2632 horas y más de 3368 horas
P(x
)
(
)
89
P(
=
) +1 – P(x
P(
=
)-P( =
) = 0.50
P(
=
)-P( =
) =0.50
P(
=
)-P( =
)= 0.50 // (-1)
) = 0.50
SIMETRICO
(-
)
(
)
(
)
(-
)
(
)
( ≥
)
(-
)
( ≥
)
(-
)
(
( ≥
)
*
( ≥
)+
) = 0.75 En tablas no hay por tanto se interpola
z P(z) 0.67 0.7486 ¿? 0.75 0.68 0.7517
{
}(
)
EJEMPLO. Un camión de reparto transporta cajones cargados de artículos varios si el peso se distribuye normalmente de cada caja con una media de 50 lb y una 90
desviación estándar de 5lb cuantos cajones pueden ser transportados en el camión de tal forma que la probabilidad que la carga total exceda a una tonelada sea 0.10. Solución
Carga total exceda 1ton sea 0.10
n = cantidad de cajas
Variable Aleatoria Normal
Propiedad Reproductiva =
+
=
= n*
=√
= √ P(
) = 0.10
) = 0.10 P (
1-P(
(
) = 0.80
) = 0.90 En tablas
z P(z) 1.28 0.8997 ¿? 0.9000 1.29 0.9015
1.2817
Pero: √
√ =
//() 91
25*
=
- 100
+ 2500
2500
– (100
2500
– (100*2204.58+25) +
+25) +
Dónde:
=0
=0
= 44.96
= 43.24
43 cajas pueden transportarse
APROXIMACION A LA NORMAL
La mayor parte de los modelos se puede aproximar a una Distribución Normal. APROXIMACIÓN DE LA BINOMIAL
Para evitar errores de aproximación se utiliza un factor de corrección de 0.5 = . P(
)
(
P(
)
.
P( ≥
)
.
) /
(
√
)
/
APROXIMACIÓN DE POISSON
Se utiliza el factor de corrección de
92
n= tamaño de la muestra
√
P(
)
P(
)
(
)
√
EJEMPLO. En una población grande de mosquitos el 25% tiene mutación de alas una muestra de 300 insectos se escoge aleatoriamente. Calcular aproximadamente la probabilidad que más de 60 pero no más que 90 insectos de la muestra tengan mutación de alas. Solución n =300 insectos q=1-0.25 q= 0.75
p= 0.25
√
(0.25)
=√
P (60
) = P(x
P (60
)=
P (60
)=
) - P(x
)
. (
/ )
(
.
/ )
En tablas P (60
) = 0.9808 - 0.0268
P (60
) = 0.954
93
CAPITULO 7 VARIABLE ALEATORIA BIDIMENSIONAL En este caso se estudian 2 características del objeto de estudio (x,y) que generalmente forman una tabla bidimensional de probabilidades. X
…..
Y )
p(
p(
)
p(
)
. . .
. . . . .
Total
p( ) p( )
p( )
…………. ……...
A las distribuciones p (x)
……….
Total p( ) . . . . . p( ) 1
p (y) se las llama distribuciones marginales.
Para cada distribución marginal se puede hallar:
Como Variables Aleatorias Unidimensionales En Variable Aleatoria Discreta Bidimensional ∑
∑
(
)=1
Las marginales p (x) = ∑
(
)
p (y) = ∑
(
)
Entonces ∑ (
( ) )
∑
; ;
(
( ) )
En Variable Aleatoria Bidimensional
94
∫ ∫
(
)
;
)
Las marginales ( )
(
∫
( )
∫
(
)
Entonces ( )
∫
( )
∫
;
COVARIANZA La covarianza es la medida de la varianza mutua entre dos variables aleatorias. Cov = E (
)(
) (
)
En V.A.D. ) = ∑ ∑(
)(
) (
)
)=∫ ∫ (
)(
) (
)
Cov ( En V.A.C. Cov ( También es posible utilizar Cov ( Cov (
) = ∑∑ )=∫ ∫
(
)
(
)
Si las variables son independientes entonces la covarianza es cero Cov = 0 Si no son independientes se pueden medir el grado de relacionamiento mediante el coeficiente de correlación. ” (
)
(
)
-1
1
Si:
95
=1
Correlación es perfecta positiva
= -1
Correlación es perfecta negativa
Cov (x,y) = [∑
]
y = a +bx EJEMPLO. Sean x,y dos variables aleatorias que representan las producciones diarias de dos líneas ensambladoras A y B de vehículos la distribución conjunta de probabilidad viene dada por la siguiente tabla. x y 1 2 3 Total
1 0 1/6 1/12 1/4
2 3 1/5 2/15 1/9 1/4 0 1/18 14/45 79/180
Total 1/3 19/36 5/36 1
Se pide: a) Las distribuciones marginales b) La probabilidad p(x>1/y=2) c) Coeficiente covarianza y coeficiente de correlación Cov (x,y),
.
Solución x 1 2 3 p(x) 1/3 19/36 5/36 a) ∑
(
( )=
)=
. /
. / (
( )
. /
( )
. /
. /
. /
. /
)=
( )
96
y 1 2 3 p(y) 1/4 14/45 79/180 ∑
(
( )=
)=
. /
. /
. / (
( )
b)
.
p(x >1 /y=2 ) =
. /
.
.
/
/
)=
/
( )
(
) (
)
p(x >1 /y=2) =
c)
Cov (x, y) = ( )
( )
( )
( )
( )
( )
( )
( )
. /
Cov (x, y) = -
(
(
) (
)
=
)
EJEMPLO. Un equipo consta de dos componentes electrónicos independientes y permanecerá en uso tanto tiempo como uno de sus componentes este aun en operación el equipo tiene una garantía que cubre su sustitución si el aparato se 97
vuelve inutilizable en menos de un año si x la vida del primer componente y la vida del segundo componente cuya función de probabilidad conjunta es p(x, y) =
si
x≥
≥
Cuál es la probabilidad de que la garantía expire de que su equipo se vuelva inutilizable. Solución Garantía inutilizable si es menos de un año ∫ ∫
=1 ∫ ∫ ∫
(
)
Dónde:
X: vida del 1er componente Y: vida del 2do componente p (x<1, y) + p (y<1, x) p (x>1, y) + p (y>1, x)
Cubre la garantía Ya no cubre la garantía
Marginales p(x) = ∫ p (x) =
98
.
p (x) = p (x) =
/
;
p (y) =
p (x > 1) =1- p (x>1) p (x > 1) = 1- .
/
99
100