PROBABILIDAD Y ESTADISTICA
UNIVERSIDAD MAYOR DE SAN ANDRES FACULTAD DE INGENIERIA INGENIERIA ELECTROMECANICA
MEC 122
PRACTICA
MEC 122 PROBABILIDAD Y ESTADISTICA
ESTUDIANTES: -
CHAMBI PARISACA YOJHA JUAN PABLO QUISPE MAMANI JOSE FERNANDO YUPANQUI COOS JHONATAN CRISTHIAN SAAVEDRA MOSCOSO MARCELO TORREZ LAURA JUAN CARLOS QUISPE QUIQUE ADALID KEVIN
CAPITULO º 1 INTRODUCCION DEFINICION.La estadística es la ciencia que trata de organizar, clasificar obteniendo indicadores a parti r de una muestra, para luego inferir resultados generales para la población asociándole de un margen de certidumbre llamada probabilidad. Para datos que representen al vari abl e objeto de estudio. Clasificación.
Estadística Descriptiva Estadística Inferencial
Estadística Descriptiva.Es aquella que se encarga de organizar, clasificar y obtener indicadores a partir de una muestra. Estadística Inferencial.Busca generalizar los resultados de la muestra llamados estadígrafos hacia la población donde son llamados parámetros asociándolos a un proceso de verificación con un margen de probabilidad. Población.Es el conjunto universo que contiene todas las características del objeto de estudio. Población Finita: “N” Ejemplo: Todas las empresas que comercialicen. Población Infinita Ejemplo: Todos los talleres que reparan talleres. Muestra.Es un subconjunto de la población de la cual se obtienen los datos y que es representativa. Al proceso de determinar el tamaño de la muestra se la denomina muestreo. Existen varias formas de muestreo.
Muestreo por Atributos Muestreo por Variables Muestreo por Conglomerados Muestreo Aleatorio Muestreo Estratificado Muestreo por Mixto
Variable.Es la característica u objeto de estudio que nos interesa en la población. Clasificación:
Por su valor.Variable Discreta, cuando adquiere un valor fijo dentro de un intervalo. Ejemplo: La cantidad de mujeres en electromecánica. Variable Continúa, es aquella que adquiere infinitos valores dentro de un intervalo. Ejemplo: Presión, Estatura, Peso. Por su imagen.Variable Cualitativa, cuando el objeto de estudio es una cualidad. Ejemplo: Sabor Variable Cuantitativa, cuando se puede medir mediante una cantidad. Ejemplo: Tensión
Dato u observación.Es el valor numérico del variable objeto de estudio, para obtener los datos, existen 3 formas: Encuesta (Preguntas Generales) Histórico en las Empresas Entrevista (preguntas de dominio a la variable de estudio ) Parámetro.Es el valor que representa a la población del objeto o variable de estudi o. Estadígrafo.Es el valor que representa a la muestra del objeto variable de estudio. 𝐸𝑠𝑡𝑎𝑑𝑖𝑔𝑟𝑎𝑓𝑜 → 𝑃𝑎𝑟𝑎𝑚𝑒𝑡𝑟𝑜 Proceso de la Estadística Descriptiva. 1º Paso : Planificar el estudio 2º Paso : Realizar la encuesta 3º Paso: Clasificar, organizar y hallar estadígrafos de la muestra.
CAPITULO º 2 ORGANIZACIÓN, CLASIFICACION E INDICADORES DE UN CONJUNTO DE OBSERVACIONES Los datos se organizan y clasifican mediante los siguientes criterios. Frecuencia Absoluta.Simbolizada por "𝑓𝑖 " es la cantidad de veces que se repite un dato. Frecuencia Absoluta Acumulada.Simbolizada por "𝐹𝑖 " se defina como la sumatoria de todas las frecuencia absolutas menores e iguales al i-esimo. 𝐹𝑖 = 𝑓1 + 𝑓2 + 𝑓3 + ⋯ + 𝑓𝑖 Frecuencia Relativa.Simbolizada por "ℎ 𝑖" es la razón de la frecuencia absoluta a la cantidad total de observaciones “n”. ℎ𝑖 =
𝑓𝑖 𝑛
Frecuencia Relativa Acumulada.Simbolizada por "𝐻𝑖 " es la sumatoria de todas las frecuencias relativas menores e igual e s al i esimo nivel. 𝐻𝑖 = ℎ1 + ℎ 2 + ℎ 3 + ⋯ + ℎ 𝑖 Frecuencia Relativa Porcentual.ℎ 𝑖 ∗ 100% Frecuencia Relativa Porcentual Acumulada.𝐻𝑖 ∗ 100% Los datos se organizan ordenándolos ascendentemente y registrando sus frecuencias. Cuando “n”< 60, los no se agrupan en intervalos y solo se registran en frecuencias, a ello se denomina datos no agrupados. Tabla de Frecuencias.-
Datos 𝒙𝒊 𝒙𝟏 𝒙𝟐 𝒙𝟑 . .
𝒇𝒊
𝑭𝒊
𝒉𝒊
𝑯𝒊
𝒇𝒊 ∗ 𝟏𝟎𝟎%
𝑯𝒊 ∗ 𝟏𝟎𝟎%
. 𝒙𝒊 Si 𝑛 ≥ 60 , los datos deben agruparse previamente en intervalos, llamados intervalos de clase. Tipos de intervalos.
INTERVALOS REALES: (CERRRADOS) [𝐿. inf , 𝐿. 𝑠𝑢𝑝] INTERVALOS APARENTES: (MIXTOS) [𝐿. inf , 𝐿. 𝑠𝑢𝑝[
Es posible transformar los reales en aparentes sumando y restando la mitad de la unidad. Cantidad de Intervalos.Simbolizada por “K” y se pueden tomar dos criterios:
1º CRITERIO: 𝐸𝑋𝐶𝐸𝑆𝑂 𝑍𝑜 < √𝑛 < 𝑍1 → 𝐾 = 𝑍1 𝐾 = √𝑛 → { 𝐷𝐸𝐹𝐸𝐶𝑇𝑂 → 𝐾 = 𝑍𝑜
2º CRITERIO: 𝐾 = 1 + 3,22 ∗ log 𝑛
RANGO.𝑅𝑎𝑛𝑔𝑜 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛 Amplitud de cada intervalo.El tamaño de cada intervalo puede ser constante o variable. Si es constante: 𝐶=
𝑅𝑎𝑛𝑔𝑜 𝐾
𝐸𝑥𝑐𝑒𝑠𝑜 𝑜 𝑝𝑜𝑟 𝐷𝑒𝑓𝑒𝑐𝑡𝑜
Además 𝐶 = 𝐿. 𝑠𝑢𝑝 − 𝐿. 𝑖𝑛𝑓 Si los intervalos son de amplitud variable el tamaño de cada uno de ellos está el criterio del investigador. Marca de clase.Simbolizada por 𝑋𝑖 es el promedio de los límites del intervalo. 𝑋𝑖 =
𝐿. 𝑖𝑛𝑓 + 𝐿. 𝑠𝑢𝑝 2
Para datos agrupados se forma la siguiente tabla de diferencias. Tabla de frecuencias.-
Intervalos 𝑳𝒊 + 𝑳𝒊+𝟏
Marca de clase
𝒇𝒊
𝑭𝒊
𝒉𝒊
𝑯𝒊
𝐡𝐢 ∗ 𝟏𝟎𝟎%
𝐇𝐢 ∗ 𝟏𝟎𝟎%
𝑿𝒊
Representaciones Graficas.Los datos obtenidos de un estudio estadístico pueden representarse de varias formas, ya se a utilizando frecuencias o no. Diagramas de barras.-
Valor
Tiempo
Valor
P L P
P L P
P L P
Tiempo
Diagramas de Sectores.-
𝑛 → 360º 𝑓𝑖 → 𝛼º
𝛼 = 360 ∗
𝑓𝑖 𝑛
𝛼 = 360 ∗ ℎ 𝑖
Histogramas de frecuencias.-
𝒇𝒊 ∗ 𝒉𝒊
Variable
𝑭 𝒊 ∗ 𝑯𝒊
Variable
Se puede acumular también en sentido contrario: 𝒇𝒊
𝑭𝒊
𝑭∗𝒊
f1
f1
f k + f k−1 + ⋯ + f1
f2
f1 + f 2
f3
f1 + f 2 + f 3
.
.
.
.
.
.
f k + f k−1
fk
𝑭∗𝒊 o 𝑯∗𝒊
Polígonos de frecuencias.-
Variable
Se unen los puntos medios de las barras de los Histogramas de Frecuencias.
𝒇𝒊 𝒐 𝒉𝒊
Variable El polígono de frecuencias en las frecuencias acumuladas se llama Ojiva de frecuencias. 𝑭𝒊
Variable
𝑯∗𝒊
Variable
Diagrama de tallos y Hojas.Ejemplo: 23,25,28,29,33,37,40,125,128,134,78,73,57,69 Tallo
Hojas
2
3,5,8,9
3
3,7
4
0
12
5,8
13
4
5
7
6
9
7
3,8
Propiedades.Las frecuencias verifican las siguientes propiedades: 1) 2) 3) 4) 5) 6)
∑𝑘𝑖=1 𝑓𝑖 = 𝑛 ∑𝑘𝑖=1 ℎ 𝑖 = 1 ∑𝑘𝑖=1 ℎ 𝑖 ∗ 100% = 100% 𝐹𝑘 = 𝑛 𝐻𝑘 = 1 𝐻𝑘 % = 100%
Donde K = Cantidad de intervalos Ejemplo: En una prueba de elasticidad de 40 láminas formadas por dos con un adhesivo se obtuvieron los siguientes valores de subconstante elástico en mega Newton por metro los cuales se re pre se nta en la siguiente tabla. Elástica CONSTANTE 6,72 6,75 6,72 6,76 6,74 Se pide: a) b) c) d)
ELASTICA 6,77 6,66 6,76 6,70 6,81
(MN/m) 6,82 6,66 6,76 6,78 6,79
6,70 6,64 6,68 6,76 6,78
6,78 6,76 6,66 6,67 6,66
6,70 6,73 6,62 6,70 6,76
6,62 6,80 6,72 6,72 6,72
6,69 6,75 6,78 6,81 6,80
Construir una tabla de frecuencias Que cantidad de observaciones tiene una constante elástica mayor a 6,69(MN/m) Qué porcentaje de observaciones tiene una constante elástica entre 6,65 y 6,80 (MN/m) Se considera que una constante elástica es optima si excede el valor de sigma en (MN/m), si se sabe que el 25%de las constantes elásticas es optima determinar el valor de sigma.
SOLUCION: Diagramas de Tallos y Hojas
Tallo
Hojas
6,6
6,6,4,8,7,6,6,2,2,9
6,7
2,5,2,6,4,7,6,0,6,8,0,6,8,8,6,0,3,0,6,2,2,2,5,8
6,8
1,2,0,1,0
𝑋𝑚𝑎𝑥 = 6,82
→
𝑋𝑚𝑖𝑛 = 6,62
a) 𝑅𝑎𝑛𝑔𝑜 = 6,82 − 6,62 = 0,20
𝐸𝑋𝐶𝐸𝑆𝑂 𝐾=7 𝐾 = √𝑛 → √40 = 6,3245 { 𝐷𝐸𝐹𝐸𝐶𝑇𝑂 𝐾=7
K=6
𝐶=
Intervalos 𝑳𝒊 + 𝑳𝒊+𝟏
𝑅𝑎𝑛𝑔𝑜 0,20 = = 0,33333333 … … 𝐾 6
Marca de clase
𝒇𝒊
𝑭𝒊
𝒉𝒊
→
𝑯𝒊
𝐶 = 0,04
𝐡𝐢 ∗ 𝟏𝟎𝟎%
𝐇𝐢 ∗ 𝟏𝟎𝟎%
𝑿𝒊 6,62-6,66
6,64
3
3
0,075
0,075
7,5
7,5
6,66-6,70
6,68
7
10
0,175
0,250
17,5
25
6,70-6,74
6,72
10
20
0,250
0,500
25,0
50
6,74-6,78
6,76
10
30
0,250
0,750
25,0
75
6,78-6,82
6,80
9
39
0,225
0,975
22,5
97,5
6,82-6,86
6,84
1
40
0,025
1
2,5
100
40
1
b) 30
7
6,66
6,62
6,69
6,74
6,70
6,78
6,82
6,86
31,75 6,70 − 6,69 ∗ 7 + 30 = 31,75 6,70 − 6,66
→ 𝑹𝒑𝒕𝒂. 𝟑𝟏
c) 17,5%
6,62
6,65
6,66
6,69
25%
25%
6,70
6,74
6,78
6,80
6,82
22,5%
6,86
6,66 − 6,65 6,80 − 6,78 ∗ 7,5% + 17,5% + 50% + ∗ 22,5 6,66 − 6,62 6,82 − 6,78 Rpta. El 80,63% tiene K entre 6,65 y 6,68. d) Optima valor > 25%
6,66
6,62
6,70
6,82
6,78
6,74
6,86
𝜎 = 6,78(𝑀𝑁/𝑚) 22,5%
e)
2,5%
𝜎 → % > → 35%
25%
35-25 = 10% 𝝈 6,62
6,66
6,70
25%
6,78 − 𝛔 ∗ 25% = 10% 6,78 − 6,74
6,82
6,78
6,74
22,5%
→ 𝑹𝒑𝒕𝒂. 𝛔 = 𝟔, 𝟕𝟔𝟒 (𝑀𝑁/𝑚)
6,86
2,5%
Ejemplo: Es una encuesta se obtuvo la siguiente información de los puntajes obtenidos e n un e xame n de estadística. Puntaje 𝑳𝒊 + 𝑳𝒊+𝟏
Marca clase
de 𝒇𝒊
𝑭𝒊
𝒉𝒊
𝑿𝒊 20 - 40
3
40 – 50
10
50 - 60
30
20
60 – 80
30
80 - 96
39
Además se sabe que: 𝒉𝟏 = 𝒉𝟓
𝒉𝟐 = 𝒉𝟒
𝒉𝟐 − 𝒉𝟏 =
𝟏 𝟗
Se pide: a) b) c) d)
Completar la tabla de frecuencias Cuantas personas aprobaron el examen Si se considera excelente una nota mayor a 80 que porcentaje es excelente. Trae el histograma y el polígono de frecuencias absolutas.
Solución: a) Como: 𝒉𝟑 =
𝒇𝟑 30 3 = = 𝑛 90 9 𝑘
∑ ℎ𝑖 = 1 𝑖=1
ℎ1 + ℎ 2 + ℎ 3 + ℎ 4 + ℎ 5 = 1 3 ℎ1 + ℎ 2 + + ℎ1 + ℎ 2 = 1 9 ℎ2 = ℎ4 =
2 9
2 9
𝑯𝒊
Puntaje 𝑳𝒊 + 𝑳𝒊+𝟏
Marca clase
ℎ1 =
1 9
ℎ5 =
1 9
de 𝒇𝒊
𝑭𝒊
𝒉𝒊
𝑯𝒊
𝑿𝒊 20 - 40
30
10
10
1/9
1/9
40 – 50
45
20
30
2/9
3/9
50 - 60
55
30
60
3/9
6/9
60 – 80
70
20
80
2/9
8/9
80 - 96
88
10
90
1/9
1
b) Aprobaron: 51 + 30
60
50
96
80
30 31,75
60 − 51 ∗ 30 + 30 = 57 60 − 50 c) Porcentaje ≥ 80 =
100 9
→ 𝑹𝒑𝒕𝒂. 𝟓𝟕 𝒑𝒆𝒓𝒔𝒐𝒏𝒂𝒔
%
𝒇𝒊
Variable
Medidas de tendencia Central.Son también denominados estadígrafos de posición centrales, son aquellos valores que representan el promedio de las observaciones. Las medidas centrales más utilizadas son: Media Aritmética Mediana Moda Media Aritmética.Simbolizada por 𝑥̅ se define como el promedio de todas las observaciones. Para datos no agrupados 𝑥̅ = ∑𝑘𝑖=1 𝑥 𝑖 𝑥̅ = 𝑛
𝑑𝑜𝑛𝑑𝑒:
𝑥1 + 𝑥 2 + 𝑥 3 + … … . 𝑥 𝑘 𝑛 𝑥 𝑖 = 𝑖 − 𝑒𝑠𝑖𝑚𝑜 ;
𝑛 = 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠
Para datos agrupados 𝑥̅ =
𝑥̅ =
∑𝑘𝑖=1 𝑓𝑖 𝑥𝑖 𝑛
𝑓1 𝑥1 + 𝑓2 𝑥2 + … … . 𝑓𝑘 𝑥𝑘 𝑛
𝑑𝑜𝑛𝑑𝑒: 𝑓1 = 𝑖 − 𝑒𝑠𝑖𝑚𝑜 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑥𝑖 = 𝑖 − 𝑒𝑠𝑖𝑚𝑜 ; 𝑛 = 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠
Si 𝑘
𝑥̅ =
∑ ℎ 𝑖 𝑥𝑖
𝑘 = 𝐶𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠
𝑖=1
Ventajas y desventajas.1) 2) 3) 4) 5)
Es de fácil calculo Toma en cuenta todas las observaciones Es el valor promedio mas utilizado Es manipulable algebraicamente. Es sensible a valores extremos
Por ejemplo: a) 30 , 35, 40, 45, 46 𝑥̅ =
30 + 35 + 40 + 45 + 46 → 𝑥̅ = 39,2 5
𝑥̅ =
10 + 35 + 40 + 45 + 46 → 𝑥̅ = 35,2 5
b) 10, 35, 40 , 45,46
Ejemplo: Para la siguiente tabla de frecuencias se pide hallar la media aritmética.
𝑳𝒊 + 𝑳𝒊+𝟏
𝑿𝒊
𝒇𝒊
𝑭𝒊
10
𝒇𝒊 ∗ 𝒉𝒊 300
18
400
23
350
17 4
440
120
50
Total
Se sabe que los intervalos tienen la misma amplitud igual a 20. SOLUCION:
𝑳𝒊 + 𝑳𝒊+𝟏
𝑿𝒊
𝒇𝒊
𝑭𝒊
𝒇𝒊 ∗ 𝒉𝒊
20 - 40
30
10
10
300
40 – 60
50
8
18
400
60 - 80
70
5
23
350
80 – 100
90
17
40
1530
100 - 120
110
4
44
440
120 - 140
130
6
50
780
Total
50
3800
𝐿. 𝑠𝑢𝑝5 = 𝐿. 𝑖𝑛𝑓5 + 𝐶 → 𝐿. 𝑖𝑛𝑓5 = 𝐿. 𝑠𝑢𝑝5 − 𝐶 → 𝐿. 𝑖𝑛𝑓5 = 120 − 20 = 100 ∑𝑘𝑖=1 𝑓𝑖 𝑥 𝑖 𝑥̅ = 𝑛
=
3800 50
→𝒙 ̅ = 𝟕𝟔
Media Aritmética Ponderada.Simbolizada 𝒙 ̅ 𝒑se define como el promedio ponderado de las media aritméticas 𝒙 ̅ 𝒊de varias muestras 𝒏𝒊sobre el mismo objetivo de estudio. Generalmente se las pondera con el factor 𝒏𝒊del tamaño de la muestra y en otras ocasiones se suelen utilizar factores de importancia 𝒘𝒊cuando las muestras tienen el mismo tamaño. ̅𝒑 = 𝒙
𝑥̅1 𝑛1 + 𝑥̅2 𝑛2 + ⋯ … . +𝑥̅ 𝑘 𝑛𝑘 𝑛1 + 𝑛2 + 𝑛3 + ⋯ … . +𝑛𝑘
̅𝒑 = 𝒙
𝑥̅1 𝑤1 + 𝑥̅2 𝑤2 + ⋯ … . +𝑥̅ 𝑘 𝑤𝑘 𝑤1 + 𝑤2 + 𝑤3 + ⋯ … . +𝑤𝑘
Ejemplo: Las distribuciones de ingreso de dos departamentos de Bolivia son las siguientes:
DEPARTAMENTO “A”
INGRESOS ANUALES POR POLBACION HAB.EN MILES DE Bs. RENUMERADA
𝑿𝒊
𝒇𝒊 ∗ 𝑿𝒊
𝒉𝒊
80 - 100
30.000
90
27.000.000
0,182
100 – 120
80.000
110
8 800.000
0,485
120 - 140
40.000
130
5 200.000
0,242
140 – 160
10.000
150
1500.000
0,061
160 - 200
4.000
180
720.000
0,024
200 - 220
1.000
210
210.000
0,006
Total
165.000
19130000
DEPARTAMENTO “B”
INGRESOS ANUALES POR POLBACION HAB.EN MILES DE Bs. RENUMERADA
𝑿𝒊
𝒇𝒊 ∗ 𝑿𝒊
𝒉𝒊
60 - 90
10.000
75
7500.000
0,077
90 – 120
20.000
105
2100.000
0,155
120 - 150
50.000
135
6750.000
0,387
150 – 180
20.000
165
3300.000
0,155
180 - 210
15.000
195
2925.000
0,116
210 - 240
10.000
225
225.000
0,077
240 - 270
4.000
255
1020.000
0,033
Total
129.000
19095.000
a) Calcular el ingreso promedio b) Calcule el ingreso promedio para el 40% de la población de menores ingresos. SOLUCION: a) ̅𝒑 = 𝒙
̅𝑨 = 𝒙
𝑥̅𝐴 𝑛𝐴 + 𝑥̅𝐵 𝑛𝐵 𝑛𝐴 + 𝑛𝐵
19130000 19095000 ̅𝑩 = 𝒙 165000 129000
̅ 𝑨 = 115,94(𝑀𝑖𝑙𝑒𝑠 𝑑𝑒 𝐵𝑠. ) 𝒙 ̅𝒑 = 𝒙
̅ 𝑩 = 148,02(𝑚𝑖𝑙𝑒𝑠 𝑑𝑒 𝐵𝑠) 𝒙
115,94 (165000) + 148,02(129000) 165000 + 129000 ̅ 𝒑 = 𝟏𝟑𝟎, 𝟎𝟏 (𝒎𝒊𝒍𝒆𝒔 𝒅𝒆 𝑩𝒔. ) 𝒙
b) 40% de menores ingresos: DEPARTAMENTO “A”
48,5%
18,2%
80
100
𝛼
120
𝛼 − 100 ∗ 48,5% = 21,8% 20
→ 𝑹𝒑𝒕𝒂. 𝛂 = 𝟏𝟎𝟖,𝟗𝟗
𝑿𝒊
𝒉𝒊
80 - 100
90
0,182
100 – 108,99
104,495
0,218
̅ 𝑨𝟒𝟎% = 90 ∗ 0,182 + 104,495 ∗ 0,218 → 𝒙 ̅ 𝑨𝟒𝟎% = 𝟑𝟗, 𝟏𝟔 (𝒎𝒊𝒍𝒆𝒔 𝒅𝒆 𝑩𝒔) 𝒙
DEPARTAMENTO “B”
15,5%
7,7%
38,7%
𝛽 90
60
23,2%
120
150
16,8% 𝛽 − 120 ∗ 38,7 = 16,8 → 𝑹𝒑𝒕𝒂. 𝛃 = 𝟏𝟑𝟑, 𝟎𝟐(𝒎𝒊𝒍𝒆𝒔 𝒅𝒆 𝑩𝒔. ) 30 𝑿𝒊
𝒉𝒊
60 - 90
75
0,077
90 – 120
105
0,155
120-133,02
126,51
0,168
̅ 𝑩 = 43,30 (𝒎𝒊𝒍𝒆𝒔 𝒅𝒆 𝑩𝒔) 𝒙 ̅𝒑 = 𝒙
1𝟑𝟗, 𝟏𝟔 (0,4) + 43,30(0,4) 0,4 + 0,4 ̅ 𝑷 = 𝟒𝟏, 𝟐𝟑 (𝒎𝒊𝒍𝒆𝒔 𝒅𝒆 𝑩𝒔) 𝒙
PROPIEDADES.La media aritmética verifica las siguientes propiedades: Si se tiene el conjunto de observaciones. 𝑥1 , 𝑥 2 ,𝑥 3 , … … . 𝑥 𝑛 Entonces: i.
Si se suma a cada variable una constante “b” la media aritmética queda afectada en esa misma cantidad. 𝑥1 + 𝑏, 𝑥 2 + 𝑏, 𝑥 3 + 𝑏, … … . 𝑥 𝑖 + 𝑏, … … 𝑦1 = 𝑥 2 + 𝑏 𝐲̅ = 𝐱̅ + 𝐛
ii.
Si se multiplica a cada observación por una constante “a” la media aritmética queda afectada en esa misma cantidad. 𝑎𝑥1 , 𝑎𝑥 2 ,𝑎𝑥 3 ,… … . 𝑎𝑥 𝑖, … … 𝑦1 = 𝑎𝑥 𝑖 𝐲̅ = 𝐚 ∗ 𝐱̅
iii. 𝑦𝑖 = 𝑎𝑥 𝑖 + 𝑏 𝐲̅ = 𝐚𝐱̅ + 𝐛
iv. 𝑘
∑ 𝑓𝑖 (𝑥𝑖 − 𝑥̅) = 0 𝑖=1
Ejemplo: Los salarios de una empresa son el promedio 500dolares, con posterioridad se incorporan a la empresa un grupo de obreros igual a 25% de los que estaban anteriormente. El nuevo grupo ingresa a la empresa con un salario medio igual a 60% de los antiguos. Dos me se s tarde, la empresa concede un aumento de salario de 30 dol ares se pide: a) El promedio de salario de total de obreros b) Si el aumento hubiera sido del 20% del salario, cual habría sido la media de los salarios ajustados. SOLUCIÓN:
Trabajadores
Promedio Salarial
n
𝑥̅ = 500 $
25%*n
60%*𝑥̅
2 meses más tarde Aumento de 30$ a) Trabajadores
Promedio Salarial
n
𝑥̅ = 500 $
n/4
60/100*(500)= 300$
Después de 2meses: Trabajadores
Promedio Salarial
n
500 + 30 = 530
n/4
300+30=330
̅𝒑 = 𝒙
𝑛(530) + 𝑛/4(330) → 𝐱̅ 𝐩 = 𝟒𝟗𝟎$ 𝑛 + 𝑛/4
b) 20% salario 20 1 𝑠𝑎𝑙𝑎𝑟𝑖𝑜 = 𝑎𝑢𝑚𝑒𝑛𝑡𝑜 = 𝑠𝑎𝑙𝑑𝑜 = 𝑎𝑢𝑚𝑒𝑛𝑡𝑜 100 5 1
𝑖𝑛𝑔𝑟𝑒𝑠𝑜 = 𝑠𝑎𝑙𝑎𝑟𝑖𝑜 + 𝑠𝑎𝑙𝑑𝑜 5
6 𝑖𝑛𝑔𝑟𝑒𝑠𝑜 = 𝑠𝑎𝑙𝑎𝑟𝑖𝑜 5 6 𝑦1 = 𝑥 𝑖 5 𝐲̅ =
6 ∗ 𝐱̅ 5
Entonces: Trabajadores
Promedio Salarial
n
6 ∗ 500 = 600$ 5
n/4
6 ∗ 300 = 360$ 5
̅𝒑 = 𝒙
𝑛(600) + 𝑛/4(360) → 𝐱̅ 𝐩 = 𝟓𝟓𝟐$ 𝑛 + 𝑛/4
Mediana.Simbolizada por 𝑥̃ se define como aquel valor que divide en dos partes iguales la cantidad total de observaciones previamente ordenadas. Para datos No Agrupados:
Si “n ”es impar: 𝑥1 , 𝑥 2 ,𝑥 3 , … … . 𝑥 𝑛 𝑥̃ = 𝑥𝑛+1
2
Si “n ”es par: 𝑥̃ =
𝑥 𝑛 + 𝑥 𝑛+1 2
2
2
Por Ejemplo: Hallar la mediana de: 3, 5, 7, 9, 11, 16, 20,25 Solución 𝒏=𝟗 ̃ 𝒙 = 𝒙𝟗+𝟏 = 𝒙𝟓 → 𝒙 ̃ = 𝟏𝟏 𝟐
Para datos agrupados.Buscamos el intervalo en el cual se acumula la mitad de las observaciones, a ese intervalo de la mediana. 𝑛
1) Buscamos en 𝑭𝒊 2
2) Aplicamos la formula heurística. 𝑛 + 𝐹𝑘−1 𝑥̃ = 𝐿. 𝑖𝑛𝑓 + 2 ∗𝐶 𝐹𝑘 + 𝐹𝑘−1
Donde: 𝐿. 𝑖𝑛𝑓 = 𝑙𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 𝐹𝑘 = 𝑓𝑟𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝐴𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 𝐹𝑘−1 = 𝑓𝑟𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝐴𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑎𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 𝐶 = 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 𝑛 = 𝑐𝑎𝑛𝑡𝑖𝑑𝑑𝑎 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 También se puede utilizar
1 + 𝐻𝑘−1 𝑥̃ = 𝐿. 𝑖𝑛𝑓 + 2 ∗𝐶 𝐻𝑘 + 𝐻𝑘−1 Donde: 𝐻𝑘 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 𝐻𝑘−1 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑎𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 Ventajas y desventajas.1) 2) 3) 4)
Es de fácil calculo No es sensible a valores extremos No toma en cuenta a todas las observaciones No es manipulable algebraicamente
Ejemplo: Se da a una estudiante de estadística de la ingeniería Mecánica la siguiente Tabla de di stri bución de Frecuencias que contiene datos sobre el registro de la temperatura de un cierto cuerpo (ºC), estando el informe confuso se pide: encontrar el valor de la median en las observaciones, sabiendo que son 24 observaciones que los intervalos tienen la misma amplitud y que la media aritmética del registro de las temperaturas es -2,5ºC. SOLUCION:
𝑳𝒊 + 𝑳𝒊+𝟏 -18
𝑥̅ =
𝒇𝒊 3
3
-12 – -6
-9
5
8
-6 – 0
-3
10
18
0 – 6
3
1
19
6 – 12
9
3
22
12 – 18
15
2
24
24
3(3 − 3𝑐) + 5(3 − 2𝑐) + 10 (3 − 𝑐) + 3 + 3(3 + 𝑐) + 2(3 + 2𝑐) = −2,5 24 𝐜=𝟔
Mediana
𝑭𝒊
-15
Total
– -12
𝑿𝒊
𝑛 + 𝐹𝑘−1 𝑥̃ = 𝐿. 𝑖𝑛𝑓 + 2 ∗𝑐 𝐹𝑘 + 𝐹𝑘−1
𝒏 𝟐𝟒 = = 𝟏𝟐 𝟐 𝟐 12 − 8 ∗6 18 − 8 𝐱̃ = −𝟑, 𝟔(º𝐂)
𝑥̃ = −6 +
Moda.Simbolizada por 𝑀𝑜𝑑(𝑥) se define como el valor o dato que se repite mas veces. Para datos no agrupados: 𝑀𝑜𝑑(𝑥) = 𝑥𝑜 ↔ 𝑓𝑥𝑜 𝑒𝑠 𝑚𝑎𝑥 Para datos agrupados: Buscamos en la columna de 𝑓𝑖 o ℎ 𝑖 el intervalo en el cual se tiene la máxima frecuencia. 𝒇 𝑴𝒐 𝒇𝟏
𝒇𝒊 𝒐 𝒉𝒊
𝒇𝟐
𝑴𝒐𝒅(𝒙)
𝒇 𝑴𝒐 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑚𝑜𝑑𝑎𝑙 𝒇𝟏 = 𝒇𝒓𝒆𝒄𝒖𝒆𝒏𝒄𝒊𝒂 𝒂𝒏𝒕𝒆𝒓𝒊𝒐𝒓 𝒂 𝒍𝒂 𝒎𝒐𝒅𝒂𝒍 𝒇𝟐 = 𝒇𝒓𝒆𝒄𝒖𝒆𝒏𝒄𝒊𝒂 𝒑𝒐𝒔𝒕𝒆𝒓𝒊𝒐𝒓 𝒂 𝒍𝒂 𝒎𝒐𝒅𝒂𝒍 𝑀𝑜𝑑(𝑥) = 𝐿. 𝑖𝑛𝑓 +
∆1 ∗𝐶 ∆2 + ∆1
Donde: ∆ 1 = 𝒇 𝑴𝒐 − 𝒇𝟏 ∆ 2 = 𝒇 𝑴𝒐 − 𝒇𝟐 En términos de frecuencias relativas
∆ 1 = 𝒉 𝑴𝒐 − 𝒉𝟏 ∆ 2 = 𝒉 𝑴𝒐 − 𝒉𝟐 Entonces: 𝐿. 𝑖𝑛𝑓 = 𝑙𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑚𝑜𝑑𝑎𝑙
Variable
𝐶 = 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑣𝑎𝑙𝑜 𝑚𝑜𝑑𝑎𝑙 Ventajas y desventajas.
Es de fácil calculo No es sensible a datos externos No es manipulable algebraicamente Pueden existir más de un intervalo con la misma frecuencia máxima.
Relación media, mediana y moda.-
𝑥̃ = 𝑥̅ = 𝑀𝑜𝑑(𝑋)
𝑀𝑜𝑑(𝑋) < 𝑥̃ < 𝑥̅
𝑥̃ < 𝑥̅ < 𝑀𝑜𝑑(𝑋)
Una relación empírica relacionada dice: 3 (𝑥̅ − 𝑥̃ ) = 𝑥̅ − 𝑀𝑜𝑑(𝑋) Medidas centrales secundarias.Estas
son: Media geométrica Media Armonica Media Cuadrática
a) Media geométrica: se define como: ̅ 𝑮 = 𝑛√x1 ∗ x2 ∗ x3 ∗ … … … … xk 𝒙
𝐷𝐴𝑇𝑂𝑆 𝑁𝑂 𝐴𝐺𝑅𝑈𝑃𝐴𝐷𝑂𝑆
̅ 𝑮 = 𝑛√x1 𝑓1 ∗ x2 𝑓2 ∗ x3 𝑓3 ∗ … … … … xk 𝑓𝑘 DATOS AGRUPADOS 𝒙 ̅ 𝑮 = x1 ℎ1 ∗ x2 ℎ2 ∗ x3 ℎ3 ∗ … … … … xk ℎ𝑘 𝒙
b) Media Armónica: se define como: DATOS NO AGRIPADOS 1
𝑥̅ 𝐻 =
1 ∑𝑛𝑖=1 𝑥𝑖
DATOS AGRUPADOS 𝑛
𝑥̅ 𝐻 =
𝑜
𝑓 ∑𝑘𝑖=1 𝑖 𝑥𝑖 c) Media Cuadrática: se define como:
𝑥̅ 𝐻 =
1 ∑𝑘𝑖=1
ℎ𝑖 𝑥𝑖
DATOS NO AGRUPADOS. 𝑥 2 + 𝑥 22 + 𝑥3 2 + ⋯ … 𝑥𝑛 2 √ 1 𝑛
𝑛
𝑥𝑐 = DATOS AGRUPADOS
𝑛
𝑘
√∑
𝑥𝑐 =
𝑖=1
𝒏
𝑓𝑖 ∗ 𝑥 𝑖2 𝑛
𝒌
√ ∑𝒉𝒊 ∗ 𝒙𝒊 𝟐
𝒙𝒄 =
𝒊=𝟏
Ejemplo: Una distribución de frecuencias consta de cinco intervalos de clase de igual amplitud y de e l l a se conoce los siguientes datos. 𝑛 = 110 ; 𝑓4 − 𝑓5 = 10 ; 𝑓4 − 𝑓3 − 𝑓1 = 0 ; 𝑓1 = 𝑓5 ; 𝑓2 = 𝑓4 ; 𝐿. 𝑖𝑛𝑓 = 12,5 ; 𝐿. 𝑠𝑢𝑝 = 97,5 Se pide: a) Hallar la tabla de frecuencias b) Determinar la media aritmética, la mediana y la moda c) Hallar la media armónica y media cuadrada SOLUCION: a)
𝑳𝒊 + 𝑳𝒊+𝟏 12,5 – 17,5
𝑿𝒊 15
𝒇𝒊 20
𝑭𝒊 20
𝒉𝒊 0,182
𝑯𝒊 0,182
𝒇𝒊 ∗ 𝒉𝒊 300
17,5 – 22,5
20
30
50
0,273
0,455
600
22,5 – 27,5
25
10
60
0,09
0,545
250
27,5 – 32,5
30
30
90
0,273
0,818
900
32,5 – 37,5
35
20
110
0,182
1
700
Total
110
1
2750
𝐿. 𝑠𝑢𝑝4 = 12,5 + 4𝑐 = 97,5 → 𝑐 = 5 b)
𝑥̃ =
∑ 𝒇𝒊 ∗ 𝒙𝒊 2750 = → 𝐱̃ = 𝟐𝟓 𝑛 110
𝑥̃ = 22,5 +
55 − 50 ∗ 5 → 𝐱̃ = 𝟐𝟓 60 − 50
𝑀𝑜𝑑(𝑥) = 𝐿. 𝑖𝑛𝑓 +
∆1 ∗𝐶 ∆2 + ∆1
∆ 1 = 𝒇 𝑴𝒐 − 𝒇𝟏 ∆ 2 = 𝒇 𝑴𝒐 − 𝒇𝟐 ∆ 1 = 𝒇 𝑴𝒐 − 𝒇𝟏 = 𝟑𝟎 − 𝟐𝟎 = 𝟏𝟎
∆ 2 = 𝒇 𝑴𝒐 − 𝒇𝟐 = 𝟑𝟎 − 𝟏𝟎 = 𝟐𝟎
𝑀𝑜𝑑1 (𝑥) = 17,5 +
10 ∗ 5 = 19,17 10 + 20
∆ 1 = 𝒇 𝑴𝒐 − 𝒇𝟏 = 𝟑𝟎 − 𝟏𝟎 = 𝟐𝟎
∆ 2 = 𝒇 𝑴𝒐 − 𝒇𝟐 = 𝟑𝟎 − 𝟐𝟎 = 𝟏𝟎
𝑀𝑜𝑑2 (𝑥) = 27,5 +
20 ∗ 5 = 30,83 10 + 20
c) 𝑛
𝑥̅𝐻 =
∑𝑘𝑖=1
𝑓𝑖 𝑥𝑖
= 22,89
d) 𝑛
𝑥𝑐 =
𝑘
√∑ 𝑖=1
𝑓𝑖 ∗ 𝑥𝑖 2 = 25,98 𝑛
Medidas de agrupación.Cuando los datos se agrupan de acuerdo a cierto criterio, se tienen;
Cuartiles Deciles Percentiles
Cuartiles.Simbolizados por 𝑄𝑖 1 1 𝑒𝑛 𝑜 25% 𝑒𝑛 25% . 4
nos representan valores cuando agrupan los datos de
4
𝑛 − 𝐹𝑘−1 𝑄1 = 𝐿. 𝑖𝑛𝑓 + 4 ∗𝑐 𝐹𝑘 − 𝐹𝑘−1
𝑜
1 − 𝐻𝑘−1 𝑄1 = 𝐿. 𝑖𝑛𝑓 + 4 ∗𝑐 𝐻𝑘 − 𝐻𝑘−1
Deciles.Simbolizados por 𝐷𝑖 muestran valores que acumulan a los datos de un decimo a un de ci mo e s l o mismo de 10% 𝑒𝑛 10% . 𝑖𝑛 − 𝐹𝑘−1 10 𝐷𝑖 = 𝐿. 𝑖𝑛𝑓 + ∗𝑐 𝐹𝑘 − 𝐹𝑘 −1
𝑖 − 𝐻𝑘−1 10 𝐷𝑖 = 𝐿. 𝑖𝑛𝑓 + ∗𝑐 𝐻𝑘 − 𝐻𝑘−1
𝐷𝑂𝑁𝐷𝐸 ∶ 𝑖 = 1,2,3 … ..
Percentiles.Simbolizados por 𝑃𝑖 muestran valores cuando se agrupan los datos de
1 100
𝑒𝑛
1 100
𝑑𝑒 1% 𝑒𝑛 1%.
𝑖𝑛 + 𝐹𝑘−1 100 𝑃𝑖 = 𝐿. 𝑖𝑛𝑓 + ∗𝑐 𝐹𝑘 + 𝐹𝑘−1
𝑖 + 𝐻𝑘−1 100 𝑃𝑖 = 𝐿. 𝑖𝑛𝑓 + ∗𝑐 𝐻𝑘 + 𝐻𝑘−1
𝐷𝑂𝑁𝐷𝐸 ∶ 𝑖 = 1,2,3 … . .99
EJEMPLO: Si se tiene una distribución de frecuencias simétricas con 6 intervalos de amplitud constante y se tienen los siguientes datos: 𝑛 = 150
𝐿. 𝑠𝑢𝑝5 = 60
𝑓3 = 30
𝑓2 = 𝑓1 + 5
𝑄𝑖 = 43,5
a) Hallar la tabla de frecuencias b) Determinar la media aritmética, la mediana y la moda c) Encontrar el sexto decil y el 88 avo percentil SOLUCION: a)
𝑳𝒊 + 𝑳𝒊+𝟏
𝑿𝒊
𝒇𝒊
𝑭𝒊
𝒇𝒊 ∗ 𝒉𝒊
35 – 40
37,5
20
20
750
40– 45
42,5
25
45
1062,5
45– 50
47,5
30
75
1425
50 – 55
52,5
30
105
1575
55 – 60
57,5
25
130
1437,5
60 – 65
62,5
20
150
1250
Total
110
7500
El primer cuartil: 𝑛 − 𝐹𝑘−1 𝑄1 = 𝐿. 𝑖𝑛𝑓 + 4 ∗𝑐 𝐹𝑘 + 𝐹𝑘−1 𝑛 150 = = 37,5 4 4 Además: 𝑄1 = (60 − 4𝑐) +
37,5 − 20 ∗ 𝑐 = 16,5 → 𝑐 = 5 45 − 20
b) 𝑥̅ =
∑ 𝒇𝒊 ∗ 𝒙𝒊 7500 = →𝒙 ̅ = 𝟓𝟎 𝑛 150
𝑥̃ = 45 +
75 − 45 ∗ 5 → 𝐱̃ = 𝟓𝟎 75 − 45
𝑀𝑜𝑑(𝑥) = 𝐿. 𝑖𝑛𝑓 +
∆1 ∗𝐶 ∆2 + ∆1
∆ 1 = 𝒇 𝑴𝒐 − 𝒇𝟏 ∆ 2 = 𝒇 𝑴𝒐 − 𝒇𝟐 ∆ 1 = 𝒇 𝑴𝒐 − 𝒇𝟏 = 𝟑𝟎 − 𝟐𝟓 = 𝟏𝟎 𝑀𝑜𝑑1 (𝑥) = 45 + ∆ 1 = 𝒇 𝑴𝒐 − 𝒇𝟏 = 𝟑𝟎 − 𝟑𝟎 = 𝟐𝟎 𝑀𝑜𝑑2(𝑥) = 50 +
c)
∆ 2 = 𝒇 𝑴𝒐 − 𝒇𝟐 = 𝟑𝟎 − 𝟑𝟎 = 𝟎 5 ∗ 5 = 50 5 +0 ∆ 2 = 𝒇 𝑴𝒐 − 𝒇𝟐 = 𝟑𝟎 − 𝟐𝟓 5 ∗ 5 = 50 5+0
𝑄3 = 55 +
112,5 − 105 ∗5 130 − 105
𝑃88 = 60 +
= 𝑄3 = 56,50
132 − 130 ∗ 5 = 60,8 150 − 130
𝐷6 = 50 +
90 − 75 ∗ 5 = 52,5 105 − 75
Medidas de dispersión.Es un conjunto de estadígrafos que buscan evaluar cuan dispersos se encuentran los datos respecto a algún valor central. Se puede tener: -Medidas absolutas -Medidas relativas Rango.𝑟𝑎𝑛𝑔𝑜 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛 Rango intercuartilico.𝑅𝑄 = 𝑄3 − 𝑄1 Rango semi- intercuartilico.𝑅𝑆𝑄 =
𝑄3 − 𝑄1 2
Desviación Media.Se define como el promedio ponderado del valor absoluto de las tres desviaciones de cada observación respecto a un lugar elegido. PARA DATOS NO AGRUPADOS: 𝐷𝑀 = 𝑉. 𝐶 =
∑𝑛𝑖=1|𝑥𝑖 − 𝑣. 𝑐| 𝑛
PARA DATOS AGRUPADOS: ∑𝑛𝑖=1|𝑥 𝑖 − 𝑣. 𝑐| 𝐷𝑀 = 𝑉. 𝐶 = 𝑛
𝑣. 𝑐 = 𝑣𝑎𝑙𝑜𝑟 𝑐𝑒𝑛𝑡𝑟𝑎𝑙 𝑒𝑙𝑒𝑔𝑖𝑑𝑜
Se toma: 𝐷𝑀(𝑥̃) = 𝑉. 𝐶 = Ventajas y desventajas.
Fácil calculo
∑𝑛𝑖=1 𝑓𝑖 |𝑥𝑖 − 𝑥̃| 𝑛
No toma en cuenta al signo de desviación
Varianza y desviación estándar.𝑉𝑎𝑟(𝑥) = 𝑠 2 (𝑥) = ∑
𝑘
𝑓𝑖 (𝑥𝑖 − 𝑥̅) 2 𝑛− 1 𝑖=1
La probabilidad de varianza se define como: 𝑉𝑎𝑟 (𝑥) = 𝜎 2 (𝑥) = ∑
𝑘
𝑓𝑖 (𝑥𝑖 − 𝜇) 2 𝑛 𝑖=1
𝑑𝑜𝑛𝑑𝑒 𝜇 = 𝑚𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚𝑒𝑡𝑖𝑐𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙
La varianza poblacional se define como: 𝑉𝑎𝑟(𝑥) = 𝜎 2 (𝑥) = ∑
𝑘
𝑓𝑖 (𝑥𝑖 − 𝜇) 2 𝑛 𝑖=1
Si ≥ 120 = 𝜎 2 (𝑥) = 𝑠 2 (𝑥) ∑𝑘 𝑓𝑖 (𝑥𝑖 − 𝑥̅) 2 𝑠 (𝑥) = √ 𝑖=1 𝑛−1 ∑𝑘 𝑓𝑖 (𝑥𝑖 − 𝜇) 2 𝜎(𝑥) = √ 𝑖=1 𝑛 Intra e intervarianza.Cuando se tiene varios estudios muéstrales del mismo objeto de estudio donde cada muestra tiene su propio tamaño, su propia media aritmética y varianza es posible hallar una varianza global para todas las muestras. 𝑠𝐺 2 (𝑥) =
∑𝑘𝑖=1(𝑛𝑖 − 1)𝑠𝑖 2 (𝑥) ∑𝑘𝑖=1 𝑛𝑖 (𝑥̅𝑖 − 𝑥̅ 𝑃 )2 + 𝑛𝑇 − 1 𝑛𝑇 − 1
Una interpretación grafica del significado de la desviación estándar la podemos apreciar en las curvas de frecuencia de distribuciones simétricas y en los intervalos. Si k=1
Si k=2
Coeficiente de variación.𝑐. 𝑣. =
𝑠(𝑥) 𝑥̅
𝑜
𝑐. 𝑣. =
𝑠(𝑥) ∗ 100% 𝑥̅
Si 𝑐. 𝑣. > 80 % 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 𝑠𝑒 𝑒𝑛𝑐𝑢𝑒𝑛𝑡𝑟𝑎𝑛 𝑚𝑢𝑦 𝑑𝑖𝑠𝑝𝑒𝑟𝑠𝑜𝑠 Si 𝑐. 𝑣. > 20 % 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 𝑠𝑒 𝑒𝑛𝑐𝑢𝑒𝑛𝑡𝑟𝑎𝑛 𝑚𝑢𝑦 𝑐𝑜𝑛𝑐𝑒𝑛𝑡𝑟𝑎𝑑𝑜𝑠
Medidas de deformación.Buscan evaluar la deformación horizontal y vertical de la curva de distribución de frecuencias. Medidas de deformación horizontal.Denominados medidas de sesgo o asimetría analizan si la curva esta inclinada a izquierda o derecha, utilizando el llamado coeficiente de asimetría.
Existen 3 formas del coeficiente de asimetría: Primer coeficiente de Pearson: 𝐴𝑆𝐼 =
3(𝑥𝑖 − 𝑥̃) 𝑠 (𝑥)
Segundo coeficiente de Pearson: 𝐴𝑆𝐼𝐼 =
𝑄3 + 𝑄1 − 2𝑥̃ 𝑠 (𝑥)
Coeficiente de Fisher: ∑𝑘𝑖=1 𝑓(𝑥𝑖 − 𝑥̅) 3 𝑖 𝑛 𝐴𝑆𝑓 = 𝑠 3 (𝑥) Medidas de formación vertical.Llamadas de medidas de curtosis evalúan la deformación vertical de la curva de distribución de frecuencias, pudiendo.
La curtosis se mide con el llamado coeficiente de curtosis Coeficiente
percentilico: 𝑄3 − 𝑄1 𝐾𝑖 = 2(𝑃90 − 𝑃10 ) 𝑠𝑖 𝐾 > 0,263
𝑙𝑒𝑝𝑡𝑜𝑐𝑢𝑟𝑡𝑖𝑐𝑎
𝑠𝑖 𝐾 = 0,263 𝑚𝑒𝑠𝑜𝑐𝑢𝑟𝑡𝑖𝑐𝑎 𝑠𝑖 𝐾 < 0,263
𝑝𝑙𝑎𝑡𝑖𝑐𝑢𝑟𝑡𝑖𝑐𝑎
Coeficiente
demomentos: ∑𝑘𝑖=1 𝑓(𝑥 𝑖 − 𝑥̅) 4 𝑖 𝑛 𝐾𝐼𝐼 = 𝑠 3 (𝑥) 𝑠𝑖 𝐾𝐼𝐼 > 3
𝑙𝑒𝑝𝑡𝑜𝑐𝑢𝑟𝑡𝑖𝑐𝑎
𝑠𝑖 𝐾𝐼𝐼 = 3 𝑚𝑒𝑠𝑜𝑐𝑢𝑟𝑡𝑖𝑐𝑎 𝑠𝑖 𝐾𝐼𝐼 < 3
𝑝𝑙𝑎𝑡𝑖𝑐𝑢𝑟𝑡𝑖𝑐𝑎
Ejemplo: Se han elegido 150 productos para analizar su peso en gramos, los resultados están clasificados en la siguiente tabla. Si se sabe que la media aritmética es 2,14 y la mediana igual a 2,128 se pide: a) Completar la tabla de frecuencias
b) Determinar la varianza y desviación estándar c) Encontrar los coeficientes de asimetría y curtosis SOLUCION:
𝑳𝒊 − 𝑳𝒊+𝟏
𝑿𝒊
𝒇𝒊
𝑭𝒊
𝒇𝒊 ∗ 𝒙𝒊
𝒇𝒊 ∗ 𝒙𝒊 𝟐
2,0 – 2,04
2,02
12
12
24,24
48,9648
2,04 – 2,08
2,06
10
32
41,20
84,872
2,08 – 2,12
2,10
38
70
79,80
167,58
2,12 – 2,16
2,14
25
95
2,14
114,49
2,16 – 2,20
2,18
21
116
2,18
99,8004
2,20 – 2,24
2,22
17
133
2,22
83,7828
2,24 – 2,28
2,26
9
142
20,34
45,9684
2,28 – 2,32
2,32
8
150
18,40
42,32
Total
150
787,7784
𝑥̅ =
∑ 𝒇𝒊 ∗ 𝒙𝒊 = 2,14 𝑛
TAMBIEN: 𝑛 − 𝐹𝑘−1 𝑥̅ = 𝐿. 𝑖𝑛𝑓 + 2 ∗ 𝑐 = 2,128 𝐹𝑘 + 𝐹𝑘−1 RESOLVIENDO:SE TIENE 𝒇𝟒 = 𝟐𝟓 𝒇𝟓 = 𝟐𝟏 𝒇𝟔 = 𝟏𝟕 VARIANZA: 𝑠 2 (𝑥) =
𝑘 1 (∑ 𝑓𝑖 𝑥 𝑖 − 𝑛𝑥̅ 2 ) 𝑛−1 𝑖=1
𝑠(𝑥) = 0,075 𝑐. 𝑣. =
𝑠(𝑥) 0,075 = = 3,5% 𝑥̅ 2,14
3(𝑥𝑖 − 𝑥̃) = 0,48 > 0 𝑠(𝑥)
𝐴𝑆𝐼 =
𝐾𝑖 = 𝑄1 = 2,08 + 𝑄3 = 2,16 +
𝑄3 − 𝑄1 ( 2 𝑃90 − 𝑃10 )
37,5 − 32 ∗ 0,04 = 2,086 70 − 32
112,5 − 95 ∗ 0,04 = 2,1933 116 − 95
Percentil 𝑃10 = 2,04 + 𝑃90 = 2,24 + 𝐾𝐼 =
15 − 12 ∗ 0,04 = 2,046 32 − 12
135 − 133 ∗ 0,04 = 2,2489 142 − 133
2,1933 − 2,086 = 0,2644 > 0,263 𝑙𝑒𝑝𝑡𝑜𝑐𝑢𝑟𝑡𝑖𝑐𝑎 2(2,2489 − 2,046)
CAPITULO º 3 PROBABILIDADES En todo proceso estadístico siempre realizamos un experimento cuyo resultado define el val or de la variable y en consecuencia el del estudio completo. Existen dos tipos de experimentos: -
Experimentos determinísticos.- Se denomina determinístico porque es posible obtener e l resultado sin necesidad de realizar el experimento. Ejemplo:
- Movimiento de un móvil -La temperatura de equilibrio de una mezcla de fases
-
Experimentos no determinísticos.- En estos experimentos no es posible obtener el resultado sin realizar el experimento en si mismo. Ejemplo:
- Lanzamiento de un dado -La cantidad de productos defectuosos en un día de producción
Una probabilidad está relacionada a un experimento determinístico. Evento o Suceso.Es el resultado de un experimento no determinístico. La cantidad de eventos o sucesos se denomina espacio muestral ´´Ω´´. Existe un algebra de eventos o sucesos y a que ellos delimitan conjuntos. Unión de Eventos (Intersección de Eventos).En probabilidades nos interesa cuan probable es que un evento particular suceda, por l o que nos interesa la cantidad de veces que un evento o suceso se pueda dar.
𝑛(𝐴 ∪ 𝐵) = 𝑛(𝐴 ) + 𝑛(𝐵) − 𝑛(𝐴 ∩ 𝐵)
𝑛(𝐴 − 𝐵) = 𝑛(𝐴 ) − 𝑛(𝐴 ∩ 𝐵)
𝑛(𝐴 𝑐 ) = 𝑛𝑈 − 𝑛(𝐴)
𝑛(𝐴 ∪ 𝐵 ∪ 𝐶 ) = 𝑛(𝐴 ) + 𝑛(𝐵) + 𝑛(𝐶 ) − 𝑛(𝐴 ∩ 𝐵) − 𝑛(𝐴 ∩ 𝐶 ) − 𝑛(𝐵 ∩ 𝐶 ) + 𝑛(𝐴 ∩ 𝐵 ∩ 𝐶) Pero en otros experimentos no determinísticos los eventos o sucesos no se pue de n re pre se ntar por conjuntos. Ejemplo:
- Selección de una muestra del universo - La elección de una prenda de vestir en un vestidor - La elección de cinco cartas en una baraja sin comodines
Los anteriores ejemplos responden a criterios de análisis combinatorio. Arreglo o Variación.- De ´´𝑛´´ elementos es posible extraer ´´𝑚´´ según: 𝑛𝐴𝑚 =
𝑛! (sin 𝑟𝑒𝑝𝑒𝑡𝑖𝑐𝑖ó𝑛) (𝑛 − 𝑚 )!
𝑛𝐴𝑚 = 𝑛𝑚
(𝑐𝑜𝑛 𝑟𝑒𝑝𝑒𝑡𝑖𝑐𝑖ó𝑛)
Permutaciones.-De ´´𝑛´´ elementos es posible ordenar de ´´𝑛´´ formas según: 𝑃𝑛 = 𝑛! Combinación.- De ´´𝑛´´ elementos es posible extraer ´´𝑟´´ sin que interese el orden según: 𝑛 𝑛! 𝑛𝐶𝑟 = ( ) = (𝑛 − 𝑟)! 𝑟! 𝑟 Para definir lo que es probabilidad, existen tres formas: Definición de Laplace.Probabilidad de un evento o suceso ´´𝐴´´ es la razón de la cantidad total de opciones en el espaci o muestral. 𝑃(𝐴) =
𝑛𝐴 𝑛Ω
Definición frecuencial.La probabilidad de un evento o suceso ´´𝐴´´ es la razón de la cantidad de veces que se repite el evento con respecto al total de pruebas realizadas. 𝑃(𝐴) =
𝑓𝐴 𝑃 = ℎ𝐴 𝑛Ω (𝐴)
Definición subjetiva.La probabilidad de un evento ´´𝐴´´ cumple: 0 ≤ 𝑃(𝐴) ≤ 1 Si 𝑃(𝐴) = 0 → El evento no ha sucedido (ha sido un fracaso) Si 𝑃(𝐴) = 0 → El evento no ha sucedido (ha sido un fracaso)
Ejemplo: Se extraen 5 cartas al azar de una baraja de 52 cartas. Cuál es la probabilidad de: a) Obtener 2 pares (2 2 𝐾 𝐾 𝑄) b) Obtener un full (𝑄 𝑄 𝑄 𝐽 𝐽) c) Obtener una flor (♠ ♠ ♠ ♠ ♠) Solución:
a) 𝐴 = Dos pares
♦, ♣, ♠, ♥ 13 tipos (𝐴, 2, 3, 4, 5, 6, 7, 8, 9, 10, 𝐽, 𝑄, 𝐾) 13 4 4 44 𝑛𝐴 = ( ) ( ) ( ) ( ) 2 2 2 1 2
𝑃(𝐴) =
(13 )(42) (44 ) 2 1 (52 ) 5
b) 𝐵 = Un full 13 4 4 𝑛𝐵 = ( ) ( ) ( ) 2 3 2 𝑃(𝐵) =
(13 )(43)(42) 2 (52 ) 5
c) Una flor 13 𝑛𝐶 = 4 ( ) 5 𝑃(𝐶) =
) 4(13 5 (52 ) 5
Ejemplo: Un dado está cargado de tal forma que los números pares tienen la misma probabilidad de salir, los números impares tienen la misa probabilidad de salir y cada número par tiene probabilidad doble de salir que la de un número impar. Determinar la probabilidad que: a) Salga un número par b) Salga un número mayor que cuatro 𝑃(𝑝𝑎𝑟)es la misma 𝑃(𝑖𝑚𝑝𝑎𝑟)es la misma
a) 𝑃(𝑝𝑎𝑟) =
2 9
𝑃 (𝑝𝑎𝑟) = 2𝑃(𝑖𝑚𝑝𝑎𝑟) 1, 2, 3, 4, 5, 6 3#𝑃𝑎𝑟𝑒𝑠, 3#𝑖𝑚𝑝𝑎𝑟𝑒𝑠 ⇒ 𝑃(𝑝𝑎𝑟) + 𝑃(𝑖𝑚𝑝𝑎𝑟) = 𝑃Ω ⇒ 3 𝑃 (𝑝𝑎𝑟) + 3 𝑃 (𝑖𝑚𝑝𝑎𝑟) = 𝑃Ω 𝑃Ω = 1 6 𝑃 (𝑝𝑎𝑟) + 3𝑃(𝑖𝑚𝑝𝑎𝑟) = 1 1 2 𝑃(𝑖𝑚𝑝𝑎𝑟) = 𝑃(𝑝𝑎𝑟) = 9 9
1
2
3
1
9
9
9
3
b) 𝑃(# > 4) = 𝑃(5) + 𝑃(6) = + = =
Axiomas de Probabilidad.i) 𝑃(𝐴𝐶) = 1 − 𝑃(𝐴) ii) 𝑃(𝐴∪𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴∩𝐵) iii) 𝑃(𝐴−𝐵) = 𝑃(𝐴) − 𝑃(𝐴∩𝐵) iv) 𝑃(𝐴∪𝐵∪𝐶) = 𝑃(𝐴) + 𝑃(𝐵) + 𝑃(𝐶) − 𝑃( 𝐴∩𝐵) − 𝑃(𝐴∩𝐶) − 𝑃(𝐵∩𝐶) + 𝑃(𝐴∩𝐵∩𝐶)
Ejemplo: Si la probabilidad de A es 0.4, la probabilidad de B es 0.5, entre A y B 0.3, hallar la probabilidad de: a) 𝐴 ∩ 𝐵, b) 𝐴 ∩ 𝐵𝐶 , c) 𝐴 𝐶 ∩ 𝐵𝐶 . a) 𝑃(𝐴∪𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴∩𝐵) = 0.4 + 0.5 − 0.3 𝑃(𝐴∪𝐵) = 0.6
b) 𝑃(𝐴∩𝐵𝐶) = 𝑃(𝐴) − 𝑃 (𝐴∩𝐵) = 0.4 − 0.3
𝑃(𝐴∩𝐵𝐶) = 0.1
c) 𝑃(𝐴𝐶∩𝐵𝐶) = 1 − 𝑃(𝐴∪𝐵) = 1 − 0.6
𝑃(𝐴𝐶∩𝐵𝐶) = 0.4
Ejemplo: Un joyero produce 50000 dijes en forma de corazón con motivos del día de la madre, de los 50000 dijes 720 no están bien moldeadas; 397 presentan ralladuras, 534 no tienen broche, 180 están ralladas y tienen defecto de molduras y 70 además de ralladuras no tienen broche. Cuál es la probabilidad de extraer un dije defectuoso en una caja en que están depositados todos.
𝑃(𝑀) =
720 ; 50000
𝑃(𝑅) =
𝑃(𝑀∩𝑅) =
397 ; 50000
𝑃(𝐵) =
534 50000
180 70 𝑃(𝑅∩𝐵) = 50000 50000
𝑃(𝐷) =Probabilidad de que el dije sea defectuoso 𝑃(𝑀∪𝑅∪𝐵) = 𝑃(𝑀) + 𝑃(𝑅) + 𝑃(𝐵) − 𝑃(𝑀∩𝑅) − 𝑃(𝑀∩𝐵) + −𝑃(𝑅∩𝐵) + 𝑃(𝑀∩𝑅∩𝐵) 1 (720 + 394 + 534 − 180 − 70) 𝑃(𝑀∪𝑅∪𝐵) = 50000 1401 𝑃(𝑀∪𝑅∪𝐵) = 50000 Ejemplo.Los 500 clientes del banco de crédito están categorizados según el número de años que han tenido cuenta de crédito, y por su promedio de saldo de crédito de estos cl ientes, 210 han tenido sal dos menores a 1000 Bs; otros 260 han tenido cuenta de crédito por lo menos 5 años, y 80 han tenido saldos menores a 1000Bs y cuenta de crédito por menos de 5 años. Si se selecciona al azar un cliente, cual es la probabilidad que tenga: a) Un saldo de crédito mayor a 1000 Bs b) Un saldo de crédito menor a 1000 Bs o haya tenido cuenta de crédito por lo menos 5 años c) Un saldo de crédito menor a 1000 Bs y haya tenido cuenta de crédito de por lo menos 5 años Tiempo de Cuenta de Crédito Por el saldo Menos de 5 años Mayor o igual a 5 años Total Menor a 1000 160 50 210 Mayor a 1000 80 210 290 Total 240 260 500 a) 𝑃(𝑆𝑎𝑙𝑑𝑜>1000) =
290 500
=
29 50
b) 𝑃(<1000𝐵𝑠 ∪ ≥5𝑎ñ𝑜𝑠) = 𝑃(<1000) + 𝑃(≥5𝑎ñ𝑜𝑠) − 𝑃(<1000𝐵𝑠 ∩ ≥5𝑎ñ𝑜𝑠) = c) 𝑃(<1000𝐵𝑠 ∩ ≥5𝑎ñ𝑜𝑠) =
50 500
=
210 500
+
260 500
−
50 500
=
21 25
1 10
Probabilidad Condicional.Los ejemplos anteriores siempre han estado referidos a un espacio muestral, ahora vamos a estudiar la probabilidad de un evento 𝐴 condicionada a que un evento 𝐵 ha sucedido.
Nomenclatura: 𝑃(𝐴⁄ ) = Probabilidad del evento 𝐴 dado que 𝐵 ha sucedido 𝐵 𝑃(𝐴∩𝐵) 𝑃(𝐴⁄ ) = 𝐵 𝑃(𝐵) Además: 𝑃(𝐴⁄
𝐵)
=
𝑃(𝐴∩𝐵) 𝑛𝐴∩𝐵 = 𝑃(𝐵) 𝑛Ω
𝑦
𝑃(𝐴⁄ ) = 𝐵
𝑃(𝐴∩𝐵) 𝑃(𝐵)
En consecuencia:
𝑛𝐴∩𝐵 𝑛 𝑃( 𝐴⁄ ) = 𝑛Ω 𝐵 𝐵 𝑛Ω Teorema de la Multiplicación.-
⇒
𝑆𝑖 𝑃(𝐴⁄ ) = 𝐵
𝑃 (𝐴⁄ ) = 𝐵
𝑛𝐴∩𝐵 𝑛𝐵
𝑃(𝐴∩𝐵) 𝑃(𝐵)
𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠: 𝑃(𝐴∩𝐵) = 𝑃(𝐵) ∙ 𝑃( 𝐴⁄ )(Teorema de la multiplicación) 𝐵
Árbol de probabilidades.En el caso de la probabilidad condicional es posible construir un árbol de probabilidades cuando el espacio muestral está dividido en 𝐴1 , 𝐴 2 , 𝐴 3 ,… , 𝐴 𝐾 eventos con la condición de que 𝐴1 ∩ 𝐴𝐽 = ∅ para todo 𝑖 ≠ 𝐽
Donde la probabilidad de un evento en particular es la sumatoria de los productos de las probabilidades en cada rama que conduce al mencionado evento.
Ejemplo: En una urna se tiene 7 bolas rojas y 3 blancas. Se extrae aleatoriamente 3 bolas de la urna, sucesivamente sin reposición. Determinar la probabilidad que las 2 primeras sean rojas y la tercera blanca. 7𝑅 3𝐵 ̅10 ̅̅̅
→se extrae 3
𝑃(𝑅𝑅𝐵) =
7 6 3 21 ∙ ∙ = 10 9 8 120
Ejemplo: Un cazador trata de matar un oso. La probabilidad que aparezca un oso en un radio menor que 𝑅1 es de 0,1 en un radio entre 𝑅1 y 𝑅 2 es de 0,3 y en un radio mayor que 𝑅2 es de 0,2. Si apare ce un oso en un radio menor que 𝑅1 el cazador será capaz de matarlo con una probabilidad de 0,7; con una probabilidad de 0.5 si aparece en un radio entre 𝑅1 y 𝑅2; con una probabilidad de 0,2 si el radio es mayor que 𝑅 2. ¿Cuál es la probabilidad de que el cazador mate a un oso? 𝐴 = El cazador mata un oso 𝐵1 = El oso aparece en un radio < 𝑅1 𝐵2 = El oso aparece en un radio entre𝑅1 y 𝑅2 𝐵3 = El oso aparece en un radio > 𝑅2 𝑃(𝐵1) = 0,1
→
𝑃(𝐴⁄
= 0,7
𝑃(𝐵2) = 0,3
→
𝑃(𝐴⁄
= 0,5
𝑃(𝐵3) = 0,2
→
𝑃(𝐴⁄
= 0,2
𝐵1 ) 𝐵2 ) 𝐵3 )
𝑃(𝐴∩𝐵𝑖 ) 𝑃(𝐵𝑖 ) 𝑃(𝐴∩𝐵𝑖 ) = 𝑃(𝐵𝑖 ) ∙ 𝑃(𝐴⁄ )
𝐶𝑜𝑚𝑜: 𝑃( 𝐴⁄
𝐵𝑖 )
=
𝐵𝑖
⇒ 𝑃(𝐴) = 𝑃(𝐴∩𝐵1 ) + 𝑃(𝐴∩𝐵2 ) + 𝑃(𝐴∩𝐵3) = 𝑃(𝐵1) ∙ 𝑃( 𝐴⁄
𝐵1 )
+ 𝑃( 𝐵2 ) ∙ 𝑃( 𝐴⁄
𝐵2 )
+ 𝑃(𝐵3 ) ∙ 𝑃(𝐴⁄
𝐵3 )
𝑃(𝐴) = 0,1(0,7) + 0,3(0,5) + 0,2(0,2) 𝑃(𝐴) = 0,26 Ejemplo: Un lote de 100 lámparas contiene 10 piezas defectuosas, si se selecciona 4 lámparas aleatoriamente sin reposición, ¿Cuál es la probabilidad? Que: a) Solo una sea defectuosa b) A lo más 2 sean defectuosas.
100 𝐿𝑎𝑚𝑝𝑎𝑟𝑎𝑠 {
10 𝐷𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑎𝑠 ; Se seleccionan 4 al azar 90 𝑁𝑜 𝑑𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑎𝑠
a) 𝑃(1) = 𝑃(𝐷𝑁𝑁𝑁) + 𝑃(𝑁𝐷𝑁𝑁) + 𝑃(𝑁𝑁𝐷𝑁) + 𝑃(𝑁𝑁𝑁𝐷) 10 90 89 88 90 10 89 88 90 89 10 88 90 89 88 10 𝑃(1) = ∙ ∙ ∙ + ∙ ∙ ∙ + ∙ ∙ ∙ + ∙ ∙ ∙ 100 99 98 97 100 99 98 97 100 99 98 97 100 99 98 97 b) 𝑃(1 𝐷𝑒𝑓 ) = 𝑎 99 89 88 87 𝑃(0 𝐷𝑒𝑓 ) = ∙ ∙ ∙ 100 99 98 97 𝑃(2 𝐷𝑒𝑓 ) = 𝑃(𝐷𝐷𝑁𝑁) + 𝑃(𝐷𝑁𝐷𝑁) + 𝑃(𝐷𝑁𝑁𝐷) + 𝑃(𝑁𝐷𝑁𝐷) + 𝑃(𝑁𝑁𝐷𝐷) 10 9 90 89 10 90 9 89 10 90 89 9 90 10 9 89 = ∙ ∙ ∙ + ∙ ∙ ∙ + ∙ ∙ ∙ + ∙ ∙ ∙ 100 99 98 97 100 99 98 97 100 99 98 97 100 99 98 97 90 10 89 9 90 89 10 9 + ∙ ∙ ∙ + ∙ ∙ ∙ 100 99 98 97 100 99 98 97 Teoremas de Probabilidad Total y Teorema de Bayes.Sea un espacio muestral Ω el cual está particionado en 𝐵1 , 𝐵2 , 𝐵3 , … , 𝐵𝐾 eventos tal que 𝐵𝑖 ∩ 𝐵𝑗 = ∅ si 𝑖 ≠ 𝑗. Consideremos un evento 𝐴 en Ω común a todas las particiones.
El objetico es hallar la probabilidad del evento 𝐴 Para ello: 𝑃(𝐴) = 𝑃(𝐴∩𝐵1) + 𝑃(𝐴∩𝐵2) + 𝑃(𝐴∩𝐵3) + ⋯ +𝑃(𝐴∩𝐵𝐾 ) De la probabilidad condicional: 𝑃(𝑥∩𝑦) ⇒ 𝑃(𝑥∩𝑦) = 𝑃(𝑦) ∙ 𝑃(𝑥⁄𝑦) 𝑃(𝑦)
𝑃(𝑥⁄𝑦) = Entonces: 𝑃(𝐴) = 𝑃(𝐵1 ) ∙ 𝑃(𝐴⁄
+ 𝑃(𝐵2 ) ∙ 𝑃(𝐴⁄
𝐵1 )
𝐵2 )
+ ⋯ + 𝑃(𝐵𝐾 ) ∙ 𝑃(𝐴⁄
𝐵𝐾 )
𝐾
𝑃(𝐴) = ∑ 𝑃(𝐵1) ∙ 𝑃(𝐴⁄
𝐵1 )
𝑖=1
(𝑡𝑒𝑜𝑟𝑒𝑚𝑎 𝑑𝑒 𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑡𝑜𝑡𝑎𝑙)
Si ahora analizamos que el evento 𝐴 ha sido un éxito, entonces el objetivo es hallar la probabilidad de que el evento 𝐴 provenga de una partición en particular. 𝑃( 𝐵𝐽⁄ ) = ? 𝐴
Utilizando: 𝑃 (𝐵𝐽⁄
𝐴)
=
𝑃 (𝐵𝐽 ∩𝐴) 𝑃(𝐴)
=
𝑃(𝐴∩𝐵𝐽) 𝑃(𝐴)
𝑃(𝐵𝐽 ) ∙ 𝑃(𝐴 𝑃(𝐵𝐽⁄
𝐴)
=
⁄𝐵𝐽 )
∑𝐾 𝑖=1 𝑃(𝐵𝑖 )
∙ 𝑃(𝐴⁄
(𝑡𝑒𝑜𝑟𝑒𝑚𝑎 𝑑𝑒 𝐵𝑎𝑦𝑒𝑠)
𝐵𝑖 )
Ejemplo: Tres máquinas I, II, III manufacturan en 30, 30 y 40% de la producción total de un cierto artículo. Las máquinas producen 4, 3 y2 % de productos defectuosos respectivamente. Se toma un artícul o al azar y se lo prueba. ¿Cuál es la probabilidad? Que: a) El artículo sea defectuoso b) Si resultó ser defectuoso ¿Cuál es la probabilidad de que lo haya sido manufacturado por la maquina 1 o 3 Producción Máquina
% Producción
% Defectuosos
I
30%
4%
II
30%
3%
40% 2% III a) 𝐷 = El artículo defectuoso 𝑃(𝐷) = 𝑃(𝐼) ∙ 𝑃(𝐷⁄ ) + 𝑃( 𝐼𝐼) ∙ 𝑃(𝐷⁄ ) + 𝑃(𝐼𝐼𝐼) ∙ 𝑃(𝐷⁄ 𝐼
𝑃(𝐷) =
b) 𝑃(𝐼 𝑜 𝐼𝐼𝐼⁄
𝐷)
𝐼𝐼𝐼 )
𝐼𝐼
30 4 30 3 40 2 ∙ + ∙ + ∙ 100 100 100 100 100 100 29 𝑃(𝐷) = 1000
=? 𝑃(𝐼 ∪ 𝐼𝐼𝐼⁄
= 𝑃(𝐼⁄ ) + 𝑃(𝐼𝐼𝐼⁄ ) − 𝑃(𝐼∩ 𝐼𝐼𝐼⁄ ) 𝐷 𝐷 𝐷 𝑃(𝐼) ∙ 𝑃(𝐷⁄ ) 𝑃(𝐼𝐼𝐼) ∙ 𝑃(𝐼𝐼𝐼⁄ ) 𝐼 𝐼𝐼𝐼 𝑃(𝐼 ∪ 𝐼𝐼𝐼⁄ ) = + −0 𝐷 𝑃(𝐷) 𝑃( 𝐷) 30 4 40 2 ∙ + ∙ 100 100 100 100 𝑃(𝐼 ∪ 𝐼𝐼𝐼⁄ ) = 29 𝐷 1000 20 𝑃(𝐼 ∪ 𝐼𝐼𝐼⁄ ) = 𝐷 29 𝐷)
Ejemplo: La urna 1 tiene 3 bolas blancas y 7 negras, la urna 2 tiene 20 bolas de las cuales algunas son blancas y las demás son negras. Se escoge una urna al azar y de ella se extrae una bola, encontrándose que es blanca. Si la probabilidad que esta bola blanca provenga de urna 1 es igual a 1/3, determinar el número de bolas blancas que existían originalmente en la urna 2. 3𝐵 7𝑁
𝑥𝐵 20𝑥 𝑁
10
20 1 𝐵𝑜𝑙𝑎 → 𝐵𝑙𝑎𝑛𝑐𝑎
𝐵 =La bola es blanca 𝑃(𝐼⁄ ) = 1⁄3 𝐵 𝑃(𝐵) = ? → Por Teorema de Probabilidad Total 1
𝑃(𝐵) = ∙
3
2 10
𝑃(𝐵) = Además:
𝑃(𝐼⁄
𝐵)
=
𝑃(𝐼∩𝐵) 𝑃(𝐵)
3 20
+
1
+ ∙
𝑥
2 20
𝑥 40
=
6+𝑥 40
… . (𝛼)
1 3 ∙ 10 = 6 = 1 𝑃(𝐼⁄ ) = =2 6+𝑥 𝑥+6 3 𝐵 𝑃 ( 𝐵) 40 ⇒ 18 = 𝑥 + 6 𝑥 = 12 El número de bolas blancas en la urna 2 es 12 El número de bolas negras en la urna 2 es 8 𝑃(𝐼) ∙ 𝑃(𝐵⁄ ) 𝐼
Ejemplo: De una urna que contiene 6 bolas Blancas y 4 Negras, se transfiere 5 de ellas a una segunda urna que se encuentra vacía. Se toman 3 bolas de esta última urna y se ponen en una caja vacía, se extrae una bola de la caja y resulta ser blanca. ¿Cuál es la probabilidad de que exactame nte 4 de las bolas transferidas de la primera urna a la segunda hayan sido Blancas? 5 I 6𝐵 4𝑁
3 II 𝑥𝐵 5 − 𝑥𝑁
10 𝑇𝑜𝑡𝑎𝑙
5 𝑇𝑜𝑡𝑎𝑙
III 𝑦𝐵 3 − 𝑦𝑁
3 𝑇𝑜𝑡𝑎𝑙
𝑃(𝐵𝑙𝑎𝑛𝑐𝑎) = 4⁄3 3𝐵 → 𝐵 4𝐵 { ⟶ {2𝐵, 1𝑁 → 𝐵 1𝑁 2𝑁, 1𝐵 ∄ 6! 4! (64) ∙ (41) (6 − 4)! ∙ 4! ∙ (4 − 1)! ∙ 1! 5 𝑃(4𝐵 1𝑁) = = = 10 10! (5) 21 (10 − 5)! ∙ 5! 4! (43) (4 − 3)! ∙ 3! 2 𝑃(3𝐵) = 5 = = → 𝑃( 𝐵) = 1 5! 5 (3) (5 − 3)! ∙ 3!
𝑃 (4 de la II hayan sido Blancas) 𝑃(4𝐵 𝑑𝑒 5) = ?
4! 1! (4 − 2) ! ∙ 2! ∙ (1 − 1)! ∙ 1! 3 2 𝑃(2𝐵,1𝑁) = = = → 𝑃(𝐵) = 5 5! 5 3 (3) (5 − 3)! ∙ 3! (64) ∙ (41) (43) (42) ∙ (11) 2 5 2 2 2 [ ∙1+ ∙ ] 𝑃(4𝐵 𝑑𝑒 5) = ∙[ 5 ∙1+ ∙ ]= 10 5 (5) 3 21 5 3 3 (3) (3) 38 𝑃(4𝐵 𝑑𝑒 5) = 189 (42) ∙ (11)
CAPITULO º 4 VARIABLE ALEATORIA UNIDIMENCIONAL Hasta el momento se ha encontrado las probabilidades de eventos específicos del espacio muestral. Ahora buscaremos generalizar las probabilidades para eventos que respondan alguna característica semejante. Para ello necesitamos generar funciones de probabilidades y sobre ellas analizar sus es tadígrafos principales, ello se realiza generando una variable que represente a los eventos. Definición.La variable aleatoria unidimensional se define como una función que asocia a todo e ve nto e n e l espacio muestral un valor real. Ω
xЄ
W1 W2 : : Wk
x1 x2 : : xk
Los valores de “x” pueden ser de dos tipos:
Variable Aleatoria Discreta.-
Si x es un valor fijo dentro de un intervalo.
Variable Aleatoria Continua.-
Si x admite infinitos valores dentro de un intervalo. Ejemplo: Sea el experimento E: lanzar 3 monedas y observar el resultado. El espacio asociado a este experimento es. Ω = {(𝐶; 𝐶; 𝐶 ); (𝐶; 𝐶; 𝑆); (𝐶; 𝑆; 𝐶 ); (𝑆; 𝐶; 𝐶 ); (𝐶; 𝑆; 𝑆) ; (𝑆: 𝐶: 𝑆); (𝑆; 𝑆; 𝐶 ); (𝑆; 𝑆; 𝑆)} Solución Sea x: número de caras obtenidas en las 3 monedas, entonces x es una variable al e atori a que toma los siguientes valores 𝑥 = 0 𝑐𝑜𝑟𝑟𝑒𝑠𝑝𝑜𝑛𝑑𝑒 𝑎𝑙 𝑒𝑣𝑒𝑛𝑡𝑜 (𝑆; 𝑆; 𝑆) = 1⁄8
𝑥 = 1 𝑐𝑜𝑟𝑟𝑒𝑠𝑝𝑜𝑛𝑑𝑒 𝑎𝑙 𝑒𝑣𝑒𝑛𝑡𝑜 (𝐶; 𝑆; 𝑆); (𝑆; 𝐶; 𝑆) ; (𝑆; 𝑆; 𝐶 ) = 3⁄8 𝑥 = 2 𝑐𝑜𝑟𝑟𝑒𝑠𝑝𝑜𝑛𝑑𝑒 𝑎𝑙 𝑒𝑣𝑒𝑛𝑡𝑜 (𝐶; 𝐶; 𝑆); (𝐶; 𝑆; 𝐶 ); (𝑆; 𝐶; 𝐶 ) = 3⁄8 𝑥 = 3 𝑐𝑜𝑟𝑟𝑒𝑠𝑝𝑜𝑛𝑑𝑒 𝑎𝑙 𝑒𝑣𝑒𝑛𝑡𝑜 (𝐶; 𝐶; 𝐶 ) = 1⁄8 En resumen, las probabilidades de estos eventos son: 𝑃[𝑥=0] = 𝑃[(5;5;5)] =
1 8
𝑃[𝑥=1] = 𝑃[(𝐶;5;5);(5;𝐶;5);(5;5;𝐶)] =
3 8
𝑃[𝑥=2] = 𝑃[(𝐶;𝐶;5);(𝐶;5;𝐶);(5;𝐶;𝐶)] =
3 8
𝑃[𝑥=3] = 𝑃[(𝐶;𝐶;𝐶)] =
1 8
El rango de la variable aleatoria X es el conjunto 𝑅𝑥 = {0; 1; 2; 3} Ejemplo: Se lanza una moneda 3 veces, sea x una función definida por 𝑋(𝑊) = 𝑛𝑐 − 𝑛𝑠 , donde 𝑛𝑐 representa el numero de caras y 𝑛𝑠, numero de sellos obtenidos; x, asi definido es una variable aleatoria. Solución Sabemos que el espacio muestral (dominio de x) es Ω = {(𝐶; 𝐶; 𝐶 ); (𝐶; 𝐶; 𝑆); (𝐶; 𝑆; 𝐶 ); (𝑆; 𝐶; 𝐶 ); (𝐶; 𝑆; 𝑆) ; (𝑆: 𝐶: 𝑆); (𝑆; 𝑆; 𝐶 ); (𝑆; 𝑆; 𝑆)} Los correspondientes valores de x (imágenes de x) son: 𝑋(𝐶𝐶𝐶) = 3 − 0 = 3 𝑋(𝐶𝐶𝑆) = 𝑋(𝐶𝑆𝐶) = 𝑋(𝑆𝐶𝐶) = 2 − 1 = 1 𝑋(𝑆𝑆𝐶) = 𝑋(𝑆𝐶𝑆) = 𝑋(𝐶𝑆𝑆) = 1 − 2 = −1 𝑋(𝑆𝑆𝑆) = 0 − 3 = −3 𝑅𝑥 = {−3; −1; 1; 3}
Funciones o Ley de Probabilidad.Es una función que asocia a todo valor de variable aleatoria una probabilidad entre 0 y 1. Si se tiene la variable aleatoria 𝑋 = 𝑋(𝑊) ; 𝑤 Є Ω, entonces es posible definir una funci ón "𝑃(𝑋)" llamada función de probabilidad.
Ω
x
1
W1 W2 : : Wk
𝑃(𝑋1) 𝑃(𝑋2) : : 𝑃(𝑋𝑘)
x1 x2 : : xk Єℝ
Se debe verificar:
𝑃(𝑋)
0
𝑘
∑ 𝑃(𝑋𝑖 ) = 1 𝑖=1
Como existen dos tipos de variable aleatoria, existen entonces funciones de probabilidad para Variable Aleatoria Discreta y Variable Aleatoria Continua. Función de Probabilidad de una Variable Aleatoria.Sea 𝑋: Ω → ℝ una variable aleatoria que toma los valores 𝑋1 , 𝑋2 , 𝑋3 , … Se dice que 𝑃(𝑋𝐼 ) es una función de probabilidad o una distribución de la variable aleatoria X si cada valor de 𝑋𝐼 se le asoci a su probabilidad de ocurrencia, esto es. 𝑃 (𝑋𝑖 ) = 𝑃[𝑋=𝑋𝑖] = 𝑃[𝑊 Є ℝ/
𝑋(𝑊)=𝑋𝑖]
;
⋁𝑖 = 1,2,3, ….
Ejemplo: Tres bolas son aleatoriamente seleccionadas sin reposición de una urna que contiene 20 bolas numeradas del 1 al 20. Si Edwin apuesta que al menos una de las bolas seleccionadas tiene un número mayor o igual que 17, ¿Cuál es la probabilidad de que Edwin gane la apuesta? Solución Sea X: el máximo de los números anotados en 3 bolas extraídas de la urna sin reposición. Entonces X es una variable aleatoria que toma los valores 3, 4, …, 20 ) = 1140, lo El número total de maneras de seleccionar 3 bolas de un total de 20 es (20 3 cual indica que el espacio muestral tiene 1140 elementos simples. Por otro lado, 𝑋 = 𝑖 (𝑖 = 3, 4, … , 20) corresponde al evento de que una bola de las 3 seleccionadas esta numerada con i y las 2 bolas restantes con números comprendidos entre 1 y 𝑖 − 1
Luego el número de maneras de obtener una bola numerada con i y 2 bolas comprendidas ). Al suponer que cada una de las (20 ) = 1140 posibles entre 1 y 𝑖 − 1 es (11)(𝑖−1 2 3 selecciones son igualmente probables, se tiene 𝑃[𝑋=𝑖] =
(11)(𝑖−1 ) 2 (20 ) 3
;
𝑖 = 3, 4, … , 20
𝑋 ≥ 17 1! 16! 0! 14! 2! = 2 = 0.105 𝑃 [𝑋=17] = 20 = 1!20! (3) 19 17! 3! (11)(16 ) 2
1! 17! 0! 15! 2! = 34 = 0.119 𝑃 [𝑋=18] = 20 = 1!20! (3) 285 17! 3! (11)(17 ) 2
1! 18! 0! 16! 2! = 51 = 0.134 𝑃[𝑋=19] = 20 = 1!20! (3) 380 17! 3! (11)(18 ) 2
1! 19! 0! 17! 2! = 3 = 0.150 𝑃[𝑋=20] = 20 = 1!20! (3) 20 17! 3! (11)(19 ) 2
Como 𝑋 ≥ 17; es la unión de los eventos disjuntos {𝑋 = 6} ; 𝑖 = 17, 18, 19, 20 𝑃[𝑋≥17] = 𝑃[𝑥=17] + 𝑃[𝑥=18] + 𝑃[𝑥=19] + 𝑃[𝑥=20] 𝑃 [𝑋≥17] = 0.105 + 0.119 + 0.134 + 0.150 𝑃[𝑋≥17] = 0.508 Ejemplo: Tres bolas son aleatoriamente seleccionadas de una urna que contiene 3 bolas blancas, 3 rojas y 5 negras, suponga que se gana S/.1 por cada bola blanca seleccionada y se pierde S/.1 por cada bol a roja seleccionada. Halle la función de probabilidad de la variable aleatoria X, definida como ganancia neta obtenida en el experimento. Solución. Evento R: Bola extraída es roja B: Bola extraída es blanca N: Bola extraída es negra
URNA 3B Ω = 3R 5N
Ω = 11
Si salen: RRR RRN RNN o RRB NNN o RBN BNN o RBB BBN BBB
se pierde se pierde se pierde se pierde se pierde se pierde se pierde
X = -3 X = -2 X = -1 X= 0 X= 1 X= 2 X= 3
Ω = {𝑅𝑅𝑅, 𝑅𝑅𝑁, 𝑅𝑁𝑁, 𝑁𝑁𝑁, 𝐵𝐵𝐵, 𝐵𝐵𝑁, 𝐵𝑁𝑁, 𝑅𝑅𝐵, 𝑅𝐵𝐵, 𝑅𝑁𝐵} Ω = {−3, −2, −1, 0, 3, 2, 1, −1, 1, 0} 𝑅𝑥 = {−3, −2, −1, 0, 1, 2, 3} Las probabilidades 3! 0! 3! = 1 𝑃[𝑋=−3] = 11 = 11! (3) 165 8! 3! (33)
3! 5! 1! 4! 1! = 1 𝑃 [𝑋=−2] = 11 = 2! 11! (3) 11 8! 3! (32)(51)
𝑃[𝑋=−1] =
𝑃[𝑋=0] =
X 𝑷(𝑿) = 𝑷[𝑿=𝑿]
(31)(52) + (32)(31) (11 ) 3
(53) + (31)(31)(51) (11 ) 3 -3 -2 1 1 165 11
3! 5! 3! 3! + 2! 1! 3! 2! 1! 2! 2! 1! = 13 = 11! 55 8! 3!
5! 3! 3! 5! + 2! 3! 2! 1! 2! 1! 4! 1! = 55 = 11! 165 8! 3!
-1 13 55
0 1 55 13 165 55
2
3
1 11
1 165
Probabilidad de que se gane es 𝑃[𝑋=𝐼] = 𝑃[𝑋=1] + 𝑃[𝑋=2] + 𝑃 [𝑋=3] 𝑃[𝑋=𝐼] =
13 1 1 1 + + = 55 11 165 3
Distribución Acumulada de Probabilidad.La función de distribución acumulada de una variable aleatoria X, denotada por F, es una funci ón 𝐹: ℝ → [0; 1], definida por la regla de correspondencia 𝐹(𝑋) = 𝑃[𝑋≤𝑋] = 𝑃[〈𝑊: 𝑋(𝑊)≤𝑋〉]
;
⋁𝑋Єℝ
“En otras palabras, 𝐹(𝑋)denota la probabilidad de que la variable aleatoria X tome valores menores o iguales a X” La función de distribución acumulada F de una variable aleatoria X tiene las siguientes propiedades. P-1:
𝐹(𝑋) es una función no decreciente, esto es, si para todo 𝑋1 , 𝑋2 Є ℝ con 𝑋1 < 𝑋2 , entonces 𝐹(𝑋1) ≤ 𝐹(𝑋2).
P-2:
𝐹(𝑋) es una función cuadrada por la derecha, esto es: lim+ 𝐹(𝑋) = 𝐹(𝑋0)
P-3: P-4.
𝑋→𝑋0
lim 𝐹(𝑋) = 0 Y lim 𝐹(𝑋) = 1, Luego se puede escribir, 𝐹(+∞) = 0 y 𝐹(−∞) = 0
𝑋→−∞
𝑋→+∞
Para todo 𝑎, 𝑏 Є ℝ, con 𝑎 < 𝑏, se tiene: 𝑃[𝑎<𝑥≤𝑏] = 𝑃[𝑥≥𝑏] − 𝑃[𝑥≤𝑎] = 𝐹(𝑏) − 𝐹(𝑎)
P-5:
Para todo 𝑎, 𝑏 Є ℝ, se tiene: 𝑃[𝑎≤𝑥≤𝑏] = 𝐹( 𝑏) − 𝐹(𝑎) + 𝑃[𝑥=𝑎]
P-6:
Para todo 𝑎, 𝑏 Є ℝ, ta que 𝑎 < 𝑏, se tiene: 𝑃[𝑎<𝑥<𝑏] = 𝐹( 𝑏) − 𝐹(𝑎) − 𝑃[𝑥=𝑏 ]
P-7:
Para todo 𝑏 Є ℝ, se tiene: 𝑃[𝑥>𝑏] = 1 − 𝑃[𝑥≤𝑏] = 1 − 𝐹(𝑏)
P-8:
Para todo 𝑏 Є ℝ, se tiene: 1 1 1 𝑃[𝑥<𝑏] = 𝑃 [ lim (𝑥 ≤ 𝑏 − )] = lim 𝑃 (𝑥 ≤ 𝑏 − ) = lim 𝐹 (𝑏 − ) 𝑛→+∞ 𝑛→+∞ 𝑛→+∞ 𝑛 𝑛 𝑛
Ejemplo: Suponga que la función de distribución acumulada de la variable aleatoria X es dada por:
0 , 𝑋 , 2 2 𝑓(𝑥) = , 3 11 , 12 { 1,
𝑠𝑖 𝑥 < 0 𝑠𝑖 0 ≤ 𝑋 < 1 𝑠𝑖 1 ≤ 𝑋 < 2 𝑠𝑖 2 ≤ 𝑋 < 3 𝑠𝑖 𝑥 > 3
a) Esboce la gráfica de 𝐹(𝑋) b) Calcule i. 𝑃 [𝑋<3] iii. 𝑃[𝑋>1⁄
ii. 𝑃[𝑋=1] iv. 𝑃[2<𝑋≤4]
2]
SOLUCION. a) La gráfica:
b) 1
1
11
11
𝑛
𝑛→+∞ 12
12
i.
𝑃[𝑋<3] = lim 𝑃 [𝑋 ≤ 3 − ] = lim 𝐹 (3 − ) = lim ( ) =
ii.
𝑃[𝑋=1] = 𝑃[𝑋 ≤ 1] − 𝑃 [𝑋 < 1] = 𝐹(1) − lim 𝐹 (1 − ) = − =
iii.
𝑃[𝑋>1⁄ ] = 1 − 𝑃 [𝑋 ≤ ] = 1 − 𝐹 ( ) = 1 − =
iv.
𝑃[2<𝑋≤4] = 𝐹(𝑏) − 𝐹 (𝑎) = 𝐹 (4) − 𝐹(2) = 1 −
𝑛
𝑛→+∞
𝑛→+∞
𝑛→+∞
2
1
1
1
3
2
2
4
4
11 12
=
1
2
1
1
𝑛
3
2
6
1 12
Variables Aleatorias Discretas.Se dice que una función 𝑋: Ω → ℝ es una variable aleatoria discreta si el rango de X es un conjunto finito o infinito numerable, esto es, existe un conjunto finito 𝑅𝑋 = {𝑋1 , … , 𝑋𝐾 } ϲ ℝ (conjunto infinito numerable) talque: 𝑋(𝑊 ) Є 𝑅𝑋
,
⋁𝑤 ЄΩ
Ejemplo: Sea X la variable aleatoria que denota el número de veces que se lanza al aire una moneda correcta antes de que aparezca la primera cara. El espacio muestral asociado a este expe ri mento es: Ω = {𝐶, 𝑆𝐶, 𝑆𝑆𝐶, 𝑆𝑆𝑆𝐶, … } Solucion 𝑋( 𝐶) = 1
𝑋( 𝑆𝐶) = 2
𝑋(𝑆𝑆𝐶) = 3
… … … ….
Luego 𝑅 𝑋 = {1, 2, 3, … } es un conjunto infinito numerable. Por lo tanto, X es una vari abl e aleatoria discreta con un número infinito de posibles valores. Función de Probabilidad de una Variable Aleatoria Discreta.La función de probabilidad se denomina función de cuantía como el valor de 𝑋𝑖 es fijo y úni co e n un intervalo, entonces podemos formar una tabla de probabilidades: X 𝑿𝟑 … 𝑿𝒌 𝑿𝟏 𝑿𝟐 𝑷(𝑿) 𝑃(𝑋1) 𝑃(𝑋2) 𝑃(𝑋3) … 𝑃(𝑋𝑘) Gráficamente:
La función de cuantía debe verificar ∑ 𝑃(𝑋) = 1 𝑅𝑋
Función de Distribución a Función Acumulada de Probabilidad.Llamada generalmente distribución de la variable aleatoria “X” se define como: 𝑋
∑ 𝑃(𝑋𝑖) 𝑖=1
En variable aleatoria discreta puedo generar una fila que muestre el acumulado de las probabilidades:
X 𝒑(𝑿) 𝑷 (𝑿)
𝑿𝟏 𝑝(𝑋1) 𝑝(𝑋1)
𝑿𝟐 𝑝(𝑋2) 𝑝(𝑋1) + 𝑝(𝑋2)
𝑿𝟑 𝑝(𝑋3) 𝑝(𝑋1) + 𝑝(𝑋2) + 𝑝(𝑋3)
… …
𝑿𝒌 𝑝(𝑋𝑘) 1
Generalmente: ⟦𝑋𝑗 ⟧
∑ 𝑃( 𝑋𝑖 ) 𝑅𝑋
Propiedades: i.
𝑃(𝑋 ≤ 𝑋0 ) = 𝑃 (𝑋 = 𝑋0 )
ii.
𝑃(𝑋 ≥ 𝑋0 ) = 1 − 𝑃(𝑋 = 𝑋0 )
iii.
𝑃(𝑎 < 𝑋 ≤ 𝑏) = 𝑃(𝑋 = 𝑏) − 𝑃 (𝑋 = 𝑎)
iv.
𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = 𝑃(𝑋 = 𝑏) − 𝑃 (𝑋 = 𝑎) + 𝑃(𝑋 = 𝑎)
v.
𝑃(𝑎 < 𝑋 < 𝑏) = 𝑃(𝑋 = 𝑏) − 𝑃 (𝑋 = 𝑎) − 𝑃(𝑋 = 𝑏)
Ejemplo: Halle la distribución de probabilidad de la variable aleatoria X, definida como el núme ro de caras que se obtienen al arrojar 5 monedas Solucion Se tiene i.
X: número de caras que se obtiene al arrojar 5 monedas.
El valor de la varianza X esta es, 𝑋 = 𝑥 puede ser cualquiera de los enteros 0, 1, 2, 3, 4 𝑜 5 En consecuencia, el rango de X es: 𝑅𝑋 = {0, 1, 2, 3, 4, 5}
ii.
El espacio muestral asociado a este experimento tiene 25 = 32 elementos. Luego el denominador para todas las probabilidades y, por lo tanto, para nuestra función de probabilidad es 32. Para calcular el número de formas de obtener, digamos 3 caras, necesitamos el número de formas de separar cinco resultados en dos celdas con 3 caras y dos sellos asignados a la otra. Esto puede hacerse de (53) = 10 monedas. En general, X
caras y 5-x sellos pueden ocurrir en (𝑋5 ) formas, donde “X” puede tomar valores 0, 1, 2, 3, 4, 5. Así la función de probabilidad es dada por: 𝑝(𝑋) = 𝑃[𝑋=𝑥 ] =
(𝑋5) 32
;
𝑋 = 0, 1, 2, 3, 4, 5
a) 5! 5 5! 𝑝(𝑋=0) = 𝑃[𝑋=0] = = 0! = 32 32 32 (50)
5! 5 4! 𝑝(𝑋=1) = 𝑃[𝑋=1] = = 1! = 32 32 32 (51)
5! 5 𝑝(𝑋=2) = 𝑃[𝑋=2] = = 3! 2! = 32 32 16 (52)
5! 5 3! 𝑝(𝑋=3) = 𝑃[𝑋=3] = = 2! = 32 32 16 (53)
5! 5 1! 𝑝(𝑋=4) = 𝑃[𝑋=4] = = 4! = 32 32 32 (54)
5! 1 0! 𝑝(𝑋=5) = 𝑃[𝑋=5] = = 5! = 32 32 32 (55)
b) La tabla de distribución de probabilidades es:
c) Diagrama
X
0
1
2
3
4
5
𝑷(𝑿) = 𝑷[𝑿=𝑿]
1 32
2 32
5 16
5 16
5 32
1 32
d) ∑𝑅𝑋 𝑃(𝑋 ) = 1 1 5 5 5 5 1 + + + + + =1 32 32 16 16 32 32 12 10 6 10 + = + =1 32 16 16 16 16 =1 16 Ejemplo: La función de probabilidad de una variable aleatoria X es dada por 𝑝(𝑋) = donde λ es un número positivo.
𝐶𝜆𝑋 𝑋!
; 𝑋 = 0, 1, 2, 3, …,
a) Encuentre el valor de C b) Calcule 𝑃[𝑋=2] Solución 𝐶𝜆𝑋
𝜆𝑋
∞ ∞ Como∑∞ 𝑋=0 𝑃( 𝑋 ) = 1 , entonces se tiene ∑ 𝑋=0 𝑋! = 1 lo cual es equivalente a 𝐶 ∑ 𝑋=0 𝑋! = 1, al emplear que ∞ 𝑋𝑖 𝑒𝑥 = ∑ = 1 𝑠𝑒 𝑡𝑖𝑒𝑛𝑒 𝐶𝑒 𝜆 = 1 𝑖! 𝐶=𝑜
𝐶 = 𝑒 −𝜆
𝑃[𝑋=2] = 𝑝 (𝑋) = 𝑝(2) =
𝑒 −𝜆 𝜆2 2!
1 𝑝 (2) = 𝑒 −𝜆 𝜆2 2 Ejemplo: Se lanza una moneda tres veces, definiendo 𝑋(𝑊) = 𝑛𝐶 − 𝑛𝑆. Hallar la distribución de probabilidad en forma tabular y graficar. Solución Ω = {𝐶𝐶𝐶, 𝐶𝐶𝑆, 𝐶𝑆𝑆, 𝐶𝑆𝐶, 𝑆𝑆𝐶, 𝑆𝐶𝑆, 𝑆𝑆𝑆, 𝑆𝐶𝐶 } Por
Ω=8
𝑋(𝑊) = 𝑛𝐶 − 𝑛𝑆 𝑋(𝐶𝐶𝐶) = 3 − 0 = 3 𝑋(𝐶𝐶𝑆) = 2 − 1 = 1 𝑋(𝐶𝑆𝑆) = 1 − 2 = −1 𝑋(𝐶𝑆𝐶) = 2 − 1 = 1
𝑋(𝑆𝑆𝐶) = 1 − 2 = −1 𝑋(𝑆𝐶𝑆) = 1 − 2 = −1 𝑋(𝑆𝑆𝑆) = 0 − 3 = −3 𝑋(𝑆𝐶𝐶) = 2 − 1 = 1
𝑅𝑋 = {−3, −1, 1, 3} Hallando las probabilidades 𝑃(𝑥=3) = 𝑃( 𝐶𝐶𝐶) = 𝑃(𝑥=1) = 𝑃 (𝐶𝐶𝑆) + 𝑃( 𝐶𝑆𝐶) + 𝑃( 𝑆𝐶𝐶) =
𝜂𝐶𝐶𝐶 1 = 𝜂Ω 8
𝜂𝐶𝐶𝑆 𝜂𝐶𝑆𝐶 𝜂𝑆𝐶𝐶 1 1 1 3 + + = + + = 𝜂Ω 𝜂Ω 𝜂Ω 8 8 8 8
𝑃(𝑥=−1) = 𝑃( 𝐶𝑆𝑆) + 𝑃( 𝑆𝐶𝐶) + 𝑃(𝑆𝐶𝑆) =
𝜂𝐶𝑆𝑆 𝜂𝑆𝐶𝐶 𝜂𝑆𝐶𝑆 1 1 1 3 + + = + + = 𝜂Ω 𝜂Ω 𝜂Ω 8 8 8 8
𝑃(𝑥=−3) = 𝑃(𝑆𝑆𝑆) =
𝜂𝑆𝑆𝑆 1 = 𝜂Ω 8
a) En forma tabular X
1 𝑷(𝑿)
3 3 8
1 8
-3 1 8
-1 3 8
b) Gráfica:
Ejemplo: LA urna I (uno) contiene una ficha blanca y dos negras, la urna II (dos) tres blancas y dos ne gras. Y la urna III (tres) dos fichas blancas y tres negras. Extraemos una ficha de cada urna y llamamos “X” a la variable aleatoria que representa el número de fichas blancas extraídas, determinar. a) La función de cuantía de la variable aleatoria b) La función de distribución c) Probabilidad acumulada entre 𝑃 (1 < 𝑋 ≤ 2) Solucion
Planteo
X = número de fichas blancas a) 𝑝(𝑋) = ? Ω = {𝑁𝑁𝑁, 𝐵𝑁𝑁,𝑁𝐵𝑁, 𝑁𝑁𝐵, 𝐵𝐵𝑁, 𝐵𝑁𝐵, 𝑁𝐵𝐵, 𝐵𝐵𝐵}
Ω=8
𝑅𝑋 = {0, 1, 2,3} Ejemplo: Para cada uno de las siguientes funciones, determine la constante k para que 𝑓(𝑋) sea una funci ón de probabilidad de una variable aleatoria X. a) 𝑓(𝑋 ) = 𝑥𝑘
1 𝑋
b) 𝑓(𝑋 ) = 𝑘 ( ) 3
;
𝑥 = 1, 2, 3, … , 10
;
𝑥 = 1, 2, 3, …
Solución a) Para que 𝑓(𝑋 ) sea una función de probabilidad debe cumplir la definición de esta 1. 𝑓(𝑋) = 𝑘𝑋 > 0 ;
⋁𝑥 = 1, 2, … , 10.
𝑠𝑖 𝑦 𝑠𝑜𝑙𝑜 𝑠𝑖 𝑘 > 0
2. ∑10 𝑋=1 𝑘𝑋 = 𝐾 [1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 + 10] = 1 𝑘=
𝑓(𝑋 ) = b)
1 55
𝑋 55
1 𝑋
1. 𝑓(𝑋) = 𝑘 ( ) > 0 ;
𝑋 = 1, 2, 3, … , 10
⋁𝑥 = 1, 2, … , 10.
3
𝑠𝑖 𝑦 𝑠𝑜𝑙𝑜 𝑠𝑖 𝑘 > 0
1 𝑋
𝐾
1
1 2
𝑘
3
3
3
3
3 1−
2. ∑∞ 𝑋=1 𝑘 ( ) = [1 + + ( ) + ⋯ ] = [ 𝑘=2
1
1
3
3
2
] = 𝑘( )( ) = 1
1 3
1 𝑋 𝑓(𝑋) = 2 ( ) 3
𝑋 = 1, 2, 3, …,
VARIABLES ALEATORIAS CONTINUAS.Si el rango 𝑅𝑋; de una variable aleatoria X es un intervalo sobre la recta de los números real e s, se llama variable aleatoria continua Función de Densidad de Probabilidad Sea X una variable aleatoria continua con rango 𝑅𝑋. “La función de densidad de probabilidad” asociado a la variable aleatoria, es una función 𝑓(𝑋) integrable que satisface las siguientes condiciones: 1. 𝑓(𝑋 ) ≥ 0 ,
𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑜 𝑥 Є ℝ
.
2. ∫𝑅𝑋 𝑓(𝑋) 𝑑𝑥 = 1
𝑜
(𝑜
𝑓(𝑋 ) > 0 , 𝑥 Є 𝑅𝑋
+∞
∫−∞ 𝑓(𝑋 )𝑑𝑥 = 1
Función de Distribución Acumulada de una Variable Aleatoria Continua.Sea X una variable aleatoria continua con función de densidad de probabilidad 𝑓(𝑋). La funci ón de distribución acumulada de la variable aleatoria X es dada por: 𝑥
𝐹(𝑋 ) = 𝑃[𝑋≤x] = ∫ 𝑓(𝑥) 𝑑𝑥
,
⋁𝑥 Є ℝ
−∞
Su área sombreada será:
Se prueba que 𝑓(𝑥 ) =
𝑑𝐹(𝑥) 𝑑𝑥
para todo X en el cual 𝐹( 𝑥) es derivable. +∞
Como 𝐹(+∞) = 1, entonces se cumple: ∫−∞ 𝑓( 𝑥 )𝑑𝑥 = 1 Nota: Para variable aleatoria continua la función de distribución siempre es el acumul ado menor o igual que, es decir: i.
𝑃(𝑋≤𝑋0) = 𝑃(𝑋=𝑋0)
𝑃(𝑋≥𝑋0) = 1 − 𝑃( 𝑋≤𝑋0) 𝑃(𝑎≤𝑋≤𝑏) = 𝑃( 𝑋=𝑏) − 𝑃(𝑋=𝑎)
ii. iii.
Ejemplo: Sea X una variable aleatoria con función de densidad. 𝑎 (3𝑥 − 𝑥 2 ) , 𝑓(𝑥) = { 0 , a) b) c) d)
0≤𝑥≤3 𝑒𝑛 𝑜𝑡𝑟𝑜𝑠 𝑐𝑎𝑠𝑜𝑠
Hallar el coeficiente a. Construir la gráfica de la función de densidad de probabilidad. Calcular la probabilidad que X se encuentre en el intervalo [1,2] 3 Hallar la probabilidad que X se encuentre en el intervalo 〈−1, 〉 2
Solución a) Como todos los valores de variable aleatoria X se hallan comprendidos en el intervalo [0,3] es decir 𝑅 𝑋 = {0,3}, entonces, por la condición (2) de la definición de la densidad. 3
∫ 𝑎 (3𝑥 −
3
3
𝑥 2 )𝑑𝑥 =
𝑎 ∫ (3𝑥
0
− 𝑥 2 )𝑑𝑥 =
0
𝑎(
3𝑥 2 𝑥 3 𝑎 − ⌋ =1 2 3 0
3 32 32 − )=1 2 2 𝑎=
2 9
b) La grafica de la función 𝑓 (𝑥) en el intervalo [0,3] es la parábola.
2 2 𝑦 = 𝑥 − 𝑥2 3 9
c) La probabilidad que la variable X se encuentre en el intervalo [1,2] se determi na, por la ecuación (∗) 2
2
2 2 2𝑥 2 2 𝑥 3 7 ) = 𝑃 [1≤𝑥≤2] = ∫ ( 𝑥 − 𝑥 2 ) 𝑑𝑥 = ( − 9 32 9 3 1 9 1 3 d) Por la ecuación (∗)
3
3 2
0
2 2 2 𝑥2 2 𝑥3 2 1 ) = 𝑃 [−1≤𝑥<3] = ∫ 0𝑑𝑥 + ∫ ( 𝑥 − 𝑥 2 ) 𝑑𝑥 = ( − 9 32 93 0 2 2 −1 0 3 Ejemplo: Sea |𝑥 − 2| ≤ 1 𝑘𝑥 2 , |𝑥 − 2| ≥ 1 0 , a) Hallar el valor de k tal que “f” sea una función de densidad de una variable aleatoria continua X. b) Calcular la probabilidad que la variable aleatoria X se encuentra en el intervalo 〈2,3〉 𝑓 (𝑥) = {
Solución Por la propiedad del valor absoluto. |𝑥 − 2| ≤ 1 ,
𝑠𝑖 𝑠𝑜𝑙𝑜 𝑠𝑖
|𝑥 − 2| ≥ 1 ,
𝑠𝑖 𝑠𝑜𝑙𝑜 𝑠𝑖
− 1 ≤ 𝑥 − 2 ≤ 1, 𝑥 − 2 > 1,
𝑑𝑜𝑛𝑑𝑒
𝑜𝑠𝑒𝑎
1≤𝑥≤3
𝑥>3 ⋁ 𝑥 <1
La función “f” se escribe 0 , 𝑓 (𝑥) = { 𝑘𝑥 2 , 0 ,
𝑥 <1 1≤𝑥 ≤3 𝑥 >3
a) Como todas las variables se halan en [1,3] , por la condición (2) de la definición de densidad. 3
3
∫
𝑘𝑥 2 𝑑𝑥
1
𝑘𝑥 3 33 1 ) = 𝑘 ( − ) = 26𝑘 = 1 =( 3 1 3 3 𝑘=
3 26
b) Por la ecuación (∗) 3
3
3 2 3 𝑥3 1 19 ( ) = (27 − 8) = 𝑃[2<𝑥<3] = ∫ 𝑥 𝑑𝑥 = 26 3 2 26 26 2 26 Ejemplo: La longitud de la vida de una especie de plantas en cierto medio ambiente es una variable aleatoria continua. Supongamos que la función de densidad de X es: 1 − 𝑥 𝑒 120 ; 𝑥≥0 120 a) ¿Qué proporción de plantas de esta especie mueren antes de los 100 días? 𝑓(𝑥) =
b) Si una planta individual vive durante 100 días, ¿Cuál es la probabilidad que viva otros 100 días más? Solución El rango de la variable aleatoria es. 𝑥 𝑅𝑥 = { ≤ 𝑥 < ∞} 0 a) La proporción de platas que mueren antes de los 100 días está dado por 𝑃[𝑋<100]. Aplicando la fórmula de la ecuación (∗ ) 100
𝑃[𝑥<100] = ∫
0
𝑥 100 5 1 −𝑥 𝑒 120 𝑑𝑥 = (−𝑒 −120 ) = 1 − 𝑒 −6 120 0
b) Aplicando el concepto de probabilidad condicional dado en los primeros capítulos. 𝑃[𝑥<200 │ 𝑥>100] =
𝑃{[𝑋>200]∩ [𝑥<100]} 𝑃[𝑋>200] = 𝑃[𝑋>100] 𝑃[𝑋>100] 20
𝑃[𝑥<200 │ 𝑥>100] =
𝑒 −12 10 𝑒 −12
5
= 𝑒 −6
Ejemplo: En cierto país, el ingreso familiar tiene la función de densidad de probabilidad dado por 𝑝(𝑥 ) = 𝑎𝑥 si 𝑥 ≥ 0 donde X esta en miles de dólares, que proporción de las familias: 2) 2 ( 1+𝑥
a) Tiene ingresos menores que 6000 $ b) Tiene ingresos entre 2000 y 8000 $ c) Tienen ingresos sobre 1000 $ Solución . ∫𝑅𝑥 𝑝(𝑥 ) 𝑑𝑥
→
𝑎 ∞ 2𝑥 ∫ 𝑑𝑥 ( 2 0 1 + 𝑥 2)2
∞
∫0
𝑎𝑥 𝑑𝑥 ( 1+𝑥 2) 2
→
2 { 𝑥 =𝑡 2𝑥𝑑𝑥 = 𝑑𝑡
;
𝑥≥0 𝑠𝑖 𝑥 → 0 𝑠𝑖 𝑥 → ∞
𝑡→0 𝑡→∞
𝑎 ∞ 2𝑥 𝑎 ∞ 𝑑𝑡 ∫ ∫ 𝑑𝑥 = =1 2 0 (1 + 𝑥 2 ) 2 2 0 (1 + 𝑡) 2 𝑎 1 ∞ 𝑎 1 𝑎 1 (− ) = − ( lim ( − 1)) = − ( − 1) = 1 𝑏→∞ 2 1 +𝑡 0 2 1 +𝑏 2 ∞ 𝑎=2 Hallando la función de distribución.-
𝑥
𝑃(𝑥) = ∫
0
2𝑥 𝑑𝑥 (1 + 𝑥 2 ) 2
2 { 𝑥 =𝑡 2𝑥𝑑𝑥 = 𝑑𝑡
→
𝑠𝑖 𝑥 → 0 𝑠𝑖 𝑥 → ∞
𝑡→0 𝑡→∞
𝑥
𝑥 𝑑𝑡 1 𝑥 1 1 ) = (− ) = (− 𝑃(𝑥 ) = ∫ = (− + 1) 2 2 ( ) 1+𝑡 0 1+𝑥 0 1 + 𝑥2 0 1 +𝑡
𝑃( 𝑥 ) = 1 −
1 1 + 𝑥2
;
𝑥≥0
a) 𝑃(𝑥≤6) = 𝑃(𝑥=6) 𝑃( 𝑥≤6) = 1 −
1 1 36 =1− = 2 1+6 37 37
b) 𝑃( 2<𝑥<8) = 𝑃(𝑥=8) − 𝑃 (𝑥=2) 1 1 12 ) − (1 − )= 2 2 1+8 1+2 65
𝑃 (2<𝑥<8) = (1 − c)
𝑃(𝑧>1) = 1 − 𝑃(𝑥>1) = 1 − 𝑃(𝑥=1) 𝑃(𝑥>1) = 1 −
1 1 = 2 1 +1 2
Valor Promedio Esperado y Esperanza Matemática Se define como aquel calor promedio cuya esperanza o probabilidad corresponde al valor central La esperanza matemática se simboliza por: 𝐸(𝑥) 𝑦 𝑠𝑒 𝑑𝑒𝑓𝑖𝑛𝑒 𝑐𝑜𝑚𝑜: .
𝐸(𝑥) = ∑ 𝑥 𝑝(𝑥 )
𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝐴𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝐷𝑖𝑠𝑐𝑟𝑒𝑡𝑎
𝑅𝑋 .
𝐸(𝑥) = ∫ 𝑥 𝑝(𝑥 ) 𝑑𝑥
𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝐴𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝐶𝑜𝑛𝑡𝑖𝑛𝑢𝑎
𝑅𝑋
La esperanza matemática de la variable aleatoria “X” corresponde a la media poblacional 𝑢 = 𝐸( 𝑥 ) Propiedades.-
I.
𝑢(𝐻( 𝑥 )) = 𝐸𝐻(𝑥 ) = ∑.𝑅𝑋 𝐻( 𝑥 )𝑝( 𝑥) .
II.
𝑢(𝐻(𝑥 ) ) = 𝐸𝐻(𝑥 ) = ∫𝑅𝑋 𝐻(𝑥 )𝑝(𝑥) 𝑑𝑥
III.
𝐸 (𝑎𝐻(𝑥) ) = 𝑎𝐸 (𝐻(𝑥 ))
IV.
𝐸 (𝐻(𝑥 ) + 𝐺(𝑥) ) = 𝐸(𝐻(𝑥) ) + 𝐸(𝐺(𝑥 ))
De similar forma es posible definir los valores centrales de la distribución de probabi l idade s, l os valores de dispersión de la Distinción de Probabilidades, los valores de sesgo y curtosis. Mediana de la Distribución.𝑀𝑒𝑑(𝑥) = 𝑥0 / 𝑃(𝑥≤𝑥0) =
1 2
Moda de la Distribución.𝑀𝑑(𝑥) = 𝑥 0 / 𝑃(𝑥=𝑥0)
𝑒𝑠 𝑚𝑎𝑥𝑖𝑚𝑎
Percentiles de la Distribución.𝑃𝑖 (𝑥) = 𝑥 0 / 𝑃( 𝑥≤𝑥 0) =
𝑖 100
Varianza de la Variable Aleatoria.La varianza de la variable aleatoria es la varianza poblacional 𝑉𝑎𝑟 (𝑥) = 𝜎 2
𝑦 𝑠𝑒 𝑑𝑒𝑓𝑖𝑛𝑒 𝑐𝑜𝑚𝑜:
.
𝑉𝑎𝑟 (𝑥) =
𝜎2
= 𝐸((𝑥−𝑢)2) = ∑(𝑥 − 𝑢)2 𝑝(𝑥)
𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝐴𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝐷𝑖𝑠𝑐𝑟𝑒𝑡𝑎
𝑅𝑥 .
𝑉𝑎𝑟 (𝑥) = 𝜎 2 = 𝐸(𝑥−𝑢)2 = ∫ (𝑥 − 𝑢) 2 𝑝(𝑥) 𝑑𝑥
𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝐴𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝐶𝑜𝑛𝑡𝑖𝑛𝑢𝑎
𝑅𝑥
Es posible utilizar 𝜎 2 = 𝐸(( 𝑥−𝑢) 2) = 𝐸(𝑥 2−2𝑥𝑢+𝑢2) 𝜎 2 = 𝐸(𝑥 2) − 2𝑢𝐸(𝑥 ) + 𝐸(𝑢2)
𝜎 2 = 𝐸(𝑥 2 ) − 2𝑢2 + 𝑢2 𝜎 2 = 𝐸(𝑥 2) − 𝑢2
Dónde: .
𝐸(𝑥 2) = ∑𝑥 2 𝑝(𝑥 )
𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝐴𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝐷𝑖𝑠𝑐𝑟𝑒𝑡𝑎
𝑅𝑥 .
𝐸(𝑥 2) = ∫ 𝑥 2 𝑝(𝑥)𝑑𝑥
𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝐴𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝐶𝑜𝑛𝑡𝑖𝑛𝑢𝑎
𝑅𝑥
La desviación estándar 𝑆(𝑥) = √𝑉𝑎𝑟(𝑥) Función de Momento de Variable Aleatoria.𝑀(𝑥 𝑟) = 𝐸((𝑥−𝑢)2)
𝑠𝑖𝑒𝑛𝑑𝑜 "𝑟" 𝑒𝑙 𝑜𝑟𝑑𝑒𝑛 𝑑𝑒𝑙 𝑚𝑜𝑚𝑒𝑛𝑡𝑜
Medida de Asimetría.𝑘=
𝑀(𝑥4) 𝑆 4 (𝑥)
=
𝐸((𝑥−𝑢)4) 𝑆 4 (𝑥 )
𝑆𝑖 𝑘 > 3 𝑃𝑙𝑎𝑡𝑖𝑐𝑢𝑟𝑡𝑖𝑐𝑎 { 𝑆𝑖 𝑘 = 3 𝐶𝑢𝑟𝑣𝑎 𝑁𝑜𝑟𝑚𝑎𝑙 𝑀𝑒𝑠𝑜𝑐𝑢𝑟𝑡𝑖𝑐𝑎 𝑆𝑖 𝑘 < 3 𝐿𝑒𝑝𝑡𝑜𝑐𝑢𝑟𝑡𝑖𝑐𝑎
Ejemplo: Un fabricante de televisores utiliza un cierto tipo de componente electrónico en su montaña cada televisor requiere seis de estos componentes un componente defectuoso no puede ser detectado hasta que el televisor está totalmente montado. El costo de conexi ón, reparación, re posición de un componente defectuoso es de 15 $. El fabricante ha estado comprando estos componentes e n lotes de 100 a dos diferentes proveedores. El costo de compra por lote al proveedor A es de 100 $ en tanto el costo de compra por lote al proveedor B es de 120 $ basadas en experiencias anteriores, las calidades comparadas de los lotes comprados a los 2 proveedores son las siguientes: PROVEEDOR A ⋕ 𝒄𝒐𝒎𝒑 𝒅𝒆𝒇𝒆𝒄𝒕𝒖𝒐𝒔𝒐𝒔 1 2 𝒍𝒐𝒕𝒆 probabilidades 0.30 0.25 PROVEEDOR B
3
4
5
0.20 0.15 0.10
⋕ 𝒄𝒐𝒎𝒑 𝒅𝒆𝒇𝒆𝒄𝒕𝒖𝒐𝒔𝒐𝒔 1 2 𝒍𝒐𝒕𝒆 probabilidades 0.60 0.30
3 0.10
¿A que proveedor debe comprar los componentes electrónicos el fabricante? Solución Promedio esperado de unidades defectuosas en el lote→ Esperanza Matemática Varianza de defectuosos en el lote por el fabricante 𝑢 = 𝐸(𝑥 ) = ∑ 𝑥 𝑝(𝑥 ) PROVEEDOR A. X
1 0.30 0.30 0.30
𝒑(𝑿) 𝒙𝒑(𝑿) 𝟐 𝒙 (𝒑(𝑿))
2 0.25 0.50 1.00
3 0.20 0.60 1.80
4 0.15 0.60 2.40
5 0.10 0.50 2.50
𝐸(𝑥 )𝐴 = 𝑢𝐴 = 0.30 + 0.50 + 0.60 + 0.60 + 0.50 𝑢𝐴 = 2.5
𝑢𝑛𝑖𝑑𝑎𝑑𝑒𝑠 𝑑𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑎𝑠 𝑙𝑜𝑡𝑒
Varianza 𝜎𝐴 2 = 𝐸(𝑥 2) − 𝑢𝐴 2 𝜎𝐴 2 = (0.30 + 1.00 + 1.8 + 2.4 + 2.5) − (2.5) 2 𝜎𝐴 2 = 1.75
→
𝜎𝐴 = 1.323
𝑢𝑛𝑖𝑑𝑎𝑑𝑒𝑠 𝑑𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑎𝑠 𝑙𝑜𝑡𝑒
Como: Costo de reparación = 15 ($/unid) Costo compra A = 100 ($/lote) = 1 ($/unid) Costo incurrido A = (2.5)15 + 2.5 (1) 𝐶𝑜𝑠𝑡𝑜 𝐼𝑛𝑐𝑢𝑟𝑟𝑖𝑑𝑜 𝐴 = 40 $𝑢𝑠 PROVEEDOR B. X 𝒑(𝑿)
1 0.60
2 3 0.30 0.10
𝒙𝒑(𝑿) 𝟐 𝒙 (𝒑(𝑿))
0.60 0.60
0.60 0.30 1.20 0.90
𝐸( 𝑥 )𝐵 = 𝑢𝐵 = 0.60 + 0.60 + 0.30 𝑢𝐵 = 1.5 Varianza
𝑢𝑛𝑖𝑑𝑎𝑑𝑒𝑠 𝑑𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑎𝑠 𝑙𝑜𝑡𝑒
𝜎𝐵 2 = 𝐸(𝑥 2) − 𝑢𝐵 2 𝜎𝐵 2 = (0.60 + 1.20 + 0.90) − (1.5) 2 𝜎𝐵 2 = 0.45
→
𝜎𝐵 = 0.67
𝑢𝑛𝑖𝑑𝑎𝑑𝑒𝑠 𝑑𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑎𝑠 𝑙𝑜𝑡𝑒
Como: Costo incurrido B = (1.5)15 + 1.5 (1.2) 𝐶𝑜𝑠𝑡𝑜 𝐼𝑛𝑐𝑢𝑟𝑟𝑖𝑑𝑜 𝐵 = 24.3 $𝑢𝑠 Rpta: Se Recomienda comprar del Proveedor “B” Ejemplo: Suponga que “X” es una variable aleatoria con función de densidad dad por:
𝑓(𝑥) = {
𝑎𝑥 2 , 𝑎(2 − 𝑥) 2 , 0 ,
0≤𝑥<1 1≤𝑥<2 𝑒𝑛 𝑜𝑡𝑟𝑜𝑠 𝑐𝑎𝑠𝑜𝑠
Determinar: a) b) c) d)
El valor de la constante “a” La esperanza matemática y la mediana y moda El coeficiente de variación El coeficiente de curtosis
Solución
.
∫ 𝑃( 𝑋) 𝑑𝑥 = 1 𝑅𝑋
a)
1
2
∫ 𝑎𝑥 2 𝑑𝑥 + ∫ 𝑎 (2 − 𝑥) 2 𝑑𝑥 = 1 0
1 1
2
𝑥3 4𝑥 2 𝑥 3 𝑎 ( ) + 𝑎 (4𝑥 − + ) =1 3 0 2 3 1
𝑎 23 1 + 𝑎 ((4(2) − 22 (2) + ) − (4 − 2 + )) = 1 3 3 3 𝑎 8𝑎 𝑎 + − 2𝑎 − = 1 3 3 3 𝑎=
3 2
b) La función queda: 3 2 𝑥 2
,
0≤𝑥 <1
𝑓 (𝑥) = 3 (2 − 𝑥) 2 , 2 { 0 ,
1≤𝑥<2 𝑒𝑛 𝑜𝑡𝑟𝑜𝑠 𝑐𝑎𝑠𝑜𝑠
La Esperanza Matemática 𝑢 = 𝐸(𝑥 ) = ∑𝑥𝑝(𝑥 )
𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝐴𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝐷𝑖𝑠𝑐𝑟𝑒𝑡𝑎
Pero en este caso: .
𝑢 = 𝐸(𝑥 ) = ∫ 𝑥𝑝( 𝑥 )𝑑𝑥
𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝐴𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝐶𝑜𝑛𝑡𝑖𝑛𝑢𝑎
𝑅𝑥
1 2 3 3 𝑢 = 𝐸( 𝑥 ) = ∫ 𝑥 𝑥 2 𝑑𝑥 + ∫ 𝑥 (2 − 𝑥) 2 𝑑𝑥 2 2 0 1 1
2
3 𝑥4 3 4𝑥 2 4𝑥 3 𝑥 4 | + ( 𝑢 = 𝐸(𝑥 ) = − + ) 24 0 2 2 3 4 1 3 3 20 11 𝑢 = 𝐸(𝑥) = + {(8 − ) − } 8 2 3 12 3 3 1 11 𝑢 = 𝐸 (𝑥) = + ( (4 − )) 8 2 3 4 𝑢 = 𝐸(𝑥 ) = 𝑢 = 𝐸( 𝑥 ) = 1 Hallando la función de distribución.De 0 a 1
3 5 8 + = 8 8 8
𝑥
𝑥
3 3 𝑥3 𝑥3 | = 𝑃1 (𝑥) = ∫ 𝑥 2 𝑑𝑥 = 23 0 2 0 2 De 0 a 2
1
𝑃2 ( 𝑥 ) = ∫
0
𝑥 3 2 3 𝑥 𝑑𝑥 + ∫ (2 − 𝑥) 2 𝑑𝑥 2 1 2 1
𝑥
3 𝑥3 3 4𝑥 2 𝑥 3 | + (4𝑥 − 𝑃2 ( 𝑥) = + ) 23 0 2 2 3 1 3 1 3 𝑥 1 𝑃2 ( 𝑥) = + [(4𝑥 − 2𝑥 2 + ) − (4 − 2 + )] 2 2 3 3 1 𝑥3 7 𝑃2 (𝑥 ) = + 6𝑥 − 3𝑥 2 + − 2 2 2 𝑃2 ( 𝑥 ) =
𝑥3 − 3𝑥 2 + 6𝑥 − 3 2
La función queda 𝑥3 2
𝑓 (𝑥) = {
Si
𝑃 (𝑥≤1)
→
,
0≤𝑥<1
𝑥3 − 3𝑥 2 + 6𝑥 − 3 , 2 0 ,
1≤𝑥<2
𝑃(𝑥=1) =
𝑒𝑛 𝑜𝑡𝑟𝑜𝑠 𝑐𝑎𝑠𝑜𝑠
1 2
𝑀𝑒𝑑(𝑥) = 1 Moda.𝑀𝑜𝑑(𝑥) = 𝑥 0 / Maximizamos
𝑃(𝑥 )
𝑠𝑒𝑎 𝑚𝑎𝑥
→ derivamos 3𝑥 𝑝(𝑥 ) = 𝑝′(𝑥) = { ( 3 2 − 𝑥)
, ,
0≤ 𝑥<1 1≤ 𝑥<2
Igualando a cero 3𝑥 = 0
→
𝑥=0
→
𝑃 (𝑥=0) = 0 𝑛𝑜 𝑒𝑥𝑖𝑠𝑡𝑒 𝑀𝑜𝑑(𝑥)
3(2 − 𝑥) = 0
→
c) Coeficiente de Variación:𝐶. 𝑉. =
𝑥=2 𝜎 𝑢
→
𝑃(𝑥=2) = 0
𝜎 2 = 𝐸(𝑥 2) − 𝑢2 .
𝐸(𝑥 2) = ∫ 𝑥 2 𝑝(𝑥) 𝑑𝑥 𝑅𝑥
1 2 3 3 𝐸(𝑥 2) = ∫ 𝑥 2 𝑥 2 𝑑𝑥 + ∫ 𝑥 2 (2 − 𝑥) 2 𝑑𝑥 2 2 0 1 1 2 5 3 3𝑥 3 4𝑥 4𝑥 4 𝑥 5 | + ( 𝐸(𝑥 2) = − + ) 25 0 2 3 4 5 1
𝐸(𝑥 2 ) =
3 3 8 3 4 + ( )= + 10 2 15 10 5 𝐸(𝑥 2) =
𝜎 2 = 𝐸(𝑥 2) − 𝑢2 =
11 10
11 1 −1 = 10 10
1 𝜎 √10 𝐶. 𝑉. = = 𝑢 1
→
→
𝜎=
𝐶. 𝑉. =
1 √10 1
√10
d) Coeficiente de Curtosis 𝐾=
𝑀4 𝜎4
. 1 2 3 3 𝑀4 = ∫ (𝑥 − 𝑢) 4 𝑑𝑥 = ∫ (𝑥 − 1) 4 𝑥 2 𝑑𝑥 + ∫ (𝑥 − 1) 4 𝑥 2 𝑑𝑥 2 2 𝑅𝑥 0 1 1
𝑀4 = ∫
(𝑥 6
− 4𝑥 5
0
+ 6𝑥 4
− 4𝑥 3
+ 𝑥 2)
4 3 2 5 3 1 4𝑥 − 16𝑥 + 24𝑥 − 16𝑥 + 4 − 4𝑥 𝑑𝑥 + ∫ ( +16𝑥 4 − 24𝑥 3 + 16𝑥 2 − 4𝑥 + 𝑥 6 ) 𝑑𝑥 2 0 −4𝑥 5 + 6𝑥 4 − 4𝑥 3 + 𝑥 2 2
26𝑥 5 44𝑥 4 41𝑥 3 20𝑥 2 7 6 5 4 − + − − 3 𝑥 4𝑥 6𝑥 4𝑥 3 5 4 3 2 𝑀4 = ( − + − + ) + 2 7 6 5 4 3 0 2 8𝑥 6 𝑥 7 + + 4𝑥 ( )1 6 7 1 𝑥3
𝑀4 =
1 3 128 27 26 44 41 8 1 + {(− + + 4 (2)) − ( − + − 10 − + + 4 )} 70 2 5 7 5 4 3 6 7
𝑀4 =
1 3 24 1364 ) + ( − 70 2 35 105
𝑀4 = 1 35 𝐾= 1 4 ( ) √10
1 35
→
𝐾 = 2.857
Como: 𝐾 = 2.857 < 3
→
𝐿𝑎 𝑐𝑢𝑟𝑣𝑎 𝑒𝑠 𝑙𝑒𝑝𝑡𝑜𝑐𝑢𝑟𝑡𝑖𝑐𝑎
CAPITULO º 5 MODELOS DE DISTRIBUCION DISCRETOS Definición.Existe una cantidad de modelos de probabilidades en variable aleatoria discreta, los mas utilizados son: -
Distribución Binomial Distribución Geométrica Distribución Hipergeometrica Distribución de Poisson
Ensayo de Bernulli.Es todo evento en el cual solo es posible éxito o fracaso. Éxito ---> No defectuoso Fracaso---> Defectuoso Si:
𝑝 = 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝑒𝑥𝑖𝑡𝑜
𝑞 = 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝑓𝑟𝑎𝑐𝑎𝑠𝑜
𝑝+𝑞 = 1
𝑞 = 1− 𝑝
Si la variable aleatoria x representa la cantidad de éxitos, entonces: 𝑥 = 0 − −→ 𝑞
𝑥 = 1 − −→ 𝑝 x
0 1
P(x) q p
𝑝(𝑥) = 𝑝 𝑥 ∗ 𝑞 1−𝑥 El valor promedio esperado: 𝐸(𝑥) = 𝜇 = ∑ 𝑥 ∗ 𝑝(𝑥) 𝐸(𝑥) = 0 ∗ 𝑞 + 1 ∗ 𝑝 =>
𝜇=𝑝
La varianza: 𝜎 2 (𝑥) = ∑(𝑥 − 𝜇) 2 ∗ 𝑝(𝑥) = ∑(𝑥 − 𝑝) 2 ∗ 𝑝(𝑥) 𝜎 2 (𝑥) = (−𝑝) 2 𝑞 + (1 − 𝑝) 2 𝑝 = 𝑝 2 𝑞 + 𝑞 2 𝑝 𝜎 2 (𝑥) = 𝑝𝑞(𝑝 + 𝑞) 𝜎 2 (𝑥) = 𝑝 ∗ 𝑞
Distribución Binomial.La distribución binomial es resultado de repetir el ensayo de Bernulli “n” veces, donde la vari abl e aleatoria x mide la cantidad de éxitos en las “n” entonces: La función de cuantía viene dado por: 𝑛 𝑝(𝑥) = ( ) 𝑝 𝑥 ∗ 𝑞 𝑛−𝑥 𝑥 La función de distribución es: ⟦𝑥 ⟧
𝑛 𝑃(𝑥) = ∑ ( ) 𝑝 𝑘 ∗ 𝑞 𝑛−𝑘 𝑘 𝑘=0
El valor promedio esperado: 𝜇 = 𝑛𝑝 La varianza: 𝜎 2 (𝑥) = 𝑛 ∗ 𝑝 ∗ 𝑞 Se aplica cuando existe éxito o fracaso Ejemplo: La probabilidad de éxito durante el vuelo para cada uno de los 6 motores de un avión es 0.0005. si los 6 motores trabajan indiferentemente determine la probabilidad que en un vuelo determinado: a) No ocurra ninguna falla de motor. b) No ocurra más de una falla de motor. c) Ocurra exactamente dos fallas. Solución 𝑛=6
𝑝 = 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝑓𝑎𝑙𝑙𝑎 = 0.0005
𝑞 = 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑛𝑜 𝑓𝑎𝑙𝑙𝑎 = 0.9995
6 𝑝(𝑥 𝑚𝑜𝑡𝑜𝑟𝑒𝑠 𝑓𝑎𝑙𝑙𝑒𝑛) = ( ) 0.0005𝑥 ∗ 0.99956−𝑥 𝑥 Si X=2 (2fallas de motor) 6 𝑝(𝑥=2) = ( ) 0.00052 ∗ 0.99956−2 = 3.74 ∗ 10−6 2 X=0 (no ocurra ninguna falla) 6 𝑝(𝑥=0) = ( ) 0.00050 ∗ 0.99956−0 = 0.997 0 No ocurra más de una falla 𝑝(𝑥≤1) = 𝑝(𝑥=0) + 𝑝( 𝑥=1) = 0.99999 Ejemplo:
Un estudiante se presenta a un examen de selección múltiple que contiene 8 preguntas cada una con tres respuestas opcionales, si el estudiante esta adivinando al responder cada pregunta y además se sabe que para aprobar el examen debe responder correctamente 6 o mas preguntas ¿Cuál es la probabilidad de aprobar el examen? Solución X: cantidad de preguntas bien contestadas Cada pregunta tiene 3 incisos donde una de las tres es correcta 𝑝=
1 2 𝑒𝑥𝑖𝑡𝑜 ; 𝑞 = 𝑓𝑟𝑎𝑐𝑎𝑠𝑜 3 3
𝑥 8−𝑥 8 (1) ( 2) 𝑝(𝑥) = ( ) 𝑥 3 3
Se puede x>6 6 2 7 1 8 8 (1) (2) 8 ( 1) (2 ) 8 (1) 𝑝(𝑥≥6) = ( ) +( ) +( ) = 0.01966 6 3 7 3 8 3 3 3
Distribución Geométrica.Es un ensayo de Bernulli en el cual la cantidad de opciones es infinita y la variable al e atori a e s l a cantidad de veces que se repite el ensayo hasta obtener el primer éxito. La función de cuantía: 𝑝(𝑥) = 𝑝 ∗ 𝑞 𝑥−1 La función de distribución es: ⟦𝑥 ⟧
𝑃(𝑥) = ∑ 𝑝 ∗ 𝑞 𝑘−1 𝑘=0
El valor promedio esperado: 𝜇=
1 𝑝
La varianza: 𝜎 2 (𝑥) =
𝑞 𝑝2
Ejemplo: En un laboratorio de física trabajan 10 físicos, de los cuales 6 son doctores y 4 licenciados, cada mes se elige al azar a uno de los físicos como encargado del almacén. Calcular la probabilidad que en el 5to mes, el almacén por tercera vez este a cargo de un doctor. Solución
6 Doctores y 4 Licenciados = 10 físicos 𝑝 = 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝑞𝑢𝑒 𝑒𝑙𝑖𝑗𝑎 𝑢𝑛 𝑑𝑜𝑐𝑡𝑜𝑟 𝑝=
6 3 = 10 5
𝑒𝑥𝑖𝑡𝑜
3 2 𝑞=1− = 5 5
;
𝑓𝑟𝑎𝑐𝑎𝑠𝑜
Quinto mes por tercera vez este a cargo de un doctor: 3 2 𝑝(𝑥) = ∗ ( ) 𝑥−1 5 5
𝑝𝑜𝑟 𝑝𝑟𝑖𝑚𝑒𝑟𝑎 𝑣𝑒𝑧
Como se necesita 3 de 5 3 3 2 𝑥−1 𝑝 = ( ) ∗( ) 5 5 3 3−1 5 (3) (2) 𝑝= ( ) ∗ = 0.346 3−1 5 5
Distribución Hipergeométrica.Se da en experimentos donde de “N” elementos existen “M” de un tipo y “N -M” de un segundo tipo. Se extrae una muestra de tamaño “n”, la variable aleatoria “x” representa la cantidad de elementos del primer tipo en la muestra. La función de cuantía: 𝑀 𝑁 −𝑀 ( )( ) 𝑛−𝑥 𝑝(𝑥) = 𝑥 𝑁 ( ) 𝑛 La función de distribución es: 𝑀 𝑁−𝑀 ( )( ) 𝑛−𝑘 𝑝(𝑥) = ∑ 𝑘 𝑁 ( ) 𝑘=0 𝑛 ⟦𝑥 ⟧
El valor promedio esperado: 𝜇 =𝑛∗
𝑀 𝑁
La varianza: 𝑀 𝑀 𝑁−𝑛 ) 𝜎 2 (𝑥) = 𝑛 ∗ ( ) (1 − ) ( 𝑁 𝑁 𝑁 −1 Aproximación a la Bernulli.Si n es muchísimo menor a N (n<<
𝑀 𝑁
;
𝑞 = 1−
𝑀 𝑁
𝑥 𝑀 𝑛−𝑥 𝑛 𝑀 ( ) ( 𝑝=( ) ∗ 1− ) 𝑥 𝑁 𝑁
Ejemplo: El cuerpo secretarial de una importante firma de bogados cuenta con 25 secretarias, 10 de las cuales están en la compañía por mas de 5 años. Un ejecutivo desea seleccionar al azar 4 secretarias para asignarlas a un nuevo trabajo. a) ¿Cual es la distribución de probabilidad den numero de secretarias son mas de 5 años e n la compañía? b) ¿Cual es la probabilidad que al menos 3 de estas secretarias sean elegidas en el grupo? c) ¿calcular la cantidad promedio de secretarias de este tipo seleccionadas y su respectiva varianza? Solución 𝑁 = 25
𝑀 = 10 𝑐𝑜𝑛 𝑚𝑎𝑠 𝑑𝑒 5 𝑎ñ𝑜𝑠
Se selecciona 4: n=4 x=cantidad de secretarias con mas de 5 años. ( 10) ( 15 ) 𝑝(𝑥) = 𝑥 4 − 𝑥 25 ( ) 4 Al menos 3 ( 10) ( 15) ( 10) (15) 1 + 4 0 = 0.159 𝑃(𝑥≥3) = 𝑝(𝑥=3) + 𝑝(𝑥=4) = 3 25 25 ( ) ( ) 4 4 𝜇 =𝑛∗
𝑀 10 40 = 4∗ = = 1.6 𝑁 25 25
∴
𝜇 = 1 𝑠𝑒𝑐𝑟𝑒𝑡𝑎𝑟𝑖𝑎
10 10 25 − 4 )( ) = 0.84 𝜎 2 (𝑥) = 4 ∗ ( ) (1 − 25 25 25 − 1 Ejemplo: Un lote de 100 tubos de televisor esta sujeto a unos procedimientos de control. El procedi mi ento consiste en extraer 5 tubos aleatoriamente sin remplazo y probarlos. Si 2 o menos tubos fal tan se aceptan el lote, en caso contrario se rechaza, determinar: a) La distribución de probabilidad del número de tubos defectuosos en la muestra. b) Cual es la probabilidad exacta de aceptar el lote. c) Compare el anterior resultado con la aproximación a la binomial. Solución 𝑁 = 100 → 𝑦 = 𝑡𝑢𝑏𝑜𝑠 𝑑𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑜𝑠 𝑒𝑛 𝑒𝑙 𝑙𝑜𝑡𝑒 𝑛 = 5 (𝑒𝑥𝑡𝑟𝑎𝑖𝑑𝑜𝑠) → 𝑁 − 𝑦 = 𝑡𝑢𝑏𝑜𝑠 𝑛𝑜 𝑑𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑜𝑠 𝑒𝑛 𝑒𝑙 𝑙𝑜𝑡𝑒
𝑥 = 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑡𝑢𝑏𝑜𝑠 𝑑𝑒𝑓𝑒𝑐𝑡𝑢𝑜𝑠𝑜𝑠 𝑒𝑛 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑑𝑒 5 Si dos o menos fallas se aceptan caso contrario se rechaza 𝑦 100 − 𝑦 ( )( ) 𝑥 5−𝑥 𝑝(𝑥) = 100 ( ) 5 Para aceptar el lote tiene que fallar 2 o menos 𝑥 = 0 ; 𝑥 = 1; 𝑥 = 2 → 𝑦 =?
𝑦 = 1,2,3, … .100
Por la aproximación debemos que por lo menos y=5-1=4 defectuosos en la muestra 𝑃(𝑥≤2) = 𝑝(𝑥=0) + 𝑝(𝑥=1) + 𝑝(𝑥=2) 4 96 4 96 4 96 ( )( ) ( )( ) ( )( ) 0 5 1 4 𝑃(𝑥≤2) = + + 2 3 = 0.999 = 1 100 100 100 ( ) ( ) ( ) 5 5 5 Comparando 𝑝=
4 1 = 100 25
;
𝑞 = 1−
1 24 = 25 25
𝑥 5−𝑥 5 ( 1 ) (24 ) 𝑝=( ) ∗ 𝑥 25 25
𝑃(𝑥≤2) = 𝑝(𝑥=0) + 𝑝(𝑥=1) + 𝑝(𝑥=2) 0 5 1 4 2 3 5 ( 1 ) (24 ) 5 ( 1 ) (24) 5 ( 1 ) (24) 𝑃(𝑥≤2) = ( ) ∗ +( ) ∗ +( ) ∗ =2 0 25 25 1 25 25 2 25 25
1≅2 Distribución de Poisson.Cuando en un evento es posible determinar una cantidad promedio de ocurrencias por unidad de medida se denominan distribución de Poisson. Donde: 𝜆 = 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑜𝑐𝑢𝑟𝑟𝑒𝑛𝑐𝑖𝑎𝑠 𝑝𝑜𝑟 𝑢𝑛𝑖𝑑𝑎𝑑 𝑚𝑒𝑑𝑖𝑑𝑎
𝑡 = 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑢𝑛𝑖𝑑𝑎𝑑𝑒𝑠 𝑑𝑒 𝑚𝑒𝑑𝑖𝑑𝑎
𝑥 = 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝑞𝑢𝑒 𝑚𝑖𝑑𝑒 𝑐𝑢𝑎𝑛𝑡𝑎𝑠 𝑜𝑐𝑢𝑟𝑟𝑒𝑛𝑐𝑖𝑎𝑠 𝑒𝑥𝑖𝑠𝑡𝑒𝑛 La función de cuantía: 𝑝(𝑥) =
𝑒 −𝜆𝑡 (𝜆𝑡)𝑥 𝑥! 𝑝(𝑥) =
𝑢𝑠𝑢𝑎𝑙𝑚𝑒𝑛𝑡𝑒 𝜆𝑡 = 𝛽 𝑒 −𝛽 (𝛽)𝑥 𝑥!
La función de distribución: ⟦𝑥 ⟧
𝑃(𝑥) = ∑ 𝑘=0
𝑒 −𝛽 (𝛽) 𝑥 𝑥!
El valor promedio esperado: 𝜇=𝛽 La varianza: 𝜎 2 (𝑥) = 𝛽 Ejemplo: Suponga que un libro de mil paginas contiene en promedio 500 errores tipográficos, si estos errores se distribuyen aleatoriamente a través del libro. ¿Cual es la probabilidad que una pagi na seleccionada al azar no contenga errores? ¿Cuál es la probabilidad que 2 pagin as de 10 seleccionadas no contengan errores? ¿Cuál es el numero de paginas que no contiene ningún error? ¿Cuál es el número de páginas que contienen exactamente un error? Solución 1000 paginas 500 errores en promedio 𝑥 = 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑒𝑟𝑟𝑜𝑟𝑒𝑠 𝑝𝑜𝑟 𝑝𝑎𝑔𝑖𝑛𝑎 𝜆=
500 1 = 𝑒𝑟𝑟𝑜𝑟 𝑝𝑜𝑟 𝑝𝑎𝑔𝑖𝑛𝑎 1000 2 𝑝(𝑥) =
1 𝑝𝑎𝑔 → 𝑡 = 1
𝑒 −1/2 (1/2) 𝑥 𝑥!
Si x=0. 𝑝(𝑥=0) = 𝑒 −1/2 2 de 10 no contengan errores 𝑝(𝑥=0) = 𝑒 −1/2 ; 𝑞 = 1 − 𝑒 −1/2 2 8 10 𝑃(𝑦≤2) = ( ) (𝑒 −1/2 ) ∗ (1 − 𝑒 −1/2 ) = 0.00951 2
Numero esperado de páginas 𝑝 = 𝑒 −1/2 ∗ 1000 = 607 𝑝𝑎𝑔 1 error --> x=1 1 1 1 𝑒 −2 ( ) 2 = 1 𝑒 −12 𝑝(1) = 1 2
Numero de páginas con 1 error 1 𝑝 = 𝑒 −1/2 ∗ 1000 = 303 𝑝𝑎𝑔 2 Ejemplo: Empieza que las moléculas de un gas raro se encuentran a razón promedio de 3 por cm3 de aire. Si las moléculas de este gas están distribuidas independientemente y al azar en el aire. Determine e l tamaño de la muestra de aire que se debe tomar para que la probabilidad de encontrar al me nos una molécula de este gas en la muestra sea 0.99 como mínimo. Solución 𝜆=3
𝑚𝑜𝑙𝑒𝑐𝑢𝑙𝑎𝑠 𝑐𝑚 3 𝑑𝑒 𝑎𝑖𝑟𝑒
Entonces la distribución de la cantidad de moléculas del gas raro en el aire es: 𝑝(𝑥) =
𝑒 −3𝑡 (3𝑡) 𝑥 𝑥!
Si t= cantidad de cm3 de aire Probabilidad de al menos 1 mol de este gas sea 0.99 como mínimo 𝑃(𝑥≥1) = 1 − 𝑝(𝑥<1) = 1 − 𝑝(𝑥=0) = 0.99 𝑝(𝑥=0) = 0.01 Entonces: 𝑝(𝑥=0) =
𝑒 −3𝑡 (3𝑡) 0 = 0.01 0!
𝑒 −3𝑡 = 0.01 𝑡 = 1.53 𝑐𝑚3 𝑑𝑒 𝑎𝑖𝑟𝑒 Por lo tanto se necesita 1.53 cm3 de aire como muestra para que al menos halla 1 mol de gas.
CAPITULO º 6 MODELOS DE DISTRIBUCION NORMAL Dentro de los modelos de distribución continuos más importantes se tienen: Distribución uniforme.Función de densidad es: 1 𝑠𝑖 𝑎 ≤ 𝑥 ≤ 𝑏 𝑝(𝑥) = {𝑏 − 𝑎 , 0, 𝑒𝑛 𝑜𝑡𝑟𝑜𝑠 𝑐𝑎𝑠𝑜𝑠 La función de distribución 𝑥
𝑝(𝑥) = ∫ 𝑎
1 𝑥 −𝑎 𝑑𝑥 = 𝑏−𝑎 𝑏 −𝑎
𝑥−𝑎 , 𝑝(𝑥) = {𝑏 − 𝑎 1,
𝑠𝑖 𝑎 ≤ 𝑥 ≤ 𝑏 𝑠𝑖 𝑥 > 𝑏
El valor promedio esperado: 𝜇=
𝑎+𝑏 2
La varianza: 𝜎2 =
(𝑏 − 𝑎) 2 12
Distribución exponencial.La variable aleatoria “x” con promedio de eventos por unidad de medidas “λ” tiene la funci ón de densidad. 𝑝(𝑥) = 𝜆𝑒 −𝜆𝑥 𝑠𝑖 𝑥 ≥ 0 La función de distribución: 𝑥
𝑃(𝑥) = ∫ 𝜆𝑒 −𝜆𝑥 𝑑𝑥 = 1 − 𝑒 −𝜆𝑥 0
El valor promedio esperado: 𝜇=
1 𝜆
La varianza: 𝜎2 =
1 𝜆2
𝑠𝑖 𝑥 ≥ 0
Se relaciona con el modelo de Poisson y es la base de la teoría de la confiabilidad o fiabilidad en e l mantenimiento programado por modelos probabilísticos. Ejemplo: Un fabricante de mecanismos electrónicos encuentra que el tiempo en años al cabo del cual el mecanismo requiere reparaciones es una V.A. “x”, una función de densidad exponencial y parámetros 1/25. ¿Cuál es la probabilidad que el mecanismo no requiera reparación durante un año?¿el fabricante desea garantizar el mecanismo para que el 90% de las computadoras que lo utilizan no requiera reparación dentro del periodo de garantía?. Solución 𝑝(𝑥) =
1 −1𝑥 𝑒 25 𝑝𝑎𝑟𝑎𝑚𝑒𝑡𝑟𝑜 = 1/25 25
Debemos hallar la probabilidad acumulada de que en años no exista reparación 1
𝑝 (𝑥≤6) = 1 − 𝑒 −25∗6 = 0.21 Con 90% 1
𝑝(𝑥≤𝑇) = 1 − 𝑒 −25𝑇 = 0.90 1
𝑒 −25𝑇 = 010 𝑇 = 57.56 𝑎ñ𝑜𝑠 Distribución Normal.Es la más importante de las distribuciones continuas y decimos que una V.A. “x” se distribuye normalmente con media “µ” y varianza se responde a la siguiente función de densidad 𝑝(𝑥) =
1 𝜎√2𝜋
1 𝑥−𝜇)2 − ( 25 𝜎 𝑒
𝑠𝑖
𝑥 ≥0
La función acumulada de distribución es: 𝑥
𝑃(𝑥) = ∫
0
1 𝜎√2𝜋
𝑒
−
1 (𝑥−𝜇)2 25 𝜎
𝑑𝑥
Lo que se utiliza generalmente es: C.V. coeficiente de variación 𝑥 −𝜇 ( ) = 𝑧 𝑑𝑜𝑛𝑑𝑒 𝑧 = 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝑛𝑜𝑟𝑚𝑎𝑙 𝜎 Como: Sabemos que:
𝑥 → 𝑁(𝜇, 𝜎 2 )
𝑧 → 𝑁(𝜇, 𝜎 2 )
̅̅̅̅̅̅̅̅̅ 𝑎𝑥 + 𝑏 = 𝑎𝑥̅ + 𝑏
𝑥̅ = 𝜇 + 𝜎𝑧̅ 𝑝𝑒𝑟𝑜 𝑥̅ = 𝜇 → 𝑧̅ = 0
Sabemos que: 𝑉𝑎𝑟 (𝑎𝑥 + 𝑏) = 𝑎 2 𝑉𝑎𝑟(𝑥) 𝜎 2 = 𝑉𝑎𝑟 (𝜇 + 𝜎𝑧̅) = 𝜎 2 𝑉𝑎𝑟(𝑧) La función de distribución será: 𝑧
𝑃(𝑧) = ∫
0
1 √2𝜋
1 2
𝑒 −2𝑧 𝑑𝑧
Esto se evalúa por método numérico lo que genera la llamada tabla de Distribución Normal. Ejemplo: Un rodamiento es considerado defectuoso si su diámetro es mayor a 2.02 plg o menor a 1.98 pl g. Cual es el numero esperado de rodamientos realizados, si los diámetros de una parti da de 10000 rodamientos esta distribuidos normalmente con una media de 2 plg y una desviación estándar de 0.01 plg. Solución 𝜇 = 2 𝑝𝑢𝑙𝑔 𝜎 = 0.01
𝜙 = 𝑑𝑖𝑎𝑚𝑒𝑡𝑟𝑜
𝑝(𝑟𝑒𝑐ℎ𝑎𝑧𝑜) = 𝑝(𝜙>2.02) + 𝑝(𝜙<1.98) 𝑝(𝑟𝑒𝑐ℎ𝑎𝑧𝑜) = 1 − 𝑝(𝜙<2.02) + 𝑝(𝜙<1.98) Sabemos que: (
𝜙−𝜇 𝜎
) = 𝑧 = 𝑧0
Entonces: 𝑝(𝜙<2.02) = 𝑝(𝑧=2.02−2 ) 0.01
𝑝(𝜙<2.02) = 𝑝 (𝑧=2)
𝑛𝑜𝑠 𝑣𝑎𝑚𝑜𝑠 𝑎 𝑡𝑎𝑏𝑙𝑎𝑠 𝑧0 = 0.9772
𝑝(𝜙<2.02) = 0.9772 𝑝(𝜙<1.98) = 𝑝(𝑧=1.98−2) 0.01
𝑝(𝜙<1.98) = 𝑝 (𝑧=−2)
𝑛𝑜𝑠 𝑣𝑎𝑚𝑜𝑠 𝑎 𝑡𝑎𝑏𝑙𝑎𝑠 𝑧0 = 0.0228
𝑝( 𝑟𝑒𝑐ℎ𝑎𝑧𝑜) = 1 − 0.9772 + 0.0228 = 0.0456 #𝑑𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑜𝑠 = 1000 ∗ 0.0456 = 456 𝑢𝑛𝑖𝑑𝑎𝑑𝑒𝑠
Propiedad reproductiva.S se tiene xi variables aleatorias que se distribuyen normalmente con “µi” medias y varianzas entonces.
𝑦 = 𝑎1 𝑥1 + 𝑎 2 𝑥2 + 𝑎 3 𝑥3 + 𝑎 4 𝑥4 + ⋯ … +𝑎 𝑛 𝑥𝑛 Nueva variable aleatoria normal cuya media es: 𝜇 𝑦 = 𝑎1 𝜇1 + 𝑎 2 𝜇2 + 𝑎 3 𝜇3 + 𝑎 4 𝜇4 + ⋯ … +𝑎 𝑛 𝜇𝑛 𝜎𝑦 2 = 𝑎1 2 𝜎1 2 + 𝑎1 2 𝜎1 2 + 𝑎1 2 𝜎1 2 + 𝑎1 2 𝜎1 2 + ⋯ . . 𝑎1 2 𝜎1 2 Teorema central del límite.Cuando x tiene xi variables aleatorios que se distribuyen normalmente con medios “µi” y vari anza desde i=1 hasta n entonces: 𝑧𝑖 =
∑𝑛𝑖=1 𝑥𝑖 − ∑𝑛𝑖=1 𝑁𝑖 √∑𝑛𝑖=1 𝜎𝜄 2
Entonces si n -->0 lim 𝑃𝑛(𝑧) = ∅𝑧𝑛
𝑛→∞
𝑧0 =
∑ 𝑥 − ∑ 𝜇𝑖 √∑ 𝜎 2
Ejemplo: En una placa junto a la puerta de un ascensor se lee “capacidad 6 personas” 990 lb. Suponer que las personas que usan este ascensor están distribuidas normalmente con media de 140 lb y desviación estándar de 30 lb. a) 6 personas entran al elevador cual es la probabilidad que su peso combinado exceda la capacidad máxima. b) Realice lo mismo con 7 personas. Solución 𝑐𝑎𝑝𝑎𝑐𝑖𝑑𝑎 6 𝑝𝑒𝑟𝑠𝑜𝑛𝑎𝑠 = 990 𝑙𝑏
𝜇 = 140 𝑙𝑏
𝜎 = 30 𝑙𝑏
Seis exceden la capacidad máxima 𝑥 𝑇 = 𝑥1 + 𝑥 2 + 𝑥 3 + ⋯ … . +𝑥 6 𝜇 𝑥𝑇 = 𝜇 𝑥1 + 𝜇 𝑥2 + 𝜇 𝑥3 + ⋯ … . +𝜇 𝑥6 𝜇 𝑥𝑖 = 6 ∗ 140 = 840 𝑙𝑏 2 2 2 2 𝜎𝑥𝑇 = √𝜎𝑥1 + 𝜎𝑥2 + 𝜎𝑥3 … … . +𝜎𝑥6
𝜎𝑥𝑇 = √6 ∗ 𝜎𝑥2 = 𝜎 ∗ √6 = 30 ∗ √6 = 73.48 𝑙𝑏 𝑝(𝑥𝑇>990) = 1 − 𝑝(𝑥𝑇<990)
𝑝 (𝑥𝑇>990) = 1 − 𝑝(𝑧=990−840) 73.48
𝑝 (𝑥𝑇>990) = 1 − 𝑝(𝑧=2.04)
𝑝𝑜𝑟 𝑡𝑎𝑏𝑙𝑎𝑠 𝑝(𝑧=2.04) = 0.9793
𝑝(𝑥𝑇>990) = 1 − 0.9793 = 0.0207 = 2.07% Para 7 personas 𝜇 𝑥𝑖 = 7 ∗ 140 = 980 𝑙𝑏 𝜎𝑥𝑇 = √7 ∗ 𝜎𝑥2 = 𝜎 ∗ √7 = 30 ∗ √7 = 79.37 𝑙𝑏 𝑝(𝑥𝑇>990) = 1 − 𝑝(𝑥𝑇<990) 𝑝(𝑥𝑇>990) = 1 − 𝑝(𝑧=990−980) 79.37
𝑝 (𝑥𝑇>990) = 1 − 𝑝(𝑧=0.13)
𝑝𝑜𝑟 𝑡𝑎𝑏𝑙𝑎𝑠 𝑝(𝑧=0.13) = 0.5517
𝑝( 𝑥𝑇>990) = 1 − 0.5517 = 0.4483 = 44.83% Ejemplo: Las pastillas metalicas cilíndricas que se utilizan en un reactor se fabrican en serie y puede suponerse que sus longitudes siguen una distribución normal con media de 0.29 cm y desviación estándar 0.016 cm. 9 de ellas deben ajustarse, extremo con extremo en un recipiente que ocupa una longitud no mayor de 2.67 cm. Si las 9 pastillas se e nsamblan al azar, que proporción de estas no se ajustara en el espacio requerido. Solución 𝜇 = 0.29 𝑐𝑚
𝜎 = 0.016 𝑐𝑚
𝑒𝑠𝑝𝑎𝑐𝑖𝑜 = 2.67 𝑐𝑚
𝐿 𝑇 > 𝐸𝑠𝑝𝑎𝑐𝑖𝑜 → 𝑛𝑜 𝑠𝑒 𝑎𝑗𝑢𝑠𝑡𝑎 𝐿 𝑇 < 𝐸𝑠𝑝𝑎𝑐𝑖𝑜 → 𝑠𝑒 𝑎𝑗𝑢𝑠𝑡𝑎 𝜇 𝐿𝑇 = 9 ∗ 0.29 = 2.61 𝑐𝑚 𝜎𝐿𝑇 = √9 ∗ 𝜎𝑥2 = 𝜎 ∗ √9 = 0.016 ∗ √9 = 0.048 𝑐𝑚 𝑝(𝐿𝑇>𝐸𝑠𝑝𝑎𝑐𝑖𝑜) = 1 − 𝑝(𝐿𝑇<𝐸𝑠𝑝𝑎𝑐𝑖𝑜) 𝑝( 𝑥𝑇>990) = 1 − 𝑝(𝑧 =2.67−2.61 ) 0.048
𝑝 (𝑥𝑇>990) = 1 − 𝑝(𝑧=1.25)
𝑝𝑜𝑟 𝑡𝑎𝑏𝑙𝑎𝑠 𝑝(𝑧=1.25) = 0.8944
𝑝( 𝑥𝑇>990) = 1 − 0.8944 = 0.1056 = 10.56%
CAPITULO º 7 VARIABLE ALEATORIA BIDIMENSIONAL
Definición.Es aquella donde se analizan dos características del espacio muestral. x = 1ra característica del espacio muestral y = 2da característica del espacio muestral Para analizar una variable aleatoria bidimensional, podemos recurrir a tablas de frecuencias bidimensionales.
2da “y”
y1 – y2
y2 – y3
y3 – y4
y4-y5 … Total
1ra “x”
y1 '
y2 '
y3 '
y4 ' …
x 1 –x 2
x1'
f11
f12
f13
x2 – x3
x2'
f21
f22
f23
f2
x3 – x4
x3'
f31
f32
f33
f3
x4 – x5
x4'
…
…
f1
…
Total
f1
f2
f3
n n
Si separamos las dos variables
x
f
x1'
f1
x2'
f2
x3'
f3
…
Total
y
f
y1 '
f1
y2 '
f2
y3 '
f3
n …
Total
n
Distribuciones Marginales Se pueden tener dos tipos de variable aleatoria bidimensional. Variable Aleatoria Bidimensional Discreta.Se resume en una tabla.
y
y1
y2
yj
Total
x x1
p(x 1,y1 ) p(x 1,y2)
x2
p(x 2,y2 )
xk
p(x k,y1 )
P(x 1,yj)
P(x k,yj)
Total
1 1
Entonces: ∑ 𝑝(𝑥, 𝑦) = 1 𝑅𝑥 𝑅𝑦
Gráficamente:
Las distribuciones marginales son: 𝑝(𝑥) = ∑ 𝑝(𝑥, 𝑦) 𝑅𝑦
𝑝(𝑦) = ∑ 𝑝(𝑥, 𝑦) 𝑅𝑥
En cada variable aleatoria marginal es posible hallar su propia esperanza matemática y su varianza. 𝐸(𝑥) = ∑ 𝑥 𝑝(𝑥)
;
𝐸 (𝑦) = ∑ 𝑦 𝑝(𝑦)
𝑅𝑥
𝑅𝑦
𝐺(𝑥) 2 = 𝐸(𝑥) 2 − 𝑢2𝑥
;
𝐺(𝑦) 2 = 𝐸(𝑦) 2 − 𝑢2𝑦
Variable Aleatoria Bidimensional Continua.Tiene la función de densidad 𝑝(𝑥, 𝑦) y debe verificar ∬ 𝑝(𝑥, 𝑦) 𝑑𝐴 = 1 𝑅𝑥,𝑦
Las distribuciones marginales son:
𝑝(𝑥) = ∫ 𝑝(𝑥, 𝑦) 𝑑𝑦
;
𝑝(𝑦) = ∫ 𝑝(𝑥, 𝑦) 𝑑𝑥
𝑅𝑦
𝑅𝑥
Cada distribución marginal puede tener 𝐸(𝑥) = ∫ 𝑥 𝑝(𝑥) 𝑑𝑥
;
𝐸 (𝑦) = ∫ 𝑦 𝑝(𝑦) 𝑑𝑦
𝑅𝑥
𝑅𝑦
𝐺(𝑥) 2 = 𝐸 (𝑥 2 ) − 𝑢2𝑥
;
𝐺(𝑦) 2 = 𝐸 (𝑦 2 ) − 𝑢2𝑦
Covarianza: Es la medida de la varianza común entre ambas variables aleatoria, simbolizada por: 𝐶𝑜𝑣(𝑥, 𝑦) La covarianza se define por: 𝑐𝑜𝑣(𝑥, 𝑦) = ∑(𝑥 − 𝑢𝑥 )(𝑦 − 𝑢𝑦 ) 𝑝(𝑥, 𝑦) 𝑐𝑜𝑣(𝑥, 𝑦) = ∫ (𝑥 − 𝑢𝑥 )(𝑦 − 𝑢𝑦 ) 𝑝(𝑥, 𝑦)𝑑𝐴
𝑉𝐴𝐷
𝑉𝐴𝐶
𝑅𝑥,𝑦
Una expresión reducida nos dice: 𝑐𝑜𝑣(𝑥, 𝑦) = 𝐸 (𝑥, 𝑦) − 𝑢𝑥 𝑢𝑦 donde 𝐸 (𝑥, 𝑦) = ∑ 𝑥𝑦 𝑝(𝑥, 𝑦)
𝑉𝐴𝐷
𝑅𝑥
𝐸 (𝑥, 𝑦) = ∬ 𝑥𝑦 𝑝 (𝑥, 𝑦) 𝑑𝐴
𝑉𝐴𝐶
𝑅𝑥,𝑦
Coeficiente de Correlación: Mide el grado de relacionamiento entre las dos variables y s e de fi ne por: 𝜌(𝑥, 𝑦) = Se conoce
−1 ≤ 𝜌(𝑥, 𝑦) ≤ 1
𝑐𝑜𝑣(𝑥, 𝑦) 𝐺𝑥 𝐺𝑦
𝜌 (𝑥, 𝑦) = 1
Si
→
Correlación Alta Positiva
1 7 6 5
4 3 2 1
0 0
2
𝜌 (𝑥, 𝑦) = 0
Si
4
→
6
Las variables son independientes => 𝑐𝑜𝑣(𝑥, 𝑦) = 0
0 6 5 4 3 2
1 0 0
Si
2
4
𝜌 (𝑥, 𝑦) = −1
→
6
8
Correlación Alta Negativa
-1 7 6 5 4 3 2 1 0 0
2
4
6
8
Ejemplo: Sean 𝑥 y 𝑦 dos variables aleatorias que representan el número de bicicletas producidas por las líneas ensambladoras A y B respectivamente en un día, la distribución de probabilidad conjunta de las variables aleatorias dada en la siguiente tabla: Se pide: a) Cual es la probabilidad de que la línea B produzca 3 bicicletas si se sabe que la líne a A a producido 1. b) Hallar la covarianza y el coeficiente de correlación.
Y
0
1
2
3
4
5
Total
0
0
0,01
0,03
0,06
0,07
0,08
0,25
1
0,01
0,02
0,04
0,07
0,07
0,09
0,30
2
0,01
0,02
0,04
0,06
0,06
0,06
0,25
3
0
0,03
0,05
0,05
0,05
0,04
0,22
Total
0,02
0,08
0,16
0,24
0,25
0,27
1
X
Solución a) 𝑃(𝐵𝑝𝑟𝑜𝑑𝑢𝑠𝑐𝑎 3 ; 𝑠𝑖 𝐴 = 1) 𝑃(𝑦 = 3|𝑥 = 1) =
𝑃(𝑦 = 3 ∩ 𝑥 = 1) 0,07 = = 0,23 𝑃(𝑥 = 1) 0,30
Marginales
x
𝑝(𝑥)
𝑥 𝑝(𝑥)
𝑥 2 𝑝(𝑥)
𝑢𝑥 = 1,40
0
0,25
0
0
1
0,30
0,30
0,30
2
0,25
0,50
1
𝐺𝑥2 = 3,10 − 1,402
3
0,20
0,60
1,8
𝐺𝑥2 = 1,14
total
1
1,40
3,10 𝐺𝑥 = 1,068
𝑝(𝑦)
y
𝑦 2 𝑝(𝑦)
𝑦 𝑝(𝑦)
𝑢𝑦 = 3,45
0
0,02
0
0
1
0,06
0,06
0,06
𝐺𝑦2 = 13,61 − 3,452
2
0,16
0,32
0,64
𝐺𝑥2 = 1,708
3
0,24
0,72
2,16
4
0,25
1
4
5
0,27
1,35
6,75
total
1
3,45
13,61
𝐺𝑦 = 1,307
b) 𝑐𝑜𝑣(𝑥, 𝑦) =?
𝐸 (𝑥, 𝑦) = ∑ 𝑥𝑦 𝑝 (𝑥, 𝑦) 𝐸 (𝑥, 𝑦) = 0 + 12 (0,02) + 2(0,04) + 3(0,07) + 4(0,07) + 5(0,09) + 2(0,02) + 4(0,04) + 6(0,06) + 8 (0,06) + 10(0,06) + 3(0,03) + 6(0,05) + 9(0,05) + 12 (0,05) + 15(0,04) 𝐸 (𝑥, 𝑦) = 4,60 𝑐𝑜𝑣(𝑥, 𝑦) = 4,66 − (1,40)(3,45) 𝑐𝑜𝑣(𝑥, 𝑦) = +1,7
𝜌 (𝑥, 𝑦) = (
−1,7 1,068) (1,307)
= −1,218
𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑎𝑙𝑡𝑎 𝑛𝑒𝑔𝑎𝑡𝑖𝑣𝑜
Ejemplo: Suponga que "𝑥" es el tiempo en minutos que una persona pasa en la sala de espera de cierto medico y "𝑦" la duración en minutos de un examen físico completo, son variables aleatori as cuya función de densidad de probabilidad conjunta es: 1 −𝑥 −𝑦 𝑝 (𝑥, 𝑦) = 𝑒 10 𝑒 50 𝑎
𝑠𝑖
𝑥≥0 ;
𝑦≥0
Usted llega a la consulta del médico para un examen físico 50 minutos antes de tener que parti r a una reunión. Cuál es la probabilidad de salir tarde para la reunión. Cual serán las distribuciones marginales.
Solucion ∬ 𝑝(𝑥, 𝑦)𝑑𝐴 = 1
"𝑣𝑒𝑟𝑖𝑓𝑖𝑐𝑎"
𝑛 ∞∞
∬ 00
1 −𝑥 −𝑦 𝑒 10 𝑒 50 𝑑𝑥 𝑑𝑦 = 1 𝑎
1 ∞ −𝑦 −𝑥 1 ∞ ∫ 𝑒 50 𝑒 10 −1 𝐼0 𝑑𝑦 = 1 𝑎 0 10
∞
∞ −𝑦 −𝑦 1 10 10 −𝑦 1 ∫ 𝑒 30 𝑑𝑦 = (−10) ∫ 𝑒 50 (𝑒 −∞ −𝑒 0 )𝑑𝑦 = 𝑒 50 ( −1 ) 𝐼0∞ = 1 𝑎 𝑎 𝑎 0 0 50
10 500 (−50){𝑒 −∞ −𝑒 0 } = 𝑎 𝑎 𝑎 = 500 => 𝑝(𝑥, 𝑦) =
1 −𝑥 −𝑦 𝑒 10 𝑒 50 500
𝑠𝑖
𝑥≥0 ,
Para que llegue tarde: 𝑥 + 𝑦 ≥ 50 como
𝑥 + 𝑦 ≥ 50
𝑃 (𝑥 + 𝑦 ≥ 50) = 1 − 𝑃(𝑥 + 𝑦 ≤ 50) La función de distribución
𝑦≥ 0
𝑦 𝑥
𝑃(𝑥, 𝑦) = ∫ ∫ 0 0 𝑦
1 −𝑥 −𝑦 𝑒 10 𝑒 50 𝑑𝑥 𝑑𝑦 500 𝑦
−𝑦 1 −𝑦 −𝑦 1 −𝑥 −1 1 −10 −1 −𝑥 𝑦 𝑥 50 ∫ 𝑒 10 ∫ (𝑒 10 − 1) 𝑒 50 𝑑𝑦 = 10 − 1)𝑒 50 𝑃 (𝑥, 𝑦) = 𝐼 𝑒 𝑑𝑦 = (𝑒 0 −1 −1 𝐼0 500 500 50 0 0 10 50 −𝑥
−𝑦
𝑃(𝑥, 𝑦) = (𝑒 10 − 1) (𝑒 50 − 1) =>
𝑠𝑖
𝑥 = 50
∧
𝑦=0 𝑝(50,0) =
1 −50 𝑒 10 = 1,34𝑥10−5 500
La otra opción =>
𝑠𝑖
𝑥=0
∧
𝑦 = 50 𝑝(0,50) =
1 −50 𝑒 50 = 7,36𝑥10−4 500
Rango: 𝑅𝑎𝑛𝑔𝑜 = 7,36𝑥10−4 − 1,34𝑥10−5 𝑅𝑎𝑛𝑔𝑜 = 7.22𝑥10−4 1 − 7,22𝑥10−4 = 0,9993
=> Marginales −𝑥
𝑝(𝑥) =
−𝑥 −𝑦 ∞ 1 𝑒 10 −𝑦 1 ∞ ∫0 𝑒 10 𝑒 50 𝑑𝑦 = 𝑒 50 −1 𝐼0 500 500 50
𝑝(𝑥) =
−𝑥 10
1
( −50)𝑒 (0 − 1)
500
𝑝(𝑥) =
1 10
−𝑥
𝑒 10
∞ 1
𝑝(𝑦) = ∫0 𝑝(𝑦) = 𝑝(𝑦) =
500
𝑥 ≥0
−𝑥 −𝑦
𝑒 10 𝑒 50 𝑑𝑦
−10 −𝑦 500 1 50
𝑒 50 (0 − 1) −𝑦
𝑒 50
𝑦≥0