Prácticas de Simulación con Excel
Introducción Este documento contiene los enunciados de las prácticas a resolver por los alumnos de la asignatura SIMULACION El formato de presentación será Excel, en concreto en un único libro que contendrá una única hoja para cada uno de los problemas que se hayan resuelto. El nombre de fichero Excel será: apellido1_apellido2_nombre_EA1.xls sin acentos ni mayúsculas, por ejemplo: gomez_perez_jesus_EA1.xls cada hoja se nombrará como P# siendo # el nº del problema que se resuelve en dicha hoja.
el enunciado concreto del problema dependerá del nº del DNI del alumno. Los enunciados que hay que resolver aparecen en la tabla siguiente: Enunciados Carácter Del nº 1 al nº 10 (ambos incluidos) Obligatorio Del nº 11 al nº 17 (ambos incluidos) Hay que elegir 5 Nº 18 Los que opten a Matricula de Honor
2
1) Generar una muestra de tamaño n=1000 de la distribución enunciada. Obtener la función de probabilidad, la función de distribución, el histograma de ambas, y comparar las frecuencias observadas (empíricas) con las que cabría esperar (teóricas). Caso a resolver Uniforme discreta U[1;6] Poisson (media=2) Poisson (tasa=1 cada 12 minutos) Binomial (n=12; p=0,35) Binomial negativa (r=2, p=1/12) Poisson (media=12)
DNI acabado en 0,1 2,3 4,5 6,7 8,9 Modelo
Guía: Excel cuenta con una función para la distribución y densidad de Poisson, cuenta también con la posibilidad de obtener muestras aleatorias así distribuidas (Herramientas + Análisis de Datos + Generación de números aleatorios). En cualquier caso es posible obtener números que se distribuyan según una Poisson aleatorios utilizando la fórmula siguiente: BINOM.CRIT(λ/0,001;0,001;ALEATORIO())
Utilizaremos la primera opción llamando al módulo de Análisis de Datos
3
Una vez obtenidos los números aleatorios (que hemos colocado en la columna A) procedemos al análisis de la muestra usando la función Frecuencia. Antes creamos la columna X, que recogerá los posibles valores de la variable: empezamos en 0 y arrastramos creando una serie hasta un número suficiente de valores, por ejemplo 3 sigmas a la derecha de la media, es decir 12 + (3·120,5)≈20
4
Creamos también la columna N, en la que pondremos el resultado de usar Frecuencia, para que recoja la frecuencia absoluta de los datos
A continuación creamos una nueva columna (f) para recoger las frecuencias relativas, lo que haremos dividiendo las absolutas entre el número total de observaciones que habremos calculado en un celda aparte sumando las frecuencias relativas.
Con estos datos ya podemos crear los gráficos de la muestra.
140
N
120
100
80
60
40
20
20
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
0
0
5
Falta compararlos con las frecuencias teóricas. Para saberlas usamos la función que tiene Excel relacionada con la probabilidad de una v.a. de Poisson: Recordamos que la función de cuantía de la distribución Poisson(λ) es: e −λ λ X p = (x) x! La función de distribución es: λn F =e ∑ (x) n = 0 n! −λ
n= X
La función de Excel que nos da ambas es: POISSON(x ; media ; acumulado) • • •
x el valor que toma la variable; media, el parámetro λ; acumulado es un valor lógico que determina la forma de la función. Si el argumento acumulado es VERDADERO, devuelve la función de distribución; si es FALSO, devuelve la función de masa de probabilidad.
6
Para calcular las frecuencias absolutas multiplicamos las relativas por el tamaño de la muestra. El resultado final será parecido al siguiente:
X N 0 0 0 1 1 2 1 3 9 4 5 16 6 30 7 36 8 76 9 115 10 94 11 87 12 110 13 120 14 88 15 60 16 59 17 39 18 20 19 14 20 9 16
f 0,000 0,000 0,001 0,001 0,009 0,016 0,030 0,037 0,077 0,117 0,096 0,088 0,112 0,122 0,089 0,061 0,060 0,040 0,020 0,014 0,009 0,016
f T eó N teór 0,0000 0 0,0001 0 0,0004 0 0,0018 2 0,0053 5 0,0127 13 0,0255 25 0,0437 43 0,0655 64 0,0874 86 0,1048 103 0,1144 113 0,1144 113 0,1056 104 0,0905 89 0,0724 71 0,0543 53 0,0383 38 0,0255 25 0,0161 16 0,0097 10 0,0000
140
Comparación
120
100
80
60
40
20
Si bien, debido a los diferentes números aleatorios generados en cada ordenador, los resultados no serán nuca idénticos a los anteriores.
7
20
17 18 19
14 15 16
12 13
9 10 11
7 8
4 5 6
1 2 3
0
0
2) Generar una muestra de tamaño n=1000 de la distribución enunciada. Obtener la función de probabilidad, la función de distribución, el histograma de ambas, y comparar las frecuencias observadas (empíricas) con las que cabría esperar (teóricas). Caso a resolver Uniforme continua U[-2;2] Exponencial (media=12) Exponencial (tasa=1 cada 12 minutos) Beta (2,3) Gamma (r=2, s=3) Normal (μ=12; σ=2)
DNI acabado en 0,1 2,3 4,5 6,7 8,9 Modelo
Guía: A diferencia del ejemplo anterior, aunque podríamos hacerlo también puesto que el módulo de números aleatorios también tiene la distribución Normal, generaremos nosotros la muestra aleatoria usando la función inversa que tiene Excel. Así en la primera celda de la primera columna introduciremos la fórmula correspondiente
y la iremos arrastrando hasta la fila 1000, para generar la muestra de ese tamaño.
Haremos como en el ejercicio anterior la distribución de frecuencias observadas en la muestra, para lo cual crearemos la columna N de posibles valores:
μ ± 3σ y utilizaremos la función Frecuencia para contar las frecuencias relativas
X N f 6,0 3 0,003 6,5 3 0,003 7,0 2 0,002 7,5 5 0,005 8,0 10 0,010 8,5 9 0,009 9,0 29 0,029 9,5 42 0,042 10,0 53 0,053 10,5 82 0,082 11,0 69 0,069 11,5 93 0,093 12,0 79 0,079 12,5 110 0,110 13,0 89 0,089 13,5 96 0,096 14,0 64 0,064 14,5 52 0,052 15,0 39 0,039 15,5 31 0,031 16,0 14 0,014 16,5 12 0,012 17,0 8 0,008 17,5 2 0,002 18,0 3 0,003 18,5 1 0,001 19,0 0 0,000 19,5 0 0,000 20,0 0 0,000
8
Para obtener la distribución de las frecuencias teóricas, utilizaremos la función DISTR.NORM que tiene Excel:
Sin embargo, a diferencia de como haríamos en el caso de las discretas calculamos primero la función de distribución (Acumulado=TRUE) para estimar la función de densidad a partir de los valores de esta:
9
Una vez hecho esto tendremos tanto la distribución empíricas como la teórica: 1000
X N f 6,0 3 0,003 6,5 3 0,003 7,0 2 0,002 7,5 5 0,005 8,0 10 0,010 8,5 9 0,009 9,0 29 0,029 9,5 42 0,042 10,0 53 0,053 10,5 82 0,082 11,0 69 0,069 11,5 93 0,093 12,0 79 0,079 12,5 110 0,110 13,0 89 0,089 13,5 96 0,096 14,0 64 0,064 14,5 52 0,052 15,0 39 0,039 15,5 31 0,031 16,0 14 0,014 16,5 12 0,012 17,0 8 0,008 17,5 2 0,002 18,0 3 0,003 18,5 1 0,001 19,0 0 0,000 19,5 0 0,000 20,0 0 0,000
1000,0
F 0,0013 0,0030 0,0062 0,0122 0,0228 0,0401 0,0668 0,1056 0,1587 0,2266 0,3085 0,4013 0,5000 0,5987 0,6915 0,7734 0,8413 0,8944 0,9332 0,9599 0,9772 0,9878 0,9938 0,9970 0,9987 0,9994 0,9998 0,9999 1,0000
f N(Teó) 0,0013 1,3 0,0016 1,6 0,0032 3,2 0,0060 6,0 0,0105 10,5 0,0173 17,3 0,0267 26,7 0,0388 38,8 0,0530 53,0 0,0680 68,0 0,0819 81,9 0,0928 92,8 0,0987 98,7 0,0987 98,7 0,0928 92,8 0,0819 81,9 0,0680 68,0 0,0530 53,0 0,0388 38,8 0,0267 26,7 0,0173 17,3 0,0105 10,5 0,0060 6,0 0,0032 3,2 0,0016 1,6 0,0008 0,8 0,0003 0,3 0,0001 0,1 0,0001 0,1
con lo cual ya podremos hacer la comparación gráfica de una y otras, tanto en frecuencias absolutas:
10
como en frecuencias relativas:
o en las Funciones de distribución sin más que añadir una nueva columna, F, a las frecuencias empríricas que recoja las sumas de éstas:
1,000 0,900 0,800 0,700 0,600 0,500 0,400 0,300 0,200 0,100
20
19
18
17
16
15
14
13
12
11
9
10
0,000 8
f N(Teó) 0,0013 1,3 0,0016 1,6 0,0032 3,2 0,0060 6,0 0,0105 10,5 0,0173 17,3 0,0267 26,7 0,0388 38,8 0,0530 53,0 0,0680 68,0 0,0819 81,9 0,0928 92,8 0,0987 98,7 0,0987 98,7 0,0928 92,8 0,0819 81,9 0,0680 68,0 0,0530 53,0 0,0388 38,8 0,0267 26,7 0,0173 17,3 0,0105 10,5 0,0060 6,0 0,0032 3,2 0,0016 1,6 0,0008 0,8 0,0003 0,3 0,0001 0,1 0,0001 0,1
7
X N f F F 6,0 1 0,001 0,001 0,0013 6,5 1 0,001 0,002 0,0030 7,0 4 0,004 0,006 0,0062 7,5 2 0,002 0,008 0,0122 8,0 12 0,012 0,020 0,0228 8,5 20 0,020 0,040 0,0401 9,0 24 0,024 0,064 0,0668 9,5 42 0,042 0,106 0,1056 10,0 55 0,055 0,161 0,1587 10,5 65 0,065 0,226 0,2266 11,0 85 0,085 0,311 0,3085 11,5 94 0,094 0,405 0,4013 12,0 94 0,094 0,499 0,5000 12,5 107 0,107 0,606 0,5987 13,0 88 0,088 0,694 0,6915 13,5 82 0,082 0,776 0,7734 14,0 57 0,057 0,833 0,8413 14,5 56 0,056 0,889 0,8944 15,0 42 0,042 0,931 0,9332 15,5 30 0,030 0,961 0,9599 16,0 24 0,024 0,985 0,9772 16,5 7 0,007 0,992 0,9878 17,0 3 0,003 0,995 0,9938 17,5 3 0,003 0,998 0,9970 18,0 1 0,001 0,999 0,9987 18,5 0 0,000 0,999 0,9994 19,0 0 0,000 0,999 0,9998 19,5 1 0,001 1,000 0,9999 20,0 0 0,000 1,000 1,0000 0
1000,0
6
1000
11
3) Sea X una variable aleatoria definida de la forma siguiente ⎧ X1 ≈ Poisson (λ1 ) ⎪ X = X1 + X 2 + X 3 ⇒ ⎨X 2 ≈ Poisson (λ 2 ) ⎪ X ≈ Poisson (λ ) 3 ⎩ 3 a) Generar 1000 valores de X. b) Ajustar a Poisson y comparar ambas distribuciones empírica y ajustada de forma gráfica. c) Comparar la ajustada con la que se deduce de la propiedad aditiva de Poisson. Caso a resolver DNI acabado en λ1 λ2 λ3 nº par 12 15 21 nº impar 6 9 7 modelo 2 3 4
Guía Recordamos lo siguiente sobre la Poisson: Generación. Excel cuenta con una función para la distribución y densidad de Poisson, cuenta también con la posibilidad de obtener muestras aleatorias así distribuidas (Herramientas + Análisis de Datos + Generación de números aleatorios). En cualquier caso es posible obtener números aleatorios que se distribuyan según una Poisson de parámetro λ, utilizando la fórmula siguiente:
BINOM.CRIT(λ/0,001;0,001;ALEATORIO()) Caracterización. El parámetro λ puede ser estimado fácilmente de la forma siguiente:
ˆ=x λ
(n)
Simulamos las 3 variables usando la fórmula anterior Tabulamos X desde 0 hasta 20 y calculamos las frecuencias empíricas F con la función Frecuencia: Calculamos la función de probabilidad estimada de X Emp dividiendo la frecuencia de cada valor por el numero total de observaciones.
Calculamos primero la media de los datos y calculamos después las frecuencias teóricas de X usando la función Poisson :
12
Finalmente tenemos todos los datos necesarios para poder representar ambas funciones X 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
F 0 1 2 20 43 66 81 117 127 119 125 97 73 45 31 24 11 7 6 3 1 1 1000
Emp 0,000 0,001 0,002 0,020 0,043 0,066 0,081 0,117 0,127 0,119 0,125 0,097 0,073 0,045 0,031 0,024 0,011 0,007 0,006 0,003 0,001
Teo Teo 0,000 0 0,001 1 0,005 5 0,015 15 0,033 33 0,060 60 0,090 90 0,116 116 0,131 131 0,132 132 0,119 119 0,098 98 0,074 74 0,051 51 0,033 33 0,020 20 0,011 11 0,006 6 0,003 3 0,001 1 0,001 1
Con lo que ya podemos obtener los gráficos correspondientes:
140
Emp
Teo
120 100 80 60 40 20
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
0
13
4) Sea X una variable aleatoria definida de la forma siguiente
⎧a = 5 ⎪ Y = ( a ⋅ X1 ) ⇒ ⎨ ⎪ X Exponencial ( media = 4 ) ⎩ 1 Caso a resolver DNI acabado en a nº par 12 nº impar 6 modelo 5
Media 2 6 4
a) Generar 1000 valores de Y. b) Ajustar a Exponencial y comparar de forma gráfica los resultados obtenidos en la simulación con los teóricos. Generación. Excel no cuenta con una función para la inversa de la función de distribución, sin embargo, la generación de variables aleatorias puede hacerse utilizando la fórmula siguiente: Media* -LN(ALEATORIO()) Media a X 0,00 2,00 4,00 6,00 8,00 10,00 12,00 14,00 16,00 18,00 20,00 22,00 24,00 26,00 28,00 30,00 32,00 34,00 36,00
4 5 N 0 97 95 83 67 68 47 49 60 45 30 29 32 25 22 26 26 15 14 170 830
Media*a
20 f2
0,117 0,114 0,100 0,081 0,082 0,057 0,059 0,072 0,054 0,036 0,035 0,039 0,030 0,027 0,031 0,031 0,018 0,017
f1 0 0,045 0,041 0,037 0,034 0,030 0,027 0,025 0,022 0,020 0,018 0,017 0,015 0,014 0,012 0,011 0,010 0,009 0,008
0,114 0,103 0,093 0,084 0,076 0,069 0,063 0,057 0,051 0,046 0,042 0,038 0,034 0,031 0,028 0,025 0,023 0,021
1
0,397
1
f
Definimos los nombres Media y a y empleamos la fórmula para generar los valores de Y
14
Generamos la tabla de frecuencias empíricas relativas (f) y de frecuencias teóricas (f1) usando FRECUENCIA, DISTR.EXP teniendo en cuenta que: Si X ≅ Exp(λ) → aX ≅ Exp(λ·a)
será necesario ajustar f1, dividiendo por su suma para “pasar de discreto a continuo” así la probabilidad teórica que usamos para la comparación es f2 f2 ( X ) =
f1 ( X )
∑ f (X) 1
Finalmente utilizamos gráficos de dispersión para dibujar las frecuencias teóricas y empíricas. El resultado será parecido al siguiente:
0,06 0,04 0,02 0,00 40
1
0,08
35
0,397
0,10
30
1
f
25
0,114 0,103 0,093 0,084 0,076 0,069 0,063 0,057 0,051 0,046 0,042 0,038 0,034 0,031 0,028 0,025 0,023 0,021
f2
0,12
20
f2
0,096 0,093 0,106 0,078 0,081 0,066 0,087 0,058 0,050 0,050 0,030 0,038 0,038 0,031 0,024 0,031 0,023 0,023
f1 0 0,045 0,041 0,037 0,034 0,030 0,027 0,025 0,022 0,020 0,018 0,017 0,015 0,014 0,012 0,011 0,010 0,009 0,008
f
15
20
10
Media*a
5
4 5 N 0 81 78 89 66 68 56 73 49 42 42 25 32 32 26 20 26 19 19 157 843
0
Media a X 0,00 2,00 4,00 6,00 8,00 10,00 12,00 14,00 16,00 18,00 20,00 22,00 24,00 26,00 28,00 30,00 32,00 34,00 36,00
15
5) Sea X una variable aleatoria definida de la forma siguiente ⎧ Y ≈ Exponencia l (m1 ) X = min {Y1 ; Y2 } ⇒ ⎨ 1 ⎩ Y2 ≈ Exponencia l (m2 )
DNI acabado en nº par nº impar modelo
m1 12 6 5
m2 2 6 4
a) Generar 1000 valores de Y. b) Ajustar a Exponencial y comparar de forma gráfica los resultados obtenidos en la simulación con los teóricos. Definimos los nombres Media1 y Media2 empleamos la fórmula para generar los lores de Y usando la función MIN
X 0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0 6,5 7,0 7,5 8,0 8,5 9,0
N 0 236 156 153 108 83 90 54 47 35 23 20 15 18 13 14 11 4 6 14 1086
f 0,217 0,144 0,141 0,099 0,076 0,083 0,050 0,043 0,032 0,021 0,018 0,014 0,017 0,012 0,013 0,010 0,004 0,006
f1 0,000 0,450 0,359 0,287 0,229 0,183 0,146 0,117 0,093 0,074 0,059 0,047 0,038 0,030 0,024 0,019 0,015 0,012 0,010
f2 0,205 0,164 0,131 0,104 0,083 0,067 0,053 0,042 0,034 0,027 0,022 0,017 0,014 0,011 0,009 0,007 0,006 0,004
1
2,19
1
y va-
Generamos la tabla de frecuencias empíricas relativas (f) y de frecuencias teóricas (f1) usando FRECUENCIA, DISTR.EXP y teniendo en cuenta que Y1 Exp ( λ1 ) ⎫ ⎪ ⎬ Y2 Exp ( λ 2 ) ⎪⎭
⎛ ⎞ ⎜ ⎟ 1 ⎟ min {Y1 , Y2 } Exp ⎜ ⎜ 1 + 1 ⎟ ⎜λ ⎟ ⎝ 1 λ2 ⎠
0,25
f2
f
0,20
0,15
Al compensar f1, igual que en el 0,10 ejercicio anterior, obtendremos las dos frecuencias a comparar, las que hemos 0,05 llamado f2 y f.
16
10
9
8
7
6
5
4
3
2
1
0
0,00
6) Sea X una variable aleatoria definida de la forma siguiente ⎧ Y ≈ Gamma (5;1) Y = (Y1 + Y2 ) ⇔ ⎨ 1 ⎩ Y2 ≈ Gamma (4 ;1)
a) Generar 1000 valores de Y. b) Ajustar a Gamma y comparar de forma gráfica los resultados obtenidos en la simulación con los teóricos. Generación.
Excel cuenta con una función para la inversa de la función de distribución Gamma, la generación de variables aleatorias puede hacerse utilizando la fórmula siguiente:
DISTR.GAMMA.INV(ALEATORIO();r,β) Definimos los parámetros del problema
r1+r2 r1 r2 Lambda
9 4 5 1
Generamos los valores de Y1 e Y2 y los sumamos para obtener Y
Construimos la tabla de frecuencias como en los anteriores teniendo en cuenta que : Y1 ≈ Gamma (r1 ;1)⎫ ⎬ ⇒ (Y1 + Y2 ) ≈ Gamma (r1 + r2 ;1) Y2 ≈ Gamma r2 ;1 ⎭
( )
X 0,0 1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 10,0 11,0 12,0 13,0 14,0 15,0 16,0 17,0 18,0
N 0 0 0 2 17 52 95 129 121 138 137 86 83 47 34 22 16 10 6 5 995
f 0,000 0,000 0,002 0,017 0,052 0,095 0,130 0,122 0,139 0,138 0,086 0,083 0,047 0,034 0,022 0,016 0,010 0,006
f1 0,000 0,000 0,000 0,001 0,008 0,030 0,065 0,103 0,130 0,140 0,132 0,113 0,089 0,066 0,046 0,030 0,019 0,012 0,007
0,000 0,000 0,001 0,008 0,030 0,066 0,104 0,132 0,141 0,133 0,114 0,090 0,066 0,046 0,031 0,020 0,012 0,007
1
0,99
1
17
f2
Para calcular la frecuencia teórica usamos la función DISTR.GAMMA
Como en los problemas anteriores es necesario normalizar f1, calculada como f2 ( X ) =
f1 ( X )
∑ f (X) 1
Finalmente realizamos el gráfico de dispersión de ambas frecuencias 0,16
f2
f
0,14 0,12 0,10 0,08 0,06 0,04 0,02
20
18
16
14
12
10
8
6
4
2
0
0,00
18
7) Se tienen 2 urnas A={5r,3b,8a} y B={3r,5b}. Se lanza un dado, si sale un 2 o un 6 se elige la urna B, en caso contrario la A. a) ¿Qué probabilidad hay de elegir una bola roja?. b) Simular 100 veces, estimar P(roja) y comparar con los resultados teóricos. Guía: Este problema fue resuelto en clase
Por comodidad crearemos una variable U=Aleatorio() en Nombre> Definir para usarla en los cálculos posteriores
Para calcular el resultado podemos usar SI anidados
Una vez hechas las réplicas sólo queda contar y dividir: Roja Total Probabilidad
148 500 0,30
"=SUMA(A:A)" "=CONTAR(A:A)"
19
8) Sea el siguiente juego: el jugador elige un número del conjunto {1, 2, 3, 4, 5, 6}. Se lanza tres veces un dado equilibrado. Si el número elegido aparece 1, 2 o 3 veces entonces gana $200, $300 o $400 . Si su número no sale pierde $100. Resolver primero en teórico después simular y comparar los resultados. a) Calcular la distribución de la ganancia b) Calcular la ganancia media. c) Calcular la varianza de la ganancia. Guía: La variable X= nº de veces que sale nuestro número, es B(n=3;p=1/6). Calculamos la función de cuantía usando:
a partir de ella calculamos la ganancia G(x) y la ganancia al cuadrado G(x)2 para calcular la media y la varianza:
X 0 1 2 3
P(x) 0,5787 0,3472 0,0694 0,0046
G(x) -100 200 300 400
G(x)2 10000 40000 90000 160000
para la media usaremos la función Sumaproducto: para la varianza hacemos los cálculos teniendo en cuenta que V(X)=E(X2)-[E(X)]2
20
Simulamos los dados mediante:
Una forma rápida de hacer el cálculo del beneficio es media fórmulas matriciales:
y usando la función Indice le asignamos el beneficio calculado anteriormente
Como alternativa a la fórmula matricial podemos usar SI anidados Si suponemos que el número elegido es el 1, el resultado final debe ser parecido a este: Media
Teórica Estimada
34,26 40,30
Varianza
Teórica Estimada
25492,97 26372,28
aunque, debido a los diferentes número aleatorios generados, los resultados no serán exactamente los mismos.
21
9) Una acción tiene un precio inicial de $100 Cada día su cotización puede subir 1€ o bajar esa misma cantidad. La probabilidad de subir es del 35%. a) Calcular la distribución de su precio al cabo de 31 días. b) Comparar el resultado de la simulación con el teórico, de forma gráfica y por la comparación de la media y la varianza observada y teórica. Guía
•
Hay al menos dos formas distintas de abordar el problema: se puede simular cada uno de los 31 dias, usando Aleatorio() y comparando con 0,35, o se puede considerar que el número de subidas durante 31 días es una v.a. binomial B(n=31 , p=0,35). • El precio final será 100+x-(31-x)=69+2x, siendo x la realización de la v.a. binomial o la suma de la Bernouilli individuales. El resultado gráfico, análogo al explicado en el problema 1, podría ser de la forma siguiente: 250
200
150
100
50
69 71 73 75 77 79 81 83 85 87 89 91 93 95 97 99 101 103 105 107 109 111 113
0
Para comparar la media y varianza observada con las teóricas recordamos que la media y varianza de una binomial B(n,p) son (respectivamente): E (x) = n ⋅ p
;
Var ( x ) = n ⋅ p ⋅ (1 − p)
también que: E ( ax + b ) = a ⋅ E ( x ) + b
;
Var ( ax + b ) = a2 ⋅ Var ( x )
22
10)Una compañía de seguros tiene una cartera con tres tipos de pólizas A, B y C. Cada una de ellas tiene una reclamación media diferente aunque las tres siguen una distribución uniforme U[a,b]. Los datos de los parámetros y del número de clientes en cada tipo de póliza se dan en la tabla siguiente: Póliza A B C 5 10 a 1 15 15 20 b Clientes 200 500 300
a) Calcular la distribución de la reclamación total. b) Comparar el resultado de la simulación con el teórico. Guía
Este problema se puede abordar de varias formas. En primer lugar se puede intentar simular cada una de las reclamaciones individuales y sumar los importes para calcular la reclamación total, para ello necesitaríamos 1000 columnas que habría que sumar, lo cual no es práctico. Se recomienda, bien usar una combinación de las funciones FILA e INDIRECTO que, junto con SUMA y SI, al ser combinadas en una fórmula matricial en la forma siguiente: =SUMA(SI(FILA(INDIRECTO("1:200"));ALEATORIO()*15;0)) proporcionan, en una única operación, tantos sumandos “uniformes” como indique el rango de INDIRECTO (200 en el ejemplo); bien usar una aproximación basada en TCL.
23
11)Un comerciante vende calendarios. Cada calendario se compra a $1,2 y se vende a un precio de $2,4. Por cada calendario comprado pero no vendido se recupera un importe de $0,6. La demanda diaria de calendarios sigue una distribución uniforme entre 100 y 300. a) Calcular el pedido óptimo de calendarios que debe hacer el comerciante. b) Una vez determinado éste, calcular la distribución, la media y la varianza del beneficio obtenido. Guía
Calcular el Beneficio (B) en función de lo demandado y lo fabricado ⎧⎪Si pedido > demandado → B = (NO Vendido * PDev ) + ( Vendido * PVen ) ⎨ ⎪⎩Si pedido ≤ demandado → B = ( Vendido * PVen ) siempre
B = B − ( pedido * PCom ) A continuación ponderar B para cada posible demanda y estimar el beneficio para cada cifra de pedido
24
12) (Hossack) Un periódico publica la noticia de que los hombres tienen una propensión a sufrir accidentes de tráfico que resulta ser el doble de la que tienen las mujeres. Intentando demostrar la falsedad de tal afirmación un marido pacta con su mujer el siguiente juego: “Durante los próximos diez años llevaremos cuenta de los accidentes de tráfico que tengamos cada uno, al final de ese período te pagaré 1000€ por cada accidente que yo haya tenido más que vosotras dos (refiriéndose a ella y a la hija de ambos)”. Supóngase que los datos que ofreció el periódico fueron los siguientes: • •
Accidentes de hombres Accidentes de mujeres
≈ Poisson de media 1 cada 10 años, ≈ Poisson de media 1 cada 20 años
(Como ocurre en la más cruda realidad, el marido sólo paga, no recibe dinero en caso de que las mujeres tengan más accidentes que él). a) ¿Cómo es la distribución del pago esperado del marido?. b) ¿Cuál será el pago medio?. c) Resolver el problema teóricamente y comparar los resultados teóricos y los obtenidos mediante simulación. Guía: Para resolver el apartado c) téngase en cuenta que: Y1 ≈ Poisson (λ1 )⎫ ⎬ ⇒ (Y1 + Y2 ) ≈ Poisson (λ1 + λ 2 ) Y2 ≈ Poisson λ 2 ⎭
( )
y que es lógico suponer que ambos accidentes los del marido y los de ambas mujeres son independientes de manera que la distribución conjunta será:
f ( AcMar , AcMuj )
⎧ ⎧0 ≤ AcMar ≤ 7 ⎪Poisson ( λ1 ) ⋅ Poisson ( λ 2 ) ⎨ =⎨ ⎩ 0 ≤ AcMuj ≤ 7 ⎪ 0 resto ⎩
a partir de lo anterior es posible determinar la función de probabilidad de la variable pedida: Y = 1000 ⋅ max ( 0; AcMar − AcMuj )
25
Para los apartados a) y b) basta con simular un número suficiente de veces:
para el apartado c) se puede crear la distribución conjunta de frecuencias de ambas variables y calcular la distribución de la diferencia
26
13)El número mensual de reclamaciones de un determinado grupo de pólizas sigue una distribución Poisson de parámetro 4; a su vez, cada una de esas posibles reclamaciones tiene un importe que se distribuye según una exponencial de parámetro (media) igual a 12. a) Calcular la distribución del total de reclamaciones mensuales. b) Calcular el resultado teórico y comparar 140 120 100
El resultado a) debería ser parecido a este:
80 60 40 20
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200
0
1,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,0 0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200
El resultado b) debería ser parecido a este:
27
Guía: para el apartado a)
• • •
Simular primero la Poisson, En columnas siguientes un número suficiente de exponenciales. Usar la función de Excel DESREF junto con SUMA para calcular la suma mensual de las exponenciales dadas por la Poisson.
para el apartado b)
Por la teoría sabemos que la suma de exponenciales es una distribución Gamma.
(Rec Mensual | Λ = s ) ≈ Gamma(s , λ )
y
Λ ≈ Poisson(υ)
El número de sumandos que integran la Gamma es el resultado de una Poisson, de manera que habrá que: 1) Calcular la densidad de la Gamma para un rango razonable del importe de las reclamaciones, para cada una de los posibles valores del parámetro s: s ≈ Poisson (4). 2) Ponderar estos valores por los de la función de cuantía de la Poisson. 3) Agregarlos todos para obtener la función de distribución de la reclamación mensual. ∞ ∞ ⎧ Y ≈ Poisson(λ1 ) F( Y ) = ∑ p(y1 ) ⋅ ∫ λ 2e − λ 2 y 2 dy 2 ⇐ ⎨ 1 i= 0 ⎩ Y2 ≈ Poisson(λ 2 ) 0 28
29
14) El número de reclamaciones de un determinado grupo de pólizas sigue una distribución Poisson (λ), donde λ es a su vez una variable aleatoria que se distribuye según una Gamma (5 ; 2): a) Calcular la distribución de la variable aleatoria “número de reclamaciones”. b) Realizar el test de bondad del ajuste a una Binomial Negativa que se deduce de los datos anteriores. c) Realizar el test de bondad del ajuste a la Binomial Negativa teóricamente esperada. Guía Para realizar el apartado a):
• •
Simular primero la gamma para obtener un valor. Utilizar este valor para simula la Poisson.
Para realizar el apartado b):
• •
Calcula media μ y varianza σ de la distribución simulada. Calcular los parámetros de la BN(r,p) de la forma siguiente: ⎧ μ2 ˆ ⎨r = μ − σ2 ⎩
•
;
ˆ= p
μ⎫ ⎬ σ2 ⎭
Calcular la función de probabilidad usando la fórmula correspondiente1: p (x) =
Γ (r + x )
Γ (r ) Γ ( x + 1)
pr (1 − p )
x
Para realizar el apartado c): •
La teoría nos dice que: Si,
(X Λ = λ ) ≈ Poisson(λ ) y Λ ≈ Gamma(r , α)
entonces : ⎛ 1α ⎞ X ≈ BN⎜⎜ r , ⎟⎟ ⎝ 1 α +1⎠
1
Para calcular la función Gamma en Excel hay que usar dos funciones concatenadas EXP y GAM-
MA.LN de esta forma:
Γ ( x ) = EXP ( GAMMA.LN ( x ) ) ≡ e
Ln ⎣⎡Γ ( x ) ⎤⎦
ya que Excel no tiene una función Gamma pero si el logaritmo neperiano de ésta, por lo que hay que “deshacerlo”.
30
El resultado final debería ser parecido al siguiente (en el, por comodidad, se han utilizado gráficas continuas para representar distribuciones de probabilidad de variables aleatorias de carácter discreto): 90
Emp
Teo
Ajus
80 70 60 50 40 30 20 10
LICENCIATURA EN CC. ACTUARIALES Y FINANCIERAS
25
20
15
10
5
0
0
31
15)Sea la siguiente cartera de pólizas de vehículos: r α
N €
siendo:
• • • • • •
≥25 ≥25 <25 <25 Familiar Deportivo Familiar Deportivo
6,000 0,970 5826 1020
1,601 0,892 1281 1486
12,950 0,987 3570 1097
12,540 0,978 1622 1413
≥25 el asegurado tiene 25 años o más de edad, <25 el asegurado tiene 24 años o menos edad, Familiar, Deportivo tipo de vehículo, (r,α) los parámetros de la distribución Binomial negativa que describe la distribución del número de reclamaciones anuales que hace cada uno de los asegurados, N el número de pólizas suscritas, es decir el número de asegurados en esas condiciones concretas, $ la reclamación media por asegurado.
a) Estimar la distribución del monto total anual de las reclamaciones
32
16)Una compañía de seguros tiene una cartera con 3 tipos de pólizas: La primera cubre un máximo de $12.000 y tiene una franquicia de $600, es decir que los pagos P1 por reclamaciones de este tipo de póliza, D1, son de la forma siguiente: ⎧0 ⎪ P1 = ⎨R1 − 600 ⎪11.400 ⎩
si
R 1 ≤ 600
si
600 < R 1 < 12.000
si
R1 ≥ 12.000
La segunda cubre un máximo de 11.250€ y paga las 2/3 partes del daño D2: ⎧ 3R 2 ⎪ 4 ⎪ P2 = ⎨ ⎪11.250 ⎪ ⎩
si
R 2 < 15.000
si
R 2 ≥ 15.000
La tercera es de la forma siguiente: ⎧0 ⎪ P3 = ⎨ ⎪R ⎩ 3
si
R 3 < 500
si
R 3 ≥ 500
Por experiencia anterior se sabe que las distribuciones de los daños son de la forma siguiente: ⎧D1 ≅ Exp ( λ = 5000 ) ⎪ ⎨D2 ≅ Exp ( λ = 6000 ) ⎪D ≅ Exp ( λ = 1000 ) ⎩ 3 Se esperan 15 reclamaciones: 8 de D1, 4 de D2 y 3 de D3. a) ¿A qué cantidad debe ascender la reserva de la compañía para que la probabilidad de que pueda hacer frente a la reclamación total sea del 80%? Guía Se trata de una aplicación típica del TCL, las v.a.s. de los pagos son modificaciones de una exponencial, de la media de ésta: ∞
E[x ] = ∫ x ⋅ λe −λx dx 0
podríamos deducir la media de cada una de ellas, por ejemplo la de P1 seria ∞ ⎡⎛ 600 ⎞ ⎛ 12000 ⎞ ⎛ ⎞⎤ E[P1 ] = 8 ⋅ ⎢⎜⎜ ∫ 0 ⋅ λe −λx dx ⎟⎟ + ⎜⎜ ∫ (x − 600 ) ⋅ λe −λx dx ⎟⎟ + ⎜⎜11.400 ∫ x ⋅ λe −λx dx ⎟⎟⎥ ⎢⎣⎝ 0 12000 ⎠ ⎝ 600 ⎠ ⎝ ⎠⎥⎦ Podríamos también deducir, con un mayor esfuerzo, la varianza y una vez hechas las operaciones correspondientes, deducir la media y la varianza de la normal a la que se aproxima - en virtud del TCL - la distribución del pago total.
33
Aún así, la aproximación a la distribución Normal no sería demasiado buena: se trata de una suma de pocas variables aleatorias y éstas son muy sesgadas. En estas situaciones el recurso a la simulación del pago es la mejor solución. La simulación es muy sencilla, basta simular primero las exponenciales de las reclamaciones iniciales (R1, R2 y R3) y a partir de éstas, aplicando los criterios de pago de la compañía, calcular los pagos (P1, P2 y P3) que finalmente se harán.
Para responder a la pregunta sobre la reserva necesaria para afrontar los pagos bastará aplicar la función PERCENTIL sobre los datos simulados.
34
17)Una empresa sabe que la demanda diaria en kilogramos del producto que fabrica sigue una distribución Pareto(3,2) mientras que la oferta de ese mismo producto se distribuye según una distribución Normal(3;0,5). Tiene un coste de $0,05 por kilo fabricado y no vendido y de $0,5 por kilo demandado y no servido: a) Calcular la distribución de la diferencia entre demanda (D) y oferta (O) es decir de la variable D-O. b) Calcular la distribución de las ganancias o pérdidas. Guía: Generación de Pareto: La notación habitual es X∼Par(α,β), ambos parámetros son de escala. En la literatura aparecen descritos diversos métodos para generar v.a. de Pareto. En Excel es posible obtener v.a. a través de cualquiera de las fórmulas siguientes: =β*((1/(1-ALEATORIO()))^(1/α)) =β*(ALEATORIO()^(-1/α)) Generación de Normal: Excel cuenta con la función inversa de la distribución: =DISTR.NORM.INV(ALEATORIO();μ;σ)
35
36
18)Una compañía de seguros de automóviles tiene un sistema bonus-malus, o de descuento por buen conductor. Hay varios tramos de descuento para el pago anula de una póliza por la que se comienza pagando $250: 1 2 3 4 5 6 7 0% 10% 20% 30% 40% 50% 60% si durante un plazo de un año no se hace ninguna reclamación, se aumenta un tramo de descuento al año siguiente, hasta el descuento máximo del 60% que se alcanza al llegar al 7º tramo. Mientras que si, durante un plazo de un año, se hace una única reclamación (o más de una) se vuelve al comienzo de la escala, es decir, al 0% de descuento del primer tramo. Se está en proceso de decidir si cambiar o no este sistema por otro análogo. Este nuevo sistema tendría sólo 4 tramos de descuento: 1 2 3 4 0% 20% 40% 60% Pero, a diferencia del anterior, sólo se retrocede un puesto en la escala por reclamación, es decir si durante un año no hay reclamaciones se gana un 20% de descuento, si hay una reclamación se pierde un 20% de descuento. El descuento no puede ser superior al 60% ni negativo. También sería diferente la prima que pasaría de $250 a $(250+75) . Se sabe que el número de accidentes que ocurren anualmente sigue una distribución de Poisson de parámetro 0,1 por año, mientras que la distribución del importe de las reclamaciones se distribuye de forma LogNormal(μ = 6,012 ; σ = 1,792). También hay que tener en cuenta que las reclamaciones que no le interesan al cliente no se realizan, por ejemplo en el primer sistema, un cliente que éste en el tramo 4 (30%) perdería este descuento si hiciera una reclamación así que si el daño que recibe es inferior a lo que pierde no le interesa reclamar. Las pérdidas mínimas por sistema y tramo son las siguientes: Tramo 1 2 3 4 5 6 7 Importe 25 50 75 100 125 150 150 Tramo 1 2 3 4 Importe 125 175 175 125 a) Decidir qué sistema es el mejor para la compañía, si la póliza está suscrita por 1000 clientes.
37