Fundación Universitaria Konrad Lorenz, Villalobos Paula. Proyección Tasa natalidad
PROYECCION DE LA TASA DE NATALIDAD DE COLOMBIA Villalobos, Paula
[email protected] Fundación Universitaria Konrad Lorenz
Resumen: En este documento se planteará una proyección de la tasa de natalidad en Colombia en el 2012, partiendo de los datos existentes desde 1990 a 2008. Para ello se usarán las herramientas vistas en el curso de métodos numéricos buscando aplicar un método que obtenga una solución aproximada del problema. Índice de términos: regresión, sumatoria, tasa.
I. INTRODUCCIÓN Actualmente el mundo atraviesa una crisis económica donde sus principales causales son la pobreza, aumento del costo de la canasta familiar, crisis bancarias, entre otras. Desde el punto de vista social y económico, una de las causas más influyentes es la pobreza, dada por la cantidad de población de cada país; incluyendo aspectos tales como nutrición, natalidad, mortalidad, etc. Analizando de fondo la situación encontramos que lo que determina principalmente el índice demográfico de la población es la tasa de natalidad y mortalidad, en este proyecto se trabajará con base en la tasa de natalidad. Análogamente notamos que la crisis económica es directamente proporcional al crecimiento de la población, en consecuencia entre mas alta sea la tasa de natalidad hay mas probabilidad de que las condiciones económicas sean desfavorables. II. FORMULACIÓN Partiendo de lo anterior podemos hacer una proyección de la tasa de natalidad a futuro, con el fin de evaluar situación económica en años próximos. Esto daría una perspectiva de la situación próxima, dando posibles alternativas de planeación y prevención. En base a los datos actuales correspondientes a la tasa de natalidad en Colombia, podemos pronosticar el valor de esta tasa a futuro (Ejemplo: Año 2012), a través de un método matemático que permita modelar esta situación en función del tiempo y determine un valor aproximado.
Fundación Universitaria Konrad Lorenz, Villalobos Paula. Proyección Tasa natalidad
Gráfico 1.Tasa de natalidad colombiana desde 1989 a 2008
1
III. JUSTIFICACIÓN El método que aplicaremos para solucionar este problema es REGRESION POLINOMIAL, puesto que una de sus características es trabajar con datos que posean una estructura ascendente o descendente, como se muestra en la Grafica 1. El objetivo de este método es explicar (o predecir) la variable Y (Dato a buscar) a través de una covariable X (Datos existentes), por medio de un polinomio de grado P. 2 El grado m del polinomio pm(x) se puede escoger previamente con base en algún resultado teórico, alguna expectativa o por la aplicación que se le pretenda dar al polinomio. En cualquier caso estamos “libres” de elegir el grado que parezca mejor. En muchos casos el grado será uno y el polinomio obtenido se llamará la recta que mejor se ajusta o la recta de mínimos cuadrados para la tabla de datos.3 Si se utiliza un grado p muy alto se puede conseguir un ajuste muy bueno e incluso un ajuste exacto si p = n-1. Pero esta formulación no es correcta ya que se estaría ajustando el error del modelo. Por ello se recomienda utilizar un valor de p bajo (p < 3) y, en la mayoría de las situaciones, es suficiente utilizar p = 2.
Fundación Universitaria Konrad Lorenz, Villalobos Paula. Proyección Tasa natalidad
Es necesario hacer un análisis de los residuos para determinar si el ajuste es adecuado y se satisfacen las hipótesis básicas.4 Los casos particulares de a regresión polinomica son: • p=1 → recta de regresión. • p=2 → regresión cuadrática. • p=3 → regresión cúbica. El problema consiste en encontrar los coeficientes de los términos de las ecuaciones, que darán un polinomio que cumplirá el requisito de que la suma de cuadrados sea mínima. Para esto se hará uso de las ecuaciones normales. Se necesitara tantas ecuaciones como coeficientes haya, o una más del grado de la ecuación que se quiera ajustar.5 El procedimiento de mínimos cuadrado se puede extender fácilmente y ajustar los datos a un polinomio de m-ésimo grado:
y = a0 + a1 x + a2 x 2 + ... + am x m
(1)
En este caso, la suma de los cuadrados de los residuos es: n
S r = ∑( y i =n
2
m (2) i −a0 − a1 xi −...− am xi )
Siguiendo el mismo procedimiento de la sección anterior, se toma la derivada de la ecuación (2) con respecto a cada uno de los coeficientes del polinomio, para obtener:
∂Sr 2 m = −2∑ ( y − a 0 − a 1 x i − a 2 x i − ... − a m x i ) i ∂a0 ∂Sr 2 m = −2∑ x i ( y − a 0 − a 1 x i − a 2 x i − ... − a m x i ) i ∂a1 ∂Sr 2 2 m = −2∑ x i ( y − a 0 − a 1 x i − a 2 x i − ... − a m x i ) i ∂a2 ∂Sr m 2 m = −2∑ x i ( y − a 0 − a 1 x i − a 2 x i − ... − a m x i ) i ∂am
Fundación Universitaria Konrad Lorenz, Villalobos Paula. Proyección Tasa natalidad
Estas ecuaciones se puedes igualar a cero y reordenar de tal forma que se obtenga el siguiente conjunto de ecuaciones normales:
a0n + a1∑ xi + a2∑ xi +…+ am∑ xi = ∑ y 2
m
a ∑ x + a ∑ x + a ∑ x +…+ a ∑ x a ∑ x + a ∑ x + a ∑ x +…+ a ∑ x 2
0
1
1
2
0
i
2
i
3
1
i
m+1
3
i
m
= ∑ xi y
m+2
4
2
i
i
m
i
i
i
= ∑ xi y 2
i
a ∑x + a ∑x
m+1
m
0
i
1
i
+ a2∑ xi +…+ am∑ xi = ∑ xi m+2
2m
m
y
i
En donde todas las sumatorias van desde i=1 hasta n. Nótese que las m+1 ecuaciones anteriores son lineales y tienen m+1 incógnitas: a0, a1,…, am. Los coeficientes de las incógnitas se pueden calcular directamente de los observados. Por lo tanto, el problema de determinar polinomios de grado m con mínimos cuadrados es equivalente a resolver un sistema de m+1 ecuaciones lineales simultáneas.6
n n 2 n m n (n +1)a0 + ∑ xi a1 + ∑ xk a2 + .... + ∑ xi am = ∑ y i =0 i =0 i =0 i =0 k n n 2 n 3 n m+1 n + + + + = .... ∑ xk a0 ∑ xi a1 ∑ xi a2 ∑ xi am ∑ xi yi i =0 i =0 i =0 i =0 i =0 n 4 n m+ 2 n 2 n 2 n 3 + + + .... + = ∑ xi a0 ∑ xi a1 ∑ xi a2 ∑ xi am ∑ xi yi i =0 i =0 i =0 i =0 i =0 n j n 1+m n 2+ m n m+ m n m ∑ xi a0 + ∑ xi a1 + ∑ xi a2 + .... + ∑ xi am = ∑ xi yi i =0 i =0 i =0 i =0 i =0 n n n n n m m+m m 1+ m 2+ m ∑ xi a0 + ∑ xi a1 + ∑ xi a2 + .... + ∑ xi am = ∑ xi yi i =0 i =0 i =0 i =0 i =0
Fundación Universitaria Konrad Lorenz, Villalobos Paula. Proyección Tasa natalidad
Este es un SEL de m + 1 ecuaciones lineales en las m + 1 incógnitas a0, a1, ., am, que se llama Sistema de Ecuaciones Normales. Este sistema de ecuaciones normales se puede escribir en forma simplificada como sigue: m
n
∑a ∑ x i
i =0
i+ j k
k =0
n
= ∑ xk y j
k =0
con j=0,1,…..,m k
Estas ecuaciones se pueden reproducir a partir de:
P ( x ) = a + a x + a x +,......, a x 2
m
0
1
i
Multiplicando a ambos lados por
x
i
j
j
2
j i
i
m
m
i
y
=
, j = 0, 1, …, m,
2
j
i
i
m
j
j
i
i
i
a x + a x x + a x x +,......, a x x = y x a x + a x + a x +,......, a x = x y 0
1
i
2
i
1+ j
j
0
i
1
i
m
2+ j
2
i
i
i
m
i
m+ j
j
i
i
→
i
Sumando sobre i
n
n
a ∑x +a ∑x 0
j
i
1
i =0
i =0
1+ j i
n
m
+ a 2∑ x i + .... + a m∑ x i 2+ j
i =0
i =0
m+ j
m
= a m∑ x i i =0
j
y
i
con j=0,1,2,….m
Coeficiente de determinación El coeficiente de determinación
( R ) o coeficiente de correlación múltiple al 2
cuadrado, es una medida descriptiva que sirve para evaluar la bondad de ajuste del modelo a lo datos, ya que mide la capacidad predictiva del modelo ajustado. 7
Fundación Universitaria Konrad Lorenz, Villalobos Paula. Proyección Tasa natalidad
∑ x = ∑ xy −
∑ x∑ y n
x *∑ y ∑ x = x y − ∑ ∑ n ∑ x = ∑ x y − ∑ x *∑ y 2
2
2
2
3
3
La suma de cuadrados de la regresión se define así:
SCR = b1 ∑ x + b2 ∑ x 2 + b3 ∑ x3 SCT = ∑ y 2 −
(∑ y)
2
n
El coeficiente de determinación es:
R
2
=
SCR SCT
IV. SOLUCIÓN DEL PROBLEMA Para determinar la proyección de la tasa de natalidad al año 2012 (Ejemplo tomado en este proyecto), usamos un polinomio de grado 3 al cual le aplicaremos regresión polinomial, por el siguiente polinomio.
P ( x ) = a0 + a1 x + a2 x 2 + a3 x 3
Fundación Universitaria Konrad Lorenz, Villalobos Paula. Proyección Tasa natalidad
1. En primera instancia tomamos los datos existentes: X 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
Periodos 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008
Tasa de Natalidad 27,8 27,73 27,61 27,35 27,2 26,97 26,52 26,01 25,48 24,96 24,49 24,02 23,58 23,14 22,3 20,82 20,48 20,16 19,86
Tabla1. Datos de la tasa de natalidad entre 1998 a 2008
8
2. Ingresamos los datos de manera tal que x corresponde al periodo dado en años. Hacemos los respectivos cálculos y sumatorias. x
Σ
y
x²
1 27,8 1 2 27,73 4 3 27,61 9 4 27,35 16 5 27,2 25 6 26,97 36 7 26,52 49 8 26,01 64 9 25,48 81 10 24,96 100 11 24,49 121 12 24,02 144 13 23,58 169 14 23,14 196 15 22,3 225 16 20,82 256 17 20,48 289 18 20,16 324 19 19,86 361 190 466,48 2470
y²
x³
x⁴
x⁵
x⁶
xy
772,84 1 1 1 1 27,8 768,9529 8 16 32 64 55,46 762,3121 27 81 243 729 82,83 748,0225 64 256 1024 4096 109,4 739,84 125 625 3125 15625 136 727,3809 216 1296 7776 46656 161,82 703,3104 343 2401 16807 117649 185,64 676,5201 512 4096 32768 262144 208,08 649,2304 729 6561 59049 531441 229,32 623,0016 1000 10000 100000 1000000 249,6 599,7601 1331 14641 161051 1771561 269,39 576,9604 1728 20736 248832 2985984 288,24 556,0164 2197 28561 371293 4826809 306,54 535,4596 2744 38416 537824 7529536 323,96 497,29 3375 50625 759375 11390625 334,5 433,4724 4096 65536 1048576 16777216 333,12 419,4304 4913 83521 1419857 24137569 348,16 406,4256 5832 104976 1889568 34012224 362,88 394,4196 6859 130321 2476099 47045881 377,34 11590,6454 36100 562666 9133300 152455810 4390,08 Tabla 2. Calculo de sumatorias de la regresión polinomial
x²y
x³y
27,8 110,92 248,49 437,6 680 970,92 1299,48 1664,64 2063,88 2496 2963,29 3458,88 3985,02 4535,44 5017,5 5329,92 5918,72 6531,84 7169,46 54909,8
27,8 221,84 745,47 1750,4 3400 5825,52 9096,36 13317,12 18574,92 24960 32596,19 41506,56 51805,26 63496,16 75262,5 85278,72 100618,24 117573,12 136219,74 782275,92
Fundación Universitaria Konrad Lorenz, Villalobos Paula. Proyección Tasa natalidad
3. Con la información de la tabla No. 1, obtenemos los datos necesarios para calcular el polinomio deseado. DATOS n=
19
Σxy=
4390,08
Σx =
190
Σy=
466,48
Σx² =
2470
Σx²y =
54909,8
Σx³ =
36100
Σx³y =
782275,92
Σx⁴ =
562666
Σy² =
11590,6454
Σx⁵ =
9133300
Σx⁶ =
152455810
4. Hallamos la matriz de coeficientes y sus respectivos valores independientes con las sumatorias de los datos anteriores.
MATRIZ DE COEFICIENTES
VALORES INDENPEDIENTES a0 466,48
0
1
2
3
19
190
2470
36100
a1
4390,08
190
2470
36100
562666
a2
54909,8
2470
36100
562666
9133300
a3
782275,92
36100
562666
9133300
152455810
5. Con ello encontramos la inversa de la matriz de coeficientes y los nuevos valores de los coeficientes del polinomio. INVERSA X
NUEVOS COEFICIENTES a0
2,7682E+01
1,284571723 -0,49127107 0,050309598 -0,001504988
a1
1,1451E-01
-0,49127107 0,228694415 -0,025534536 0,000802009
a2
-4,7449E-02
0,050309598 -0,025534536 0,003005508 -9,77265E-05
a3
9,9634E-04
X0
X²
X³
-0,001504988 0,000802009 -9,77265E-05 3,25755E-06
6. Luego el polinomio que se ajusta a los datos es:
P ( x ) = 2, 7682 E + 01 + 1,1451E − 01x − 4, 7449 E − 02 x 2 + 9,9634 E − 04 x3
Fundación Universitaria Konrad Lorenz, Villalobos Paula. Proyección Tasa natalidad
7. Tomamos los datos originales y los evaluamos en el polinomio hallado: x
y
1
2,7750E+01
2
2,7729E+01
3
2,7625E+01
4
2,7444E+01
5
2,7193E+01
6
2,6876E+01
7
2,6500E+01
8
2,6071E+01
9
2,5595E+01
10 2,5078E+01 11 2,4526E+01 12 2,3945E+01 13 2,3341E+01 14 2,2719E+01 15 2,2086E+01 16 2,1448E+01
Gráfico 2. Ajuste del polinomio a los puntos
17 2,0811E+01 18 2,0180E+01 19 1,9562E+01
Luego el polinomio se ajusta a los puntos. 8. Resolviendo nuestra estimación de la tasa de natalidad del 2012, evaluamos este dato en el polinomio, obteniendo lo siguiente: Proyección de la tasa de natalidad a 2012
x=año-1989 x= 23 x y 23 1,7338E+01
Fundación Universitaria Konrad Lorenz, Villalobos Paula. Proyección Tasa natalidad
Gráfico 3. Proyección de la tasa de natalidad para el año 2012.
Con esta proyección podemos analizar que la tasa de natalidad colombiana para el año 2012 sería aproximadamente más baja que la tasa de natalidad de años anteriores por tanto esta iría en descenso favoreciendo en cierto modo la economía. 9. Coeficiente de determinación: con este coeficiente evaluamos la eficacia del método: Σx =
-274,72
Σx² =
-5732,6
Σx³ =
-104036,08
SCR=
136,8925967
SCT=
137,8248526
r² =
0,993235937
Lo cual significa que el 99,32% de la variabilidad total explicada por el método.
Fundación Universitaria Konrad Lorenz, Villalobos Paula. Proyección Tasa natalidad
REFERENCIAS
1
http://www.sigob.gov.co/est/indicador.aspx?id=132
2
http://eio.usc.es/eipc1/BASE/BASEMASTER/FORMULARIOS-PHP-DPTO/MATERIALES/311121873.pdf
3
http://www.ingenieria.uady.mx/weblioteca/CompApp/aproximacion/poli/Regresionpolinomial.htm
4
http://dm.udc.es/asignaturas/estadistica2/sec10_3.html
5
http://costaricalinda.com/Estadistica/Polino.htm
6
S. C. Chapra, R.P. Canale “ Métodos numéricos para ingenieros” McGraw-Hill 1994
7
Http://www.virtual.unal.edu.co/cursos/ciencias/2007315/lecciones_html/capitulo_6/leccion1/Rcuadrado.html
8
http://www.dane.gov.co/index.php?option=com_content&task=category§ionid=16&id=36&Itemid=148