Apuntes De A 181006

  • November 2019
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Apuntes De A 181006 as PDF for free.

More details

  • Words: 26,009
  • Pages: 132
Autor: Profesor Víctor Sierra C

Octubre 2006

1

ESTADISTICA E INVESTIGACION Según Peirce C, citado por Pagano R, la humanidad ha utilizado cuatro métodos para adquirir el conocimiento: La autoridad, el racionalismo, la intuición y el método científico. Método de la Autoridad: Según el método de la autoridad, algo se considera verdadero debido a la tradición o a que alguna persona dice que lo es. Por ejemplo, durante mucho tiempo se creyó que la tierra era el centro del universo y el sol rotaba alrededor de ella, hasta que, en el año 1632, Galileo Galilei (1564-1642), publicó un libro, basado en sus observaciones, donde demostraba lo contrario. Racionalismo: Según este método, si las premisas son válidas, entonces se obtendrán conclusiones que serán verdaderas. Ej: Las personas que ejercen determinada profesión son honestas, el señor X ejerce esa profesión, por lo tanto el señor X es una persona honesta. Intuición o Tenacidad: El conocimiento llega por una inspiración repentina, como una idea súbita que aclara o resuelve los problemas. Existen ejemplos de personas que abandonan temporalmente la solución de un problema, aparentemente muy difícil de resolver y se les presenta de improviso una idea que permite llegar a una conclusión valedera sobre dicho problema. Método Científico: El método científico establece que a través de la observación de la realidad y la experimentación se llegará a la obtención de la verdad. Las creencias o intuiciones, deben estar basadas en observaciones, mediciones o experimentación. El método científico puede utilizar los otros métodos de adquirir conocimiento para llegar a la verdad, pero se fundamenta en la observación metódica (por eso se denomina objetivo o empírico). Ej: El investigador puede, utilizando la razón o la intuición, formular una hipótesis sobre una realidad particular; posteriormente se procede a

2

observar o experimentar con esa realidad y los datos obtenidos se analizan (utilizando métodos estadísticos) y la hipótesis se acepta o se rechaza. Ciencia: Etimológicamente la palabra ciencia se origina del latín scientia, que significa saber o conocer. Una sencilla definición de ciencia sería la siguiente: Ciencia es el proceso sistemático de adquisición de nuevos conocimientos sobre un sistema. La adquisición sistemática tiene que ver con el método científico y el sistema generalmente es la naturaleza. Investigación Científica o método Científico: Es una forma sistemática, controlada, empírica y crítica de verificación de hipótesis, acerca de supuestas relaciones entre fenómenos. La investigación científica puede cumplir dos propósitos fundamentales: a)Producir conocimiento y teorías (investigación básica) y b)Resolver problemas prácticos (investigación aplicada). La ciencia se basa en acontecimientos que pueden ser observados y probados de forma pública. Las explicaciones que no pueden ser probadas empíricamente (objetivamente), no son científicas y se denominan metafísicas. Etapas o pasos del proceso de investigación científica (según Sampieri et Al) : 1)Concebir el problema de investigación. 2)Plantear el problema de investigación. 3)Elaborar el marco teórico. 4)Establecer las hipótesis. 5)Seleccionar el diseño de investigación. 6)Seleccionar la muestra. 7)Recolectar los datos. 8)Analizar los datos. 9)Presentar los resultados. Los métodos estadísticos tienen aplicación en los pasos del 4 al 9.

3

ESTADISTICA: Ciencia relacionada con los métodos utilizados en la recopilación, organización, resumen, análisis e interpretación de datos.

METODO

O

RAMA DE LA ESTADISTICA

Recolección de datos

Teoría del muestreo.

Resumen y presentación de datos

Estadística descriptiva.

Análisis e interpretación de datos

Inferencia estadística.

Población: Conjunto finito o infinito de elementos que presentan características comunes. Ej: Habitantes de un país, estudiantes de una universidad. Muestra: Parte o subconjunto representativo de una población. La muestra debe ser representativa de la población, esto quiere decir que cualquier elemento de la población en estudio debe tener la misma probabilidad de ser elegido. Entre las razones para trabajar con muestras, se pueden enumerar: -Ahorrar tiempo: trabajar con menos individuos evidentemente lleva menos tiempo. -Como consecuencia del punto anterior disminuyen los costos. -Estudiar la totalidad de los elementos que poseen una característica determinada, en muchas ocasiones puede ser una tarea difícil o imposible de realizar. -Aumentar la calidad del estudio: Al disponer de más tiempo y recursos, las observaciones y mediciones realizadas a un reducido número de individuos pueden ser más exactas, que si se tuviesen que realizar en todos los elementos de la población. Elementos: personas, animales u objetos presentes en una población. Dato: Producto de una observación efectuada en personas u objetos (elementos), en los cuales se produce el fenómeno de interés para el investigador. Caracteres: Propiedades, rasgos o cualidades que poseen los elementos de una población. Se dividen en dos clases:

4

Atributos o variables cualitativas: representan cualidades de los elementos que constituyen a la población o a la muestra. Ej: Color de ojos, tipo de empresa, estado civil, presencia o no de una enfermedad. Variables: Caracteres que pueden ser representados mediante números. Variables discretas: Aquellas en las que entre dos valores consecutivos no pueden existir otros valores intermedios. Ej: Número de empleados, Número de pacientes enfermos, Cantidad de empresas agrícolas. Variables continuas: Aquellas que pueden tomar muchos (infinitos) valores intermedios, entre dos valores consecutivos. Ej: Edad, peso, estatura, tiempo que se demora un cliente en realizar un reclamo, dosis de un medicamento. Formas de observar una población: 1. De acuerdo a la fuente: 1.1 Observación directa. 1.2 Observación indirecta. 2. De acuerdo a su periodicidad: 2.1 Continua: Se efectúa en forma permanente, ej: Contabilidad de una empresa. 2.2 Periódica: Aquella que se lleva a cabo a través de períodos constantes Ej: Inventarios anuales, evaluaciones mensuales. 2.3 Circunstancial: Se efectúa en forma ocasional o esporádica. Ej: Alumnos inscritos en cursos de verano. 3. De acuerdo a su cobertura: 3.1 Exhaustiva: Cuando la observación se hace sobre todos los elementos de la población. 3.2 Parcial: Cuando se realiza sobre una parte de la población.

3.3Mixta: Cuando se combinan la observación de tipo parcial con la exhaustiva. Medición: Asignación de números

a elementos u objetos para representar o

cuantificar una cualidad. Niveles o escalas de medición: a)Nominal: Asignación de manera arbitraria de números a cada una de las categorías en que se divide el carácter observado. Las categorías son mutuamente excluyentes y no existe relación entre ellas. Las variables binarias, dicotómicas o binomiales tienen dos categorías Ej. Presencia o no de una enfermedad, sexo, etc. Si hay más de dos categorías entonces se denomina a la variable policotómica, politoma o multinomial. Ej. Estado civil, lugar de procedencia. 5

b)Ordinal: Las diferentes categorías del carácter observado están relacionadas por existir entre ellas un orden determinado. Ej. Orden de llegada al salón. c)Intervalo: Además de las características de la escala ordinal, esta escala de medición posee una unidad de medida que permite asignar números de tal manera que diferencias entre los números asignados representan diferencias idénticas del carácter que se mide. El punto cero de esta escala es arbitrario y no refleja ausencia de la magnitud que se mide. Ej: Temperatura, calendario. d)Cociente o razón: Se caracteriza por poseer un punto cero propio, en otras palabras, el valor cero significa ausencia de la magnitud que se mide. Ej: Peso, distancia, tiempo de duración de un artículo.

RESUMEN ESCALAS DE MEDICION:

ESCALA

CARACTERÍSTICAS

Nominal

Categorías mutuamente excluyentes

Ordinal

Categorías mutuamente excluyentes Categorías con orden lógico

Intervalo

Categorías mutuamente excluyentes Categorías con orden lógico Diferencias iguales en la característica implican diferencias iguales en el valor Cero arbitrario

Razón

Categorías mutuamente excluyentes Categorías con orden lógico Diferencias iguales en la característica implican diferencias iguales en el valor Cero absoluto existe

6

Razones, proporciones, porcentajes.

Razón: Cociente de dos cantidades cualesquiera, cuyo valor indica la relación cuantitativa existente entre dichas cantidades Ej: Una escuela tiene 2800 estudiantes varones y 1200 hembras, la razón de varones a hembras es

2800 7 = o 7:3, por cada 7 1200 3

alumnos varones hay 3 alumnos hembras.

Proporciones: Cociente que indica la relación entre la parte de un total y el total. Ninguna proporción puede ser mayor que uno, ni menor que cero, Ej: Continuando con el ejemplo anterior, Total = hembras + varones, Total = 2800 + 1200 = 4000. Pv = 2800 / 4000 = 0,7 ; Ph = 1200 / 4000 = 0,3. Pv + Ph = 1. La suma de todas las proporciones, referidas a un mismo total es igual a 1.

Porcentajes: Proporciones multiplicadas por cien. Ej: % de varones = 0,7 x 100 = 70%. Precaución: La comparación entre porcentajes debe hacerse sobre el mismo total obase.

Porcentajes de cambio: Diferencia entre dos cantidades expresada en forma porcentual.

% de Aumento = (Cantidad mayor – Cantidad menor) / Cantidad menor X 100. % de Disminución = (Cantidad mayor – Cantidad menor) / Cantidad mayor X 100. Ej: AÑOS

MATRICULA ED. INTEGRAL

1998

15800

1999

16700

2000

14100

2001

16500

2002

18200

2003

20300

7

% de aumento entre 1998 y 1999 = % =

16700 − 15800 X 100 = 5.7% . 15800

% de disminución entre 2000 y 1999 = % = ESTADO

16700 − 14100 X 100 = 15.57% . 16700

MATRICULA

%

Guárico

200300

15%

Anzoátegui

420000

31%

Monagas

530100

40%

Sucre

185200

14%

Total

1335600

100%

Razón entre Guárico y Anzoátegui = 420000 / 200300 = 2,1; Razón 2,1 : 1.

8

DISTRIBUCIONES DE FRECUENCIA: Agrupamiento, en clases, de los datos que se repiten, al ser observada una variable.

Metodología de construcción: a) Se ordenan los datos de menor a mayor. b) Se calcula la amplitud de variación, AV = Valor mayor – valor menor. c) Se calcula el número de clases o grupos: Fórmula de Sturgess : C=1 + 3.322 X logn, donde n = Número de datos. La siguiente tabla también sirve como guía, con el propósito de determinar cuántas clases usar a la hora de elaborar una tabla de distribución de frecuencias:

Número de datos

Número de clases

Menos de 50

5-7

50 – 100

6 - 10

100 - 250

7 – 12

Más de 250

10 - 20

d) Se calcula el intervalo de clase: IC = AV / Nº de Clases. e) Se construye la tabla.

Ej: 3.7 4.0 3.6 3.1 3.3 4.7 3.5 3.5 3.3 3.8 2.9 2.2 2.4 2.8 2.6 5.0 3.6 4.3 2.5 3.9 3.4 3.0 1.1 2.1 4.3 3.5 2.6 4.0 2.3 2.7

a)Ordenamiento de menor a mayor: 1,1 2,1 2,2 2,3 2,4 2,5 2,6 2,6 2,7 2,8 2,9 3,0 3,1 3,3 3,3 3,4 3,5 3,5 3,5 3,6 3,6 3,7 3,8 3,9 4,0 4,0 4,3 4,3 4,7 5,0

Cuando los datos tienen cifras decimales algunos autores recomiendan transformarlos en cantidades enteras, para lograr más facilidad de cálculo. En el caso del ejemplo, los datos tienen una sola cifra decimal y se procede a multiplicar cada uno por diez (10), para transformarlos en enteros. Si tuvieran dos cifras decimales se multiplicaría cada uno por cien y así sucesivamente.

9

Datos transformados en enteros: 11 21 22 23 24 25 26 26 27 28 29 30 31 33 33 34 35 35 35 36 36 37 38 39 40 40 43 43 47 50.

b) Amplitud de variación o rango: 50 – 11 = 39.

c)Cálculo del número de clases: C = 1 + 3,322 . (log n) = 1 + 3,322 . (1,477121255) C = 5,91 ≈ 6 clases.

( ≈ aproximadamente igual a).

d)Intervalo de clase: IC =

39 = 6,5 ≈ 7 6

e)Construcción de la tabla de distribución de frecuencias: El límite inferior de la primera clase puede ser el menor valor de la serie de datos, en este caso once (11), para obtener el límite superior de la primera clase se le suman siete unidades al valor del límite inferior de la primera clase, pero comenzando a contar a partir de once, al realizar esto obtenemos el límite superior de la primera clase, que es igual a 17, con el propósito de obtener el límite inferior de la segunda clase, agregamos una unidad al límite superior de la primera clase (17 + 1 = 18). De esta manera se procede hasta obtener un límite superior de clase igual o un poco mayor que el valor más alto de la serie de datos. Tabla básica de distribución de frecuencias: CLASES

Límites Inferiores de clase

Frecuencia absoluta

11 – 17 (Primera clase)

1

18 – 24

4

25 – 31

8

32 – 38

10

39 – 45

5

46 – 52 (Sexta clase)

2

Límites Superiores de clase

10

Las frecuencias absolutas de cada clase se obtienen contando el número de datos cuyo valor está comprendido entre el límite inferior y el límite superior de cada clase, por ejemplo en la primera clase existe un dato cuyo valor está comprendido entre 11 y 17 (ese dato es 11), en la tercera clase hay 8 datos cuyo valor está comprendido entre 25 y 31 (25, 26, 26, 27, 28, 29, 30 y 31). Hay que tener presente que los datos originales estaban expresados en cantidades decimales y solamente se transformaron en enteros con la finalidad de hacer más fácil el cálculo de la tabla de distribución de frecuencias. Es necesario presentar los datos, a través de la tabla de distribución de frecuencias, en sus magnitudes originales, para ello dividimos los valores de cada límite inferior y superior de clase entre 10, al realizar esta operación, la tabla de distribución de frecuencias queda presentada de la siguiente forma. CLASES

Frecuencia absoluta

1,1 – 1,7 (Primera clase)

1

1,8 – 2,4

4

2,5 – 3,1

8

3,2 – 3,8

10

3,9 – 4,5

5

4,6 – 5,2 (Sexta clase)

2

n

Sumatoria = ∑ ni = 30 i =1

La sumatoria de las frecuencias absolutas de clase debe ser igual al número de datos, en este caso 30. Distribución de frecuencias relativa: Las frecuencias relativas se originan al dividir cada frecuencia absoluta (fi), correspondiente a las distintas clases, entre el número total de datos. Distribución de frecuencias relativa porcentual: Si cada frecuencia relativa, se multiplica por cien (100), se obtiene la frecuencia relativa porcentual.

11

CLASES

Frecuencia

Frecuencia relativa

Frecuencia relativa Porcentual

absoluta (fi) 1,1 – 1,7

1

1/30 = 0,0333

0,333X100 =3,333

1,8 – 2,4

4

4/30 = 0,1333

0,1333X100 = 13,333

2,5 – 3,1

8

8/30 = 0,2666

0,2666X100 = 26,666

3,2 – 3,8

10

10/30 = 0.3333

0,3333X100 = 33,333

3,9 – 4,5

5

5/30 = 0,1666

0,1666X100 = 16,66

4,6 – 5,2

2

2/30 = 0,0666

0,066X100 = 6,666

Totales:

30

1,00

100,00

Distribuciones acumuladas: A menudo interesa conocer el número de observaciones que se encuentran por encima o por debajo de determinado valor. Frecuencia acumulada “menor que”: Para la obtención de la frecuencia acumulada menor que (se abreviará famq), se determinan cuántas observaciones existen cuyo valor es inferior o menor que, cada uno de los límites superiores de clase. Ej. ¿Cuántas observaciones tienen un valor menor que 1,7 , en la tabla de distribución de frecuencias anterior?. Respuesta: 1 observación. ¿Cuántas observaciones tienen un valor menor que 2,4?. Respuesta: 1 observación en la primera clase más cuatro observaciones en la segunda clase = 5 observaciones. Continuando con este procedimiento, se obtiene la distribución de frecuencias “menor que”. CLASES

Frecuencia absoluta (fi)

Frecuencia acumulada menor que, (famq)

1,1 – 1,7

1

1

1,8 – 2,4

4

5

2,5 – 3,1

8

13

3,2 – 3,8

10

23

3,9 – 4,5

5

28

4,6 – 5,2

2

30

Frecuencia acumulada “mayor que”: Para la obtención de la frecuencia acumulada mayor que (se abreviará FAMQ), se determinan cuántas observaciones existen cuyo

12

valor es superior o mayor que, cada uno de los límites inferiores de clase. Ej. ¿Cuántas observaciones tienen un valor mayor que 1,1 , en la tabla de distribución de frecuencias anterior?. Respuesta: 30 observaciones. ¿Cuántas observaciones tienen un valor mayor que 1,8?. Respuesta: 29 observaciones. Continuando con este procedimiento, se obtiene la distribución de frecuencias “mayor que”. CLASES

Frecuencia absoluta (fi)

Frecuencia acumulada mayor que, (FAMQ)

1,1 – 1,7

1

30

1,8 – 2,4

4

29

2,5 – 3,1

8

25

3,2 – 3,8

10

17

3,9 – 4,5

5

7

4,6 – 5,2

2

2

13

REPRESENTACION GRAFICA: DIAGRAMA DE BARRAS: Cuando se trabaja con variables cualitativas (atributos) o variables numéricas discretas (número de empleados, número de individuos que presentan determinada enfermedad), los datos pueden ser representados a través de un diagrama de barras, Ej. Regiones de Procedencia de estudiantes de la Universidad, año 2005 Número de estudiantes

250 200 150 100 50 0 Oriente

Centro

Occidente

Regiones

HISTOGRAMA: Representación gráfica de una tabla de distribución de frecuencias, cuando la variable que se estudia es continua (edad, tensión arterial, peso, talla, tiempo estimado de cancelación de un crédito). Es básicamente un gráfico de barras, pero con la peculiaridad que a una frecuencia cualquiera no le corresponde un solo valor de la variable, sino todo un intervalo. El procedimiento para construir un histograma consiste en señalar sobre el eje X, los intervalos de la variable (en nuestro caso los intervalos serán todos iguales) y sobre ellos levantar rectángulos cuya altura sea igual a sus frecuencias absolutas. Nota: A fin de construir el histograma, las barras deben estar juntas, esto se logra restando 0,5 a los límites inferiores de cada clase y sumando 0,5 a los límites superiores de clase, ambos expresados como enteros. Ej.

Se tomará como ejemplo la tabla de distribución de frecuencias, con la cuál se venía trabajando. A fin que las barras del histograma estén adyacentes una de otra, no deberían existir espacios entre el límite superior de una clase y el límite inferior de la siguiente, esto se logra multiplicando lo límites inferiores y superiores de clase por 10 (para transformarlos en cantidades enteras) y posteriormente restando 0,5 a cada límite inferior de clase y sumando 0,5 a cada límite superior de clase.

14

Clases originales

Clases enteras (cada límite Clases contiguas (Límites inferiores – 0,5 multiplicado por 10)

y límites superiores + 0,5)

1,1 – 1,7

11 – 17

10,5 – 17,5

1,8 – 2,4

18 – 24

17,5 – 24,5

2,5 – 3,1

25 – 31

24,5 – 31,5

3,2 – 3,8

32 – 3,8

31,5 – 38,5

3,9 – 4,5

39 – 45

38,5 – 45,5

4,6 – 5,2

46 – 52

45,5 – 52,5

Finalmente los límites de clase se vuelven a dividir entre 10, para que la tabla de distribución de frecuencias, refleje la verdadera magnitud de los datos originales. Clases

1,05 – 1,75 1,75 – 2,45 2,45 – 3,15 3,15 – 3,85 3,85 – 4,55 4,55 – 5,25

Obsérvese que los límites superiores de cada clase coinciden con los inferiores de la siguiente clase.

Histograma

Frecuencias absolutas

12 10 8 6 4 2 0 1,05-1,75

1,75-2,45

2,45-3,15

3,15-3,85

3,85-4,55

4,55-5,25

Clases

15

Polígono de frecuencia: Partiendo de un histograma se puede elaborar un polígono de frecuencias con sólo unir los puntos medios de la parte superior de cada rectángulo, con segmentos de rectas. Los polígonos deben ser cerrados, en otras palabras, deben intersectar el eje de las X o abcisas, para ello se acostumbra agregar una clase imaginaria a cada extremo de la distribución y cerrar el polígono en los puntos medios de dichas clases.

Ojivas: Representaciones gráficas consistentes en líneas que pueden ser ascendentes o descendentes, utilizadas para representar las frecuencias acumuladas “mayor que” y “menor que” . Ojiva “menor que”: Para construir la ojiva menor que, se comienza colocando sobre el eje de las X, el límite inferior de la primera clase. Dicho límite es 1,05 (se sigue con el mismo ejemplo), como el número de datos menores que este valor es cero, el valor correspondiente al eje de las ordenadas (eje Y), será cero, posteriormente se añade el límite superior de la primera clase (1,75), el número de datos menores que 1,75 es de 1, por lo tanto el valor de la ordenada correspondiente a una abcisa de 1,75 será de 1. a distancias iguales sobre el eje X (abcisas), se van colocando los demás valores de los límites superiores de clase, con sus correspondientes valores de frecuencia acumulada.

16

CLASES

Frecuencia acumulada menor que, (famq)

1,05 – 1,75

1

1,75 – 2,45

5

2,45 – 3,15

13

3,15 – 3,85

23

3,85 – 4,55

28

4,55 – 5,25

30

Ojiva menor que

Número de datos

35 30 25 20 15 10 5 0 1,05

1,75

2,45

3,15

3,85

4,55

5,25

Límites superiores de clase

La ojiva también puede construirse, tomando los valores acumulados porcentuales: CLASES

Frecuencia acumulada menor

Frecuencia acumulada menor

que, (famq)

que porcentual, (famq %)

1,05 – 1,75

1

1 / 30 X 100 = 3,33%

1,75 – 2,45

5

5 / 30 X 100 = 16,66%

2,45 – 3,15

13

13 / 30 X 100 = 43,33%

3,15 – 3,85

23

23 / 30 X 100 = 76,66%

3,85 – 4,55

28

28 / 30 X 100 = 93,33%

4,55 – 5,25

30

30 / 30 X 100=100,00%

17

Ojiva menor que porcentual

Porcentaje de datos

120 100 80 60 40 20 0 1,05

1,75

2,45

3,15

3,85

4,55

5,25

Límites superiores de clase

Obsérvese que si trazamos una línea horizontal por el punto 50 del eje de las ordenadas de la ojiva menor que porcentual, hasta que dicha línea intersecte la ojiva y luego se traza una línea vertical por dicho punto, hasta intersectar el eje de las X, este último punto representa la mediana del conjunto de datos estudiadas. De una forma similar se construye la ojiva “mayor que”:

18

CLASES

Frecuencia acumulada mayor que,

Frecuencia acumulada maynor

(FAMQ)

que porcentual, (famq %)

1,05 – 1,75

30

100%

1,75 – 2,45

29

96,66%

2,45 – 3,15

25

83,33%

3,15 – 3,85

17

56,66%

3,85 – 4,55

7

23,33%

4,55 – 5,25

2

6,66%

Porcentaje de datos

Ojiva mayor que porcentual 120 100 80 60 40 20 0 1,05

1,75

2,45

3,15

3,85

4,55

5,25

Límites inferiores de clase

19

NOTACIÓN SUBÍNDICE Y SUMATORIA

Notación subíndice: Xi= Valor de la variable X, ubicado en la i-ésima posición. Ej: dado el siguiente conjunto de valores pertenecientes a la variable X, 9,8,7,2,1,0; entonces X1= 9; X2= 8; X3=7. Xn= Dato ubicado en la última posición, En el caso de los datos mostrados anteriormente Xn= X6 = 0. Notación Sumatoria: Si se tiene para una variable X, los valores: X1, X2, X3, ............Xn; la suma de los cinco primeros valores puede expresarse: n

∑X i =1

i

= X1 + X 2 + X 3 + X 4 + X 5 ;

se lee: La suma total de los n

valores que toma Xi, cuando i va desde 1 hasta 5. El símbolo

∑ i=m

es en griego la letra

sigma. La letra i, se denomina índice de suma y toma todos los valores integrados entre m y n. Propiedades de la sumatoria: 1)Sea K una constante cualquiera: La sumatoria de la constante K desde i=1 hasta n es igual al producto de n por K. n

∑ K = n.K ; Ej: i =1

5

∑ 3 = 5.3 = 15 . i =1

Cada suma conlleva la adición de n-m+1 términos. 9

Ej:

∑ 5 = 5(9 − 3 + 1) = 5(7) = 35. i =3

2)La sumatoria de los n primeros términos de una variable puede ser dividida en subtotales sin que el resultado se altere. n

k

i =1

i =1

∑ Xi = ∑ Xi +

n

∑X

i = k +1

i

; E: Si X toma valores: 3,4,5,6 y 7.

20

5

3

5

i =1

i =1

i=4

∑ X i = ∑ X i + ∑ X i = (3 + 4 + 5) + (6 + 7) = (12) + (13) = 25. 3)Si cada valor de la variable se multiplica por una constante K y luego se suma, la sumatoria de los productos es igual al producto de la constante por la sumatoria de los valores de la variable. n

∑ KX i =1

n

i

= K ∑ X i. i =1

Ej: Si X toma los valores 0,1,3,5,7. 5

∑ 2X i =1

i

= 2(0) + 2(1) + 2(3) + 2(5) + 2(7) = 0 + 2 + 6 + 10 + 14 = 32

4)La sumatoria de una suma de variables es igual a la suma de las sumatorias de cada variable. n

∑ (U i =1

i

n

n

n

i =1

i =1

i =1

+ Vi + X i ) = ∑ U i + ∑ V i + ∑ X i

Ej: Si X toma los valores 0,1,3,5,7 y U toma los valores 2,4,6,8,10. 5

5

5

i =1

i =1

i =1

∑ ( X i + U i ) = ∑ X i + ∑ U i = (0 + 1 + 3 + 5 + 7) + (2 + 4 + 6 + 8 + 10) = 46  n  X y ∑ X  ∑ i =1  i =1  n

5)Las expresiones n

∑X i =1

2 i

2

2 i

, no son equivalentes, dado que:

= X 12 + X 22 + ....... + X n2 2

 n  2  ∑ X  = (X 1 + X 2 + ........ + X n )  i =1  Ej; Evalúe las siguientes sumas: a)Si i toma los valores 3,4,5,6 y 7 2

7

∑i

2

= 3 +4 +5 +6 +7 =135; 2

2

2

2

2

i =3

b)Si

i

1

1

i = −3

i = −3

toma

 7   ∑ i  = (3+4+5+6+7)2 = (25)2 = 625  i =3  los

valores:

-3,-2,-1,0,1

evalúe

∑ 2i = 2 ∑ i = 2[− 3 + (−2) + (−1) + 0 + 1] = −10 21

c)Si i toma los valores 0,1,2. Evalúe 2

∑ (−1)

i

= (−1) 2 + ( −1) 2 + (−1) 2 = 1 − 1 + 1 = 1

i =0

d) Escriba 6+9+12+15+.......+30, usando la notación sumatoria. Solución: Cáda término de la suma es múltiplo de 3, esto es, cada término es 3i, para cada entero i. El primer término es 3(2) y el último es 3(10). Por tanto la suma está representada por: 10

∑ 3i i=2

Ejercicios propuestos: 15

30

17

15

i =1

i =1

i =1

i =3

a) ∑ 2i = b) ∑ (i + 30) = c) ∑ (4 − 3i ) = d) ∑ 2i = Soluciones: a)240; b)555; c)-391; d)234.

22

MEDIDAS DE TENDENCIA CENTRAL O PROMEDIOS Son valores o números que reflejan la tendencia de los datos individuales de una serie.

Computables o matemáticos

Media aritmética Media geométrica Media armónica

PROMEDIOS Mediana

De posición

Moda

Media aritmética: Cociente que resulta de dividir la suma de todos los valores que toma la variable, entre el número total de valores. Notación: Media aritmética poblacional: Media aritmética muestral:

µ (mú).

X n

n

Cálculo de la media aritmética: Para datos no agrupados: µ =

∑X i =1

N

i

; X =

∑X i =1

i

n

La media aritmética poblacional es un parámetro, debido a que se obtiene o calcula utilizando todos los datos de una población, para una característica en particular. Los parámetros son usualmente denotados por letras griegas y constituyen constantes que caracterizan una distribución de probabilidad. La media aritmética obtenida de los valores de una muestra, se denomina estadístico. Los estadísticos se denotan generalmente por letras latinas. Propiedades de la media aritmética: Se demostrarán de forma intuitiva. 1)La suma algebraica de las desviaciones de los diversos valores con respecto a la media aritmética es cero. Ej. Sean los valores 1,2,5,6,10 y 12. X =

36 = 6. 6

23

Xi

Xi- X

1

1-6= -5

2

2-6= -4

5

5-6= -1

6

6-6= 0

10

10-6= 4

12

12-6= 6 n

∑X i =1

i

− X =0

2)La media aritmética de una constante es igual a la constante. Ej. 5,5,5,5

X =

5+5+5+5 =5 4

3)La media aritmética del producto o del cociente entre una variable y una constante, es igual al producto de la constante por la media aritmética de la variable o al cociente de la media aritmética entre la constante. Ej. Se tomará como constante el valor 5 y los datos utilizados para comprobar la primera propiedad. 1X5=5 2X5=10 5X5=25 6X5=30 10X5=50 12X5=60 SUMATORIA = 180

X =

180 = 30 ; X original X constante = 6 X 5 = 30. 6

Utilice los valores anteriores para demostrar que el cociente entre una variable y una constante es igual al cociente de la media aritmética entre la constante.

4) La media aritmética de la suma algebraica de una constante más una variable es igual a la media aritmética de la variable más la constante. Ej.

24

1+5=6 2+5=7 5+5=10 6+5=11 10+5=15 12+5=17 Sumatoria = 66 X =

66 = 11 ; X original + constante = 6 + 5 = 11. 6

5)Si se tienen K muestras , cada una de las cuáles tiene un tamaño ni y con medias aritméticas X i , la media de medias (X ) , es igual a la sumatoria de los productos ni . X i , n

dividida entre la sumatoria de los tamaños de muestra:

X =

∑ X .n i

i =1

i

n

∑n

i

i 01

Ej. El resultado de la cosecha de pastos, correspondiente a una región que está dividida en tres zonas fue: Zona

Superficie (ha)

Producción (t/ha)

1

1000

100

2

3000

80

3

4000

70

La producción media de la región será: X =

1000(100) + 3000(80) + 4000(70) 620000 = = 77,5t / ha 1000 + 3000 + 4000 8000

La media de medias también se llama media ponderada, por que a la media aritmética de cada muestra debe dársele un peso (ponderación), o importancia, de acuerdo con el tamaño de la muestra.

Cálculo de la media aritmética para datos agrupados: n

µ=

∑ X .f i

i =1

N

i

Media aritmética poblacional.

25

n

X =

∑X .f i

i =1

n

i

Media aritmética muestral.

Donde fi = Frecuencia absoluta de clase; Xi= Centro de clase =

Li + Ls ; 2

donde Li= Límite inferior de clase y Ls = Límite superior de clase.

CLASES

Frecuencia absoluta (fi) Centro de clase (Xi)

fi . Xi

1,1 - 1,7

1

(1,1 + 1,7) / 2 = 1,4

1 . 1,4 = 1,4

1,8 – 2,4

4

2,1

8,4

2,5 – 3,1

8

2,8

22,4

3,2 – 3,8

10

3,5

35,0

3,9 – 4,5

5

4,2

21,0

4,6 – 5,2

2

4,9

9,8

Totales

30

98

n

Media aritmética = X =

∑X .f i

i =1

n

i

=

98 = 3,267 30

Interpretación de la media aritmética: La media aritmética permite, mediante un solo valor representar un conjunto de datos. Lo cuál permite comparar ese conjunto de datos con otros conjuntos.

MEDIANA: Valor que ocupa el medio de una serie ordenada según su magnitud. La posición de la mediana divide a la serie en dos partes iguales, de tal forma que la mitad de los datos son menores o iguales a ella y la otra mitad mayores o iguales. Cálculo de la mediana: a)Datos no agrupados a1)Número impar de términos: Ej. 8,10,7,5,6 Primero se ordenan los términos: 5,6,7,8,10. La mediana está en la posición 3 y su valor es 7. Utilizando la siguiente expresión, se calcula la posición de la mediana n +1 5 +1 6 = = =3 2 2 2

26

A2)Número par de términos: Ej. 8,10,7,5,6,12. Se ordenan los datos: 5,6,7,8,10,12, se escogen los dos términos centrales, se suman y el resultado se divide entre dos. 7 + 8 15 = = 7,5 = Valor de la mediana. 2 2 Expresiones utilizadas para determinar las posiciones de los términos centrales: n n 6 6 y +1 ⇒ = 3 y +1 = 4 2 2 2 2

b)Datos agrupados:

N   − faacm  .IC Mediana = Me = Li +  2 fcm       Donde: Li= Límite inferior de la clase mediana. N= Número total de datos. Faacm= Frecuencia acumulada anterior a la clase mediana. Fcm= Frecuencia absoluta de la clase mediana. IC= Intervalo de clase. Ejemplo: CLASES

Frecuencia absoluta (fi)

Frecuencia acumulada menor que

1,1 - 1,7

1

1

1,8 – 2,4

4

5

2,5 – 3,1

8

13

3,2 – 3,8

10 (clase que contiene a la mediana) 23

3,9 – 4,5

5

28

4,6 – 5,2

2

30

Total =

30

N 30 = = 15 ; Clase mediana = 3,2 – 3,8 2 2

27

 15 − 13  2 Me = 3,2 +  .0,7 = 3,2 +  .0,7 = 3,2 + (0,2).0,7 = 3,34  10   10  MODA: Valor de la variable que se presenta con mayor frecuencia, valor más común, Ej. Datos no agrupados: 6,2,3,5,3,2,3. Se ordenan de menor a mayor: 2,2,3,3,3,5,6 Moda = 3 Otro ejemplo: 2,2,2,3,3,3,5,6 Serie bimodal = Dos modas 2 y 3. Datos agrupados:

CLASES

Frecuencia absoluta

1,1 – 1,7

1

1,8 – 2,4

4

2,5 – 3,1

8

3,2 – 3,8

(clase modal)

10

3,9 – 4,5

5

4,6 – 5,2

2

La clase modal es aquella que tiene una frecuencia absoluta mayor.  ∆1  .IC ; Donde: Mo = Li +   ∆1 + ∆ 2 

Mo = Moda Li = Límite inferior de la clase modal.

∆1 = Frecuencia de la clase modal menos frecuencia de la clase anterior. ∆ 2 = Frecuencia de la clase modal menos frecuencia de la clase siguiente. I.C = Intervalo de clase.   10 − 8  2  2 .0,7 = 3,2 +  Mo = 3,2 +  .0,7 = 3,2 +  .0,7 = 3,2 + 0,2 = 3,4  2+ 5 7  (10 − 8) + (10 − 5)  Mo = 3,4.

28

Comparación entre media aritmética, mediana y moda: La media aritmética, en su carácter de un solo número que representa a un conjunto de datos completo, tiene importantes ventajas: a)Al calcular la media aritmética se utilizan todos los datos o valores observados. b)Cada conjunto de datos posee una y solo una media aritmética. c) Es útil para llevar a cabo procedimientos estadísticos como la comparación de medias de varios conjuntos de datos. d)Es la medida de tendencia central más usada. Desventajas: a)Puede verse afectada por valores extremos que no son representativos del resto de los datos. b)No es posible calcular la media aritmética para un conjunto de datos agrupados en una distribución de frecuencias, que tiene clases de extremo abierto, ya sea en el inferior o en el superior de la escala. Ej:

Clases

Frecuencias (fi)

Menos de 1,5 (Clase de extremo

10

abierto) 1,6 –2,0

20

2,1 – 2,5

60

2,6 – 3,0

40

2,6 y más (Clase de extremo abierto)

30

Como se puede observar, no es posible calcular los centros de clase de la primera y última clase, imposibilitando el cálculo de la media aritmética.

Ventajas del uso de la mediana: a)Los valores extremos no afectan a la mediana. b)La mediana puede calcularse a partir de datos agrupados con clases de extremo abierto, a menos que la mediana entre en una clase de extremo abierto.

29

Desventajas: a)Ciertos procedimientos estadísticos que utilizan la mediana son más complejos que aquellos que utilizan la media aritmética. b)Para la determinación de la mediana se deben ordenar los datos antes de llevar a cabo cualquier cálculo. Esto implica consumo de tiempo para cualquier conjunto de datos que contenga un gran número de elementos.

Ventajas del uso de la moda: a)Al igual que la mediana, la moda no se ve mayormente afectada por los valores extremos. b)Se puede utilizar aun cuando una o más clases sean de extremo abierto. Desventajas: a)Muy a menudo, no existe un valor modal debido a que el conjunto de datos no contiene valores que se presenten más de una vez. b)En otras ocasiones, cada valor es la moda, pues cada uno de ellos se presenta el mismo número de veces. c)Otra desventaja consiste en que cuando los datos contienen dos, tres o más modas, resultan difíciles de interpretar y comparar.

30

MEDIDAS DE DISPERSIÓN O VARIABILIDAD

Un grupo de medidas estadísticas de gran importancia para describir un conjunto de datos, son aquellas que tienen que ver con la variación o variabilidad de los mismos. Las medidas de dispersión complementan a las medidas de tendencia central, puesto que indican la variación o dispersión de los datos, con respecto a un valor que se considera representativo de ellos, el cual es obtenido calculando la medida apropiada de tendencia central. Estas medidas de dispersión, determinan la homogeneidad o heterogeneidad de un conjunto de datos, referidos a un valor de tendencia central tomado como referencia. Por ejemplo, el valor promedio de ingreso mensual de una comunidad es de Bs. 200.000, sin embargo, usar este valor promedio como representativo de los ingresos, solo tiene validez si todos los ingresos tuviesen valores relativamente cercanos a de Bs. 200.000, si existieran valores extremadamente bajos o altos (tales como Bs. 10.000 o Bs. 2.000.000), El valor utilizado como medida de tendencia central (Bs. 200.000), no sería representativo de ellos.

Los estudios sobre la variabilidad o dispersión de los fenómenos constituyen el núcleo de la estadística.

Las medidas de dispersión o variabilidad, pueden clasificarse en: Amplitud de variación o Rango

Desviación Típica

ABSOLUTAS Varianza

31

RELATIVAS: Coeficiente de variación.

Amplitud de variación (AV) o rango: Es la diferencia entre el mayor valor del conjunto de datos (VM) y el valor menor (vm). AV = VM – vm. Es fácil de entender y de calcular, pero su utilidad como medida de dispersión es limitada. Sólo toma en cuenta los valores más alto y más bajo de una distribución y no considera ninguna otra observación del conjunto de datos. Ignora la naturaleza de la variación entre todas las demás observaciones, y se ve muy influido por los valores extremos. Varianza: Las descripciones más comprensivas de la dispersión son aquellas que tratan con la desviación promedio con respecto a alguna medida de tendencia central. Dos de tales medidas son la varianza y la desviación estándar. Ambas medidas nos dan una distancia promedio de cualquier observación del conjunto de datos con respecto a la media de la distribución. Varianza para datos no agrupados: a)Datos provenientes de una población: La varianza se denota con la letra griega sigma, elevada al cuadrado

(σ ). 2

La expresión para el cálculo de la varianza

poblacional es: n

σ2 = variable X;

∑ (X i =1

− µ)

2

i

;

N

Donde Xi= Valor de un dato cualquiera contenido en la

µ = Media aritmética de la población; N = Número de elementos de la

población. b)Datos provenientes de una muestra: La varianza, en este caso, se denota con la letra S, elevada al cuadrado. La expresión para el cálculo de la varianza muestral es:

∑ (X n

S2 =

i =1

i

−X

n −1

)

2

; Donde Xi= Valor de un dato cualquiera contenido en la

variable X; X = Media aritmética muestral; n = Número de elementos de la muestra.

32

Se utiliza el divisor (n-1), a fin de obtener un estimador no sesgado (imparcial), de la varianza poblacional

(σ ). 2

Ej. Sean los datos 1,2,2,4,6; suponiendo que provienen de una muestra, calcular la varianza y la desviación típica, de dicho conjunto de datos. Primero se calculará la media aritmética de los datos: X =

1 + 2 + 2 + 4 + 6 15 = =3 5 5

(X

Xi − X

Xi

i

−X

)

2

1

1-3 = -2

(-2)2=4

2

2-3 = -1

(-1)2=1

2

2-3 = -1

(-1)2=1

4

4-3 = 1

(1)2=1

6

6-3 = 3

(3)2=9

Total = 15

Total = 16

∑ (X n

S2 =

i =1

i

−X

)

2

=

n −1

16 16 = =4 5 −1 4

La desviación típica o desviación estándar, es la raíz cuadrada positiva de la Varianza: Recuérdese que la raíz cuadrada de un número puede ser tanto positiva como negativa, pues a2 = (-a)2. n

Desviación típica poblacional = σ =

∑ (X i =1

∑ (X i =1

2

N

n

Desviación típica muestral = S =

− µ)

i

i

−X

n −1

)

2

.

33

Entonces la desviación típica de los datos del ejemplo será:

S = 4 = 2 . Tanto

la desviación típica, como la media aritmética, mediana y moda, se expresan en las mismas unidades que los datos originales. Ej. Si los datos originales están medidos en kilogramos, metros, años o unidades monetarias, etc; entonces la desviación típica también se expresará en kilogramos, metros, años, etc. Propiedades de la varianza: A continuación se expondrán y demostrarán, de forma intuitiva, algunas propiedades de la varianza. a)La varianza es siempre una cantidad mayor o igual a cero (0), por el hecho de ser un promedio de cuadrados, de los desvíos respecto a la media aritmética. b)La varianza de una cantidad constante es cero (0). Ej. Sean los datos 5,5,5,5 X =

5 + 5 + 5 + 5 20 = =5 4 4

(X

Xi − X

Xi

i

−X

)

2

5

5-5=0

(0)2 = 0

5

5-5=0

(0)2 = 0

5

5-5=0

(0)2 = 0

5

5-5=0

(0)2 = 0

Total = 20

S2 =

Total = 0

0 0 = =0 4 −1 3

c) Si a cada valor de un conjunto de datos, se le suma o resta una cantidad constante, la varianza no se altera. Ej.Si a cada valor de los datos utilizados en el ejemplo anterior le sumamos cinco (5), unidades:

34

(X

Xi − X

Xi+5 1+5=6

6 – 8 = -2

(-2)2 = 4

2+5=7

7 – 8 = -1

(-1)2 = 1

2+5=7

7 – 8 = -1

(-1)2 = 1

4+5=9

9–8=1

(1)2 = 1

6 + 5 = 11

11 – 8 =3

(3)2 = 9

Total = 40 X =

i

−X

)

2

Total = 16

16 16 6 + 7 + 7 + 9 + 11 40 = = 4 ; obsérvese que la varianza = = 8; S2 = 5 −1 4 5 5

es idéntica a la varianza de los datos originales. d)Si se multiplica o divide cada uno de los valores de un conjunto de datos por una constante, la varianza queda multiplicada o dividida por el cuadrado de la constante. Se seguirán utilizando los datos de los ejemplos anteriores.

(X

Xi − X

Xi . 5 1.5=5

5– 15 = -10

(-10)2 = 100

2 . 5 = 10

10 – 15 = -5

(-5)2 = 25

2 . 5 = 10

10 – 15 = -5

(-5)2 = 25

4 . 5 = 20

20 – 15 = 5

(5)2 = 25

6 . 5 = 30

30 – 15 =15

(15)2 = 225

Total = 75 X =

i

−X

)

2

Total = 400

400 400 5 + 10 + 10 + 20 + 30 75 = = 100 ; Si multiplicamos la = = 15 ; S 2 = 5 −1 4 5 5

varianza original de los datos por el cuadrado de la constante, se obtendrá: S2 = 52 . 4 = 25 . 4 = 100.

e)Varianza combinada: Si se tienen dos o más muestras provenientes de una misma población, a cada una de las cuáles se le ha calculado la varianza; en ciertas circunstancias puede resultar conveniente calcular la varianza de la población, en función de las varianzas muestrales, obteniéndose así la varianza combinada. La varianza combinada se denotará como S2C y se obtiene mediante la siguiente fórmula:

35

SC2 =

(n1 − 1).S12 + (n2 − 1).S 22 + ..... + (nk − 1).S k2 (n1 − 1) + (n2 − 1) + ........ + (nk − 1)

Donde: Nk = Número de elementos de la K-ésima muestra. S2K = Varianza de la K-ésima muestra. L desviación típica combinada será = SC =

SC2 .

Ej. Muestra Nº

Varianza (S2)

Tamaño (n)

1

20

5

2

30

4

3

25

4,5

4

37

3,5

n

SC2 =

∑ (n − 1).S i

i =1

n

∑n − K i =1

SC2 =

2 i

=

(19 − 1).(5) + (30 − 1).(4) + (25 − 1).(4,5) + (37 − 1).(3,5) = (20 + 30 + 25 + 37) − 4

i

19.(5) + 29.(4) + 24.(4,5) + 36.(3,5) 445 = = 4,12 = Varianza conjunta. 108 108

SC = 4,12 = 2,03 = Desviación típica conjunta.

Cálculo de la varianza para datos agrupados: n

σ2 =

∑ i =1

f i .( X i − µ ) 2 N

n

= Varianza poblacional; S 2 =

∑ f .( X i =1

i

i

− X )2

n −1

= varianza de la

muestra. f i = Frecuencia absoluta de cada clase. Ej. Se considerará que los datos agrupados en la siguiente distribución de frecuencias, provienen de una muestra.

36

Clases

Frecuencias

Xi − X

Xi

(X

i

−X

)

2

(

fi . X i − X

)

2

absolutas 1,1 – 1,7

1

1,4

1,4-3,27=-

3,4969

1 . 3,4969 =

1,87 1,8 – 2,4

4

2,1

2,1-3,27=-

3,4969 1,3689

4 . 1,3689 = 5,4756

0,2209

8 . 0,2209 = 1,7672

1,17 2,5 – 3,1

8

2,8

2,8-3,27=0,47

3,2 – 3,8

10

3,5 3,5-3,27=0,23

0,0529 10 . 0,0529 = 0,529

3,9 – 4,5

5

4,2 4,2-3,27=0,93

0,8649

5 . 0,8649 = 4,3245

4,6 – 5,2

2

4,9 4,9-3,27=1,63

2,6569

2 . 2,6569 = 5,3138

Totales

30

20,97

n

Varianza = S 2 =

∑ f .( X i =1

i

i

− X )2

n −1

=

20,97 = 0,7231 . 29

Desviación típica S = 0,7231 = 0,8503 . La desviación típica o estándar posee la mayor parte de las características que debe reunir una medida de dispersión, a saber: a)Está definida rigurosamente. b)Se basa en todas las observaciones efectuadas. c)Se calcula con relativa facilidad. d)Se adapta fácilmente al cálculo algebraico. e)Es la medida menos afectada por las fluctuaciones de las muestras. Interpretación de la desviación típica o estándar: Con la desviación típica es posible determinar cuán distantes de la media aritmética, están los valores de la variable en estudio. Mientras la desviación típica sea mayor, esto significa que los datos se encuentran más dispersos con respecto a la media aritmética, que otro conjunto de datos con una desviación típica mayor. Un conjunto de datos es más homogéneo que otro, en la medida que su desviación típica o estándar sea menor.

37

Medidas de dispersión relativas, El coeficiente de variación porcentual: La desviación típica o estándar es una medida absoluta de la dispersión, que expresa la variación en las mismas unidades que los datos originales. Las medidas de dispersión relativas, permiten comparar distintos grupos de datos, en cuanto a su variación, independientemente de las unidades en que se midan las características de interés para el investigador. La más usada es el coeficiente de variación, que viene dado por la relación: CV % =

S .100 ; donde S = Desviación típica o estándar muestral; X = Media X

aritmética muestral (si los datos provienen de una muestra). El coeficiente de variación se expresa en porcentaje. Un conjunto de datos será más disperso que otro, con respecto a su media aritmética (más heterogéneo), en tanto su coeficiente de variación porcentual sea mayor. Cuando se desee comparar la dispersión de dos o más grupos de datos, pueden presentarse tres situaciones posibles: a)Las unidades de medida son iguales y las medias aritméticas son semejantes. b)Las unidades de medida son iguales, pero las medias aritméticas difieren. c)Los grupos de datos que van a compararse están expresados en diferentes unidades. En el primer caso se deben comparar directamente los valores de la desviación típica para cada conjunto de datos. En el segundo y tercer caso, es necesario establecer una medida de dispersión relativa tal como el coeficiente de variación porcentual. Ejemplo: Serie

S

Unidad

X

1

0,5

4

2

1

3

90

CV%

Años

(0,5 / 4) . 100= 12,5%

5,06

Kilogramos

(1 / 5,06) . 100= 19,76%

2300

Bolívares

(90 / 2300) . 100= 3,91%

Se puede observar que las tres series de datos poseen distintas unidades de medida, por lo tanto el único método para comparar sus variabilidades, es el coeficiente de variación porcentual. La serie número tres es la que presenta un menor coeficiente de variación, esto quiere decir que sus datos son más homogéneos o presentan menos 38

variabilidad. La serie número dos presenta un coeficiente de variación mayor, esto significa que los datos son más heterogéneos, en otras palabras la serie de datos que se expresa en kilogramos presenta más variabilidad en sus datos que las otras dos series.

39

PROBABILIDAD El objetivo general de la teoría de probabilidades consiste en proporcionar un modelo matemático adecuado a la descripción e interpretación de cierta clase de fenómenos. Antes de exponer el concepto de probabilidad, se definirán algunos términos que ayudarán a realizar dicha exposición. Resultado: Una o más de las posibles consecuencias de hacer algo. Ej: Al lanzar al aire una moneda si “cae” cara es un resultado, si “cae” sello es otro resultado. Experimento: Actividad que origina un resultado. Ej: Lanzar una moneda y observar el lado superior. Los experimentos están formados por una serie de pruebas, ensayos o repeticiones, que se realizan siempre en las mismas condiciones. Los experimentos pueden clasificarse en: 1. Experimentos determinísticos: Experimento en el cual es posible predecir el resultado final, a través del uso o aplicación de leyes de una determinada disciplina. En otras palabras, aquellos experimentos que repetidos bajo las mismas condiciones, dan iguales resultados. Ej: F = M . A; T = F . E; V = E / T. 2. Experimento aleatorio: Experimento en el cual, aún cuando se controle el estado inicial del experimento y este se repita en las mismas condiciones, es prácticamente imposible predecir el resultado de una prueba o ensayo, debido a que este resultado variará en forma irregular, pero a medida que el experimento se repite muchas veces aparece cierta regularidad. Ej. Arrojar al aire una moneda y observar el resultado. Evento simple: Resultado de un experimento aleatorio que no puede descomponerse en una combinación de otros eventos. Ej: Lanzar un dado y observar el número de la cara superior del dado, los seis posibles resultados son: 1, 2, 3, 4, 5 y 6. La característica distintiva de estos resultados es que no se pueden descomponer en ningunos otros resultados. Espacio muestral: Conjunto de todos los eventos simples que pueden obtenerse al efectuar un experimento aleatorio, generalmente se identifica con la letra S. Ej: Lanzar dos monedas y observar la cara superior de cada una. Con el propósito de obtener todos los resultados, eventos simples o puntos muestrales posibles, del experimento anterior, se hará uso del principio fundamental del conteo, el cual se expone a continuación.

40

Conteo de resultados, eventos simples o puntos muestrales: Se basa en el principio fundamental del conteo o regla de la multiplicación, la cual se enuncia como sigue: “si una operación puede realizarse e n1 formas y si por cada una de estas formas, una segunda operación puede llevarse a cabo en n2 formas, entonces las dos operaciones pueden realizarse juntas en n1 . n2 formas”. Ej. ¿Cuántos resultados, eventos simples o puntos muestrales se obtendrán al lanzar un par de monedas una sola vez?. La primera moneda puede caer de n1 = 2 formas (cara o sello), para cada una de estas la segunda moneda puede caer de n2 = 2 formas. Por lo tanto el par de monedas puede caer en: n1 . n2 = 2 . 2 = 4 formas posibles. Estas cuatro formas posibles pueden determinarse haciendo uso de un diagrama de árbol como el siguiente: Segunda moneda

Primera moneda

Cara

Cara

= CC

Sello

= CS

Cara

= SC

Sello Sello

= SS

También se puede usar el método del diagrama cartesiano:

CC

CS

SC

SS

Cara

Sello

4 resultados

Cara

Sello

41

Espacio muestral S = {CC, CS, SC, SS}.

PROBABILIDAD: Concepto abstracto que se usa para describir el grado de incertidumbre de un evento. La probabilidad de un acontecimiento es el cociente de dividir el número de eventos simples favorables a la realización de dicho acontecimiento, entre el número total de eventos simples posibles de ocurrir, con la condición que todos los eventos simples posibles de ocurrir, tengan igual probabilidad de ocurrencia. También se puede definir como la proporción o porcentaje de resultados favorables con respecto al total de acontecimientos a considerar (ambos conceptos corresponden a la escuela clásica de probabilidad). Se puede expresar como fracción (1/6, ½, 8/9), en forma decimal(0,167; 0.05; 0,59) o en porcentaje(10%, 5%, 30%). Los valores de probabilidad serán siempre positivos y estarán comprendidos entre cero y uno (ambos incluidos). Una probabilidad de cero significa que algo nunca va a suceder, una probabilidad de uno indica que un acontecimiento va a suceder siempre. Para calcular probabilidades de eventos: 1. Se debe definir el experimento. 2. Enumerar los eventos simples. 3. Asignar probabilidades a los eventos simples. 4. Sumar las probabilidades de los eventos simples para obtener la probabilidad del evento de interés. Ej: Considere el experimento de lanzar dos monedas y observar el resultado. S = {CC, CS, SC, SS}, la probabilidad de cada evento simple o resultado será:

EVENTO SIMPLE

PROBABILIDAD

CC

1/4

CS

1/4

SC

1/4

SS

1/4

42

La probabilidad de un evento A es igual a la suma de las probabilidades de los eventos simples que componen el evento A. La probabilidad que ocurra o suceda el evento A, se denota de la siguiente forma: P(A).

Ej: Considere el experimento anterior, si se definen los siguientes eventos A = {observar exactamente una cara}; B = {observar por lo menos una cara}, se pide: P(A)= Probabilidad que ocurra o suceda el evento A = P(CS)+P(SC)= 1/4+1/4=1/2. P(B)=P(CS)+P(SC)+P(CC)=1/4+1/4+1/4=3/4

Eventos mutuamente excluyentes: Son aquellos eventos que no pueden ocurrir simultáneamente, al realizar una sola vez el experimento. Ej: En el lanzamiento de un dado una sola vez, el experimento puede dar como resultado una cualquiera de las caras del dado, pero nunca dos de estas caras simultáneamente. Cuando dos sucesos A y B, son mutuamente excluyentes, entonces la probabilidad que ocurran simultáneamente al realizar una sola vez el experimento será igual a cero, P(A y B) = P(A ∩ B) = 0. Este concepto se puede visualizar, por medio de un diagrama de Venn:

Eventos compuestos: Evento constituido por dos o más eventos simples (por ejemplo los eventos A y B, del ejemplo anterior), pueden formarse de dos maneras: 1. La unión de dos eventos A y B, es el evento que ocurre si A o B, o ambos, ocurren en una realización del experimento. La unión de A y B se denota como: A ∪ B.

43

2. La intersección de dos eventos A y B es el evento que ocurre si tanto A como B ocurren en una sola realización del experimento. La intersección de A y B se denota como: A ∩ B. Ej: Considere el experimento de lanzar un dado y observar la cara superior. Determine los siguientes eventos A = {Obtener un número par}, B = {Obtener un número menor o igual que 3}. S = {1,2,3,4,5,6} A = {2,4,6}; B = {1,2,3}; Calcule P(A) y P(B). P(A) = 3/6; P(B) = 3/6. Calcule

P ( A ∪ B ) yP ( A ∩ B ).

P( A ∪ B) = 5/6; P( A ∩ B) = 1/6.

Evento complemento: El Complemento de un evento A, es el evento formado por todos los eventos simples que no están en el evento A. Ej: El complemento del evento A, del ejemplo anterior es AC = {1,3,5}. Relación complementaria: La suma de las probabilidades de eventos complementarios es igual a 1.

Probabilidad condicional: Hay ocasiones en que se posee información adicional que podría alterar la estimación de la probabilidad de un evento. Esta probabilidad modificada se llama probabilidad condicional del evento. Se define de la siguiente forma: Si A es un evento cualquiera definido en un espacio muestral S, asociado a un experimento aleatorio, la probabilidad que otro evento B ocurra una vez que A haya sucedido, se expresa como la probabilidad condicional de B dado que A ha ocurrido.

P( B / A) =

P( A ∩ B ) P( A) .

Ej: Si se tiene información que en cierto lanzamiento de un dado el resultado fue un número menor o igual a 3. Calcular la probabilidad del evento A = {obtener un número par}. A = {2,4,6} ; B = {1,2,3} ; (A ∩ B ) = {2}

44

P( A) = 1 / 2; P( B) = 1 / 2; P( A ∩ B) = 1 / 6 1 1 P( A / B) = 6 = 1 3 3 Reglas de probabilidad para uniones e intersecciones: 1. Regla aditiva: La probabilidad de la unión de dos eventos A y B se expresa (cuando ambos no son mutuamente excluyentes) como: P( A ∪ B) =P(A) + P(B) - P( A ∩ B) Para eventos mutuamente excluyentes: P( A ∪ B) = P(A) + P(B).

Ej: En una cierta facultad 25% de los estudiantes fueron aplazados en matemáticas; 15% reprobaron química y 10% reprobaron las dos. ¿Cuál es la probabilidad de que haya reprobado matemática o química?. A = {Reprobado en matemáticas}; P(A)=25%. B = {Reprobado en química}; P(B)=15%. A ∩ B = {reprobado en ambas}; P( A ∩ B) = 10% . P( A ∪ B) = P(A) + P(B) - P( A ∩ B) . P( A ∪ B) = 0,25 + 0,15 – 0,1 = 0,30. 2. Regla multiplicativa: 2.1

Para eventos independientes: P( A ∩ B) = P(A) . P(B).

2.2

Para eventos dependientes: P( A ∩ B) = P(A / B) . P(B).

Ej: Siguiendo con el ejemplo anterior, calcular la probabilidad de elegir, al azar un estudiante que haya reprobado matemática si se sabe que reprobó química.

P( A / B) =

P( A ∩ B) P( B)

45

P(A / B) =

0,10 = 0,67. 0,15

Eventos independientes: Dos eventos A y B, son independientes si la ocurrencia de B no altera la probabilidad que haya ocurrido A.

P(A / B) = P(A). Dos eventos son independientes, también, si la probabilidad que ocurran los dos eventos de forma simultánea es igual al producto de las probabilidades individuales de ambos eventos: P(A ∩ B ) = P ( A).P( B) = P(A).P(B / A) . Ej: Considere el experimento aleatorio: Lanzar un dado y observar la cara superior. Dados los siguientes eventos: A = {Observar un número par} y B = {Observar un número menor o igual a 4}. Se pide: 1. Calcular P( A ∩ B) . 2. Determinar si A y B son independientes.

A = {2,4,6}; B = {1,2,3,4}; P(A) = 4/6. P( A ∩ B) = 2/6 = 1/3. P(A / B) = P( A ∩ B) / P(B) =

1/ 3 6 1 = = . 4 / 6 12 2

Dado que P(A) = ½ = P(A / B) = ½. Los eventos A y B son independientes.

46

Distribuciones de Probabilidad. Variable aleatoria (VA): Función que asigna números reales a cada uno de los eventos simples de un espacio muestral. Las VA se designan con las letras mayúsculas X,Y,Z. Ej. Sea el Experimento E, lanzar dos monedas y observar la secuencia de caras y sellos. S = {CC,SC,CS,CC}, se define la función X = {N° de caras obtenidas al lanzar dos monedas}, los posibles valores de X serán0, 1 y 2.

S

Rx 0 1 2

CC CS SC SS

Al conjunto imagen se le denomina rango espacial de X, Rx = {0, 1, 2}. Clasificación de las variables aleatorias según su rango espacial: 1. Discretas: Se dice que una VA es discreta si su rango espacial está formado por un número finito de valores (se pueden hacer corresponder 1 a 1 con los números naturales), es decir los distintos valores de X pueden ser enumerados. Ej. Anterior. 2. Continuas: Se dice que una variable aleatoria es continua, si su rango espacial está formado por un conjunto infinito no contable de valores, Rx es un intervalo o conjunto de intervalos. Ej. E : Lanzar una moneda hacia una línea marcada en el suelo. Si se define la VA X = {Distancia a la cual cae la moneda} y se especifica que la distancia máxima a la cual puede caer la moneda es un metro. Rx = {0 ≤ X i ≥ 1

}

Distribución de probabilidad de una VA discreta: Es aquella función que mide la probabilidad que una VA X tome determinados valores. Ej. Sea E = {Lanzar dos monedas y observar la cara superior} S = {CC, CS, SC, SS}; X = {Nº de caras obtenidas al lanzar una moneda}; Rx = {0, 1, 2}.

47

X

P(X)

0

1/4

1

1/2

2

1/4 0,6 0,5 P(X)

0,4 0,3 0,2 0,1 0 X

Probabilidad de observar cero caras ó una cara: 1

P(0) + P(1) = ¼ + 2/4 = ¾;

1

2

3

∑ P( x ) = 4 + 4 = 4 i =0

i

Distribución de probabilidad de una variable aleatoria continua: Para cualquier valor c < X < d ⇒ P (c < X < d ) =



d

c

f ( x).dx .

Distribuciones de probabilidad discretas más comunes: 1. Poisson. 2. Bernoulli. 3. Binomial. 4. Multinomial. 5. Hipergeométrica. Distribuciones de probabilidad continuas más comunes: 1. Uniforme. 2. Weibull. 3. Normal. 4. Gamma. 5. Beta. 6. Log normal.

48

DISTRIBUCIONES DE PROBABILIDAD DISCRETAS. Esperanza matemática o valor esperado de una distribución de probabilidad discreta: Si X es una variable aleatoria discreta cuyo rango espacial es RX={x1, x2, x3, ...xn}, el valor esperado de dicha variable aleatoria es: n

E [X ] =

∑ X .P(X ) i

i =1

i

n

∑ P(X i )

n

; dado que

∑ P(X ) = 1; se puede obviar el denominador. i =1

i

i =1

El valor esperado es el promedio ponderado de los posibles valores de la variable aleatoria X, cada valor de xi es ponderado por su probabilidad de ocurrencia. El concepto de esperanza matemática tiene su origen en los juegos de azar, debido a que los apostadores deseaban saber cuál era su esperanza de ganar repetidamente en un juego. En este sentido, el valor esperado representa la cantidad de dinero promedio que el jugador está dispuesto a ganar o perder, después de un número muy grande de apuestas. Ej: considere la siguiente situación, un juego consiste en lanzar dos veces una moneda, se recibirá un bolívar por cada cara obtenida. ¿Cuánto dinero se espera ganar si se permite jugar una sola vez?. El espacio muestral es: S = {CC, CS, SC, SS}, La variable aleatoria es X = {Número de caras obtenidas}; el rango espacial es RX = {0, 1, 2} y su distribución de probabilidad es: Xi

P(Xi)

0

1/4

1

2/4

2

1/4 La esperanza matemática de esta variable aleatoria será: 1 2 1 1 1 E [X ] = 0. + 1. + 2. = 0 + + = 1 4 4 4 2 2 En otras palabras, se espera ganar, en promedio, un bolívar si el juego de lanzar

dos veces una moneda y observar el número de caras, se realiza un número muy grande de veces.

49

Varianza de una variable aleatoria discreta: La varianza de una variable aleatoria es una medida de la dispersión de la distribución de probabilidad de dicha variable aleatoria, con respecto a su valor esperado. Se denota como: V [X ] = σ 2 = E [X − E[X ]] (1) 2

Otra expresión equivalente es: V [X ] = ∑ (P(X i ). X i2 ) − (E [X ]) (2) n

2

i =1

Ej. Se continuará con el experimento de lanzar una moneda dos veces y observar el número de caras obtenidas. S = {CC, CS, SC, SS}; RX = {0, 1, 2}. Xi

P(Xi)

0

1/4

1

2/4

2

1/4 E[X] = 1; se calculará la varianza utilizando primero la expresión (1). 1 2 1 1 2 1 V [X ] = (0 − 1) 2 .  + (1 − 1) 2 .  + (2 − 1) 2 .  = (−1) 2 .  + (0).  + (1) 2 .  4 4 4 4 4 4 V [X ] =

1 1 2 1 +0+ = = . 4 4 4 2

Utilizando la expresión (2):  1   2 4 2 1  V [X ] =  .(0) 2 +  .(1) 2 +  .(2) 2  − 12 ⇒ 0 + +  − 1 ⇒ V [X ] = 4 4 4 4   4  

6  1  4 − 1 = 2  

La desviación estándar de una distribución de probabilidad discreta es la raíz cuadrada positiva de la varianza, σ = V (X ) . Distribución de probabilidad Binomial: Condiciones de un experimento aleatorio binomial: •

El resultado de efectuar el experimento da lugar a una dicotomía: Éxito o fracaso.



La probabilidad de éxito siempre es la misma en cada ensayo.



Cada resultado del experimento es independiente de los demás.

50



El experimento se repite un número determinado de veces en las mismas condiciones.

Si un experimento aleatorio cumple con las anteriores condiciones, se puede definir la variable aleatoria X = {Número de veces que un evento ocurre en n repeticiones}, la cual sigue una distribución de probabilidad binomial. La probabilidad que la variable X tome un valor dado, viene dada por la función de distribución de probabilidad:

 n  x n− x b(n, X , p ) =   p q X n: Número de veces que se repite el experimento. X: Número de éxitos que interesa observar en n pruebas. P: Probabilidad de éxito en cada repetición. Q: Probabilidad de no éxito en cada repetición. Los parámetros que definen esta distribución son: n y p. El valor esperado de la distribución binomial es: E[X] = n . p La varianza de la distribución binomial es: V[X] = n . p .q Ej. Supóngase que en una población de conejos, en la que existe un 25% de individuos inmunes a una enfermedad viral, se extrae uno al azar y se determina si es inmune o no (posteriormente se devuelve a la población de donde se extrajo). Si el experimento se realiza 10 veces. Calcule: •

La probabilidad de que 4 conejos sean inmunes a la enfermedad.

Se define la VA X = {N° de conejos inmunes observados}. X es una VA binomial, ya que: 1) Sólo puede tener dos resultados (I y no I). 2) Los resultados del experimento son independientes uno del otro. 3) La probabilidad de observar un animal infectado no varía durante la realización del experimento.

10  b(4;10;0.25) =  .(0.25) 4 .(0.75)6 ⇒ 210.(0.00391).(0.178) = 0.146 4  •

Probabilidad de encontrar a lo sumo 5 conejos inmunes:

P( X ≤ 5) = P(0) + P(1) + P(2) + P(3) + P(4) + P(5) = 0.0563 + 0.187 + 0.2816 + 0.2503 + 0.146 + 0.058 = 0.9803.

51



Probabilidad de encontrar al menos 6 conejos inmunes:

P( X ≥ 6) = P(6) + P(7) + P (8) + P(9) + P(10) = 0.0162 + 0.0031 + 0.0004 = 0.0197. P( X ≥ 6) = 1 − P( X ≤ 5) = 0.0197. •

Valor esperado, varianza y desviación típica de la distribución: E[X] = n. p = 10 . 0,25 = 2,5. Si se realiza el experimento de extraer 10 conejos al

azar de una población y determinar si son inmunes o nó a determinada enfermedad, un gran número de veces, en promedio, se esperan observar 2,5 conejos inmunes. V[X] = n . p . q = 10 . 0,25 . 0,75 = 1,875. Desviación típica = σ = 1,875 = 1,3693. Distribución de Poisson: Existen innumerables fenómenos biológicos, en los cuales es posible la aplicación de la distribución binomial, pero donde el número de veces (n) que se repiten las pruebas es muy grande y la probabilidad de éxito muy pequeña. Condiciones de un experimento aleatorio de Poisson: Además de cumplir con las condiciones de un experimento aleatorio binomial, el experimento de Poisson debe de cumplir con: 1. El número de veces que se repite cada prueba particular es muy grande (n tiende a infinito o es un número muy elevado). 2. La probabilidad de éxito es muy pequeña.

Si un experimento aleatorio cumple con las anteriores condiciones, se puede definir la variable aleatoria X = {Número de eventos aleatorios independientes, que ocurren a una rapidez constante en el tiempo o en el espacio}, la cual sigue una distribución de probabilidad de Poisson. La probabilidad que la variable X tome un valor dado, viene dada por la función de distribución de probabilidad:

µ x .e − µ P( x) = x!

Donde:

µ = Número promedio de repeticiones en tiempo o espacio. e= Base de los logaritmos neperianos 2,71828.....

52

El parámetro de una distribución de Poisson es:

µ.

La distribución de Poisson es muy útil en la determinación de probabilidades de eventos poco comunes que ocurren en una unidad de tiempo, área o volumen. El valor esperado de la distribución de Poisson es: E[X] = La varianza de la distribución de Poisson es: V[X] =

µ.

µ.

La distribución de Poisson como una aproximación a la distribución binomial. En ocasiones, a fin de evitar la laboriosidad que requiere el cálculo de distribuciones binomiales, es posible utilizar, en su lugar y bajo ciertas condiciones, la distribución de Poisson. Tales condiciones se cumplen cuando n (número de ensayos),es grande y p (probabilidad binomial de obtener un éxito) es pequeña. Una regla utilizada por algunos autores, es que la distribución de Poisson es una buena aproximación de la distribución binomial, cuando n es igual o mayor que 20 y p es igual o menor que 0,05. Cuando se cumplen estas condiciones, se puede sustituir la esperanza matemática o media aritmética de la distribución binomial (n . p), en lugar de la esperanza de la distribución de Poisson

(µ ) .

Ej: si el 5% de los becerros de determinado hato, se mueren antes del primer año de vida . ¿Cuál sería la probabilidad de que a un ganadero, que hubiera comprado 25 de esos becerros, se le mueran 2 de ellos?. Dado que n ≥ 20 y p ≤ 0,05 .

µ = p . n = 0,05 . 25 = 1,25 ; x = 2.

P(x) =

1,252.e −1., 25 (1,5625)(. 0,286505) = 0,44766 = 0.2283 ≈ 23% . = 2! 2 2

Distribuciones continuas: Distribución normal: Es la distribución o función de densidad más importante y de uso más extendido en estadística, su importancia surge de dos hechos 1) Una gran cantidad de variables en la naturaleza tienen distribución normal (peso, talla, producción láctea, etc), 2) muchas distribuciones probabilísticas discretas (como la binomial, Poisson, etc), tienden a comportarse como la distribución normal, cuando el tamaño de la muestra es grande.

53

La distribución normal es continua, simétrica, en forma de campana y su función de probabilidad es :

− 1 f ( X , µ ,σ ) = e σ 2π

( X −µ )2 2σ 2

Donde:

e es la constante 2,7182…(base de los logaritmos neperianos). π

es

3,1415… (Relación entre la longitud de la circunferencia y su diámetro).

x es la abscisa, cualquier punto del intervalo. µ es la media de la variable aleatoria.

σ es la desviación tipo de la variable aleatoria, σ 2 es la varianza de la variable aleatoria f(x) la ordenada de la curva.

Cuya representación gráfica tiene el siguiente aspecto:

Dicha curva y tal como vemos en la gráfica, presenta un agrupamiento de frecuencias altas en torno a la media. La medida de la distancia al valor central es indicado por la desviación tipo o estándar.

Los parámetros de la distribución normal son la media poblacional ( µ ) y la varianza (σ 2 ) , los cuales representan la ubicación y la forma de la distribución de probabilidad.

54

El valor de µ , determina la posición de la curva en el eje x, puede tener cualquier valor entre − ∞ y + ∞ ; en otras palabras − ∞ ≤ X i ≤ +∞ .

El valor de la desviación estándar (σ ) , determina el grado de dispersión de los valores de X, alrededor de la media aritmética ( µ ) .

Recordar: σ 2 (var ianza ) = σ 2 = σ . Los valores de σ , oscilan entre 0 y + ∞ . Diferentes combinaciones de valores de µ y σ producen distintas curvas normales. Por lo tanto no existe una única curva normal, si no una familia de ellas, esto significa que para calcular las áreas, bajo las curvas normales es necesario aplicar el cálculo integral para cada caso particular, sin embargo existe una distribución denominada distribución de Z o distribución normal estandarizada, la cual tiene parámetros µ = 0 y σ = 1 ; toda curva normal (representación gráfica de la distribución normal), puede ser convertida en normal estandarizada al realizar el siguiente cambio de variables: Z =

X −µ ; los valores de área bajo la curva normal estandarizada, se σ

encuentran tabulados, lo cual facilita el cálculo de dichas áreas.

55

Ej1. Una población de 1000 plantas de maíz, tiene una altura promedio de 1,80 m, con una desviación estándar de 0,2m. Si se admite que la variable altura se distribuye normalmente calcule: •

% del total que tiene una altura superior a 2m.



% del total que tiene una altura inferior a 1,4m.



Probabilidad de seleccionar una planta con altura entre 1,4 y 2m. Ej2. Se tiene un programa de entrenamiento diseñado para mejorar la calidad de

las habilidades de supervisión, de los supervisores de una línea de producción. Debido a que el programa es autoadministrado, los supervisores requieren un número diferente de horas para terminarlo. Un estudio de los participantes anteriores indica que el tiempo promedio que se lleva completar el programa es de 500 horas y que esta variable aleatoria normalmente distribuida tiene una desviación estándar de 100 horas. Se pide: •

Calcule la probabilidad que un participante elegido al azar, requiera más de 500 horas para completar el programa.



Calcule la probabilidad que un participante elegido al azar, requiera entre 500 y 650 horas para completar el programa.



Calcule la probabilidad que un participante elegido al azar, requiera más de 700 horas para culminar el programa.



Calcule la probabilidad que un participante elegido al azar, requiera menos de 580 horas para culminar el programa. La distribución normal como una aproximación a la distribución binomial. Aunque la distribución normal es continua, puede utilizarse para determinar las

probabilidades asociadas a una distribución binomial. Utilizar la aproximación normal a la distribución binomial resulta conveniente, pues permite determinar probabilidades en fenómenos que siguen la distribución normal, sin la necesidad de efectuar cálculos laboriosos. Sea X una variable aleatoria binomial, para la que el número de ensayos independientes (n), es suficientemente grande, se dice que X posee una distribución normal aproximada con esperanza matemática E[X] = n . p y desviación estándar

σ = n.( p )( . 1 − p ) , si se cumple la siguiente condición: n . p > 5, cuando p ≤ 0,5; ó n. (1-p) > 5, cuando p ≥ 0,5. Ej1. Una organización política planea llevar a cabo una encuesta para detectar la preferencia de los votantes con respecto a los candidatos A y B, que ocuparán un puesto

56

en la administración pública. Supóngase que toma una muestra aleatoria de 1000 ciudadanos. ¿ Cuál es la probabilidad que 550 o más de los votantes indiquen una preferencia por el candidato A, si la población, con respecto a los candidatos, se encuentra igualmente dividida?. Solución: Si se supone que p = 0,5; E[X] = n . p = 1000 . 0,5 = 500.

σ = 1000.(0,5)( . 0,5) = 15,81. La probabilidad que X ≥ 550 =

(550 − 0,5) − 500  ≈ P(Z ≥ 3,13) ≈ 0,0009  P(X ≥ 550) ≈ P Z ≥  15,81   El término 0,5 que se sumará o restará al valor de la variable según sea el caso, es una corrección por continuidad que se aplica al pasar de una distribución de probabilidad discreta (como la distribución binomial), a una distribución de probabilidad continua (como la distribución normal). Ej2. La probabilidad que un paciente se recupere de una rara enfermedad de la sangre es 0,4. Si se sabe que 100 personas han contraído esta enfermedad. ¿Cuál es la probabilidad que menos de 30 sobrevivan?. Sea la variable binomial X que representa el número de pacientes que sobreviven. Dado que n = 100 y n . p = 100 . 0,4 = 40, cuando p ≤ 0,5 , se deben obtener resultados bastante precisos utilizando la aproximación de la distribución normal con E[X] = µ = n.p E[X] = 100 . 0,4 = 40. σ = n. p.(1 − p ) = 100.0,4.0,6 = 4,899 . A fin de obtener la probabilidad deseada, debe encontrarse el área a la izquierda de X = 30 – 0,5 = 29,5. El valor correspondiente de z para X = 29,5 es: Z=

29,5 − 40 = −2,14 . La probabilidad que sobrevivan menos de 30 pacientes de 4,899

un total de 100 será 0,0166. Se entra en la tabla, en la columna marginal izquierda con un valor de 2,1, se intercepta este valor con el valor 04 de la fila marginal superior y se obtiene un area bajo la curva normal de 0,4834 .

57

Area solicitada = 0,5-0,4838 = 0,0166.

58

INFERENCIA ESTADÍSTICA Inferencia: Proceso de obtener o producir conclusiones acerca de algo. Inferencia estadística: Rama de la estadística que tiene que ver con el desarrollo y aplicación de métodos y técnicas que conducen a obtener conclusiones acerca de parámetros poblacionales, sobre la base de observaciones obtenidas de una muestra aleatoria, con un cierto grado de incertidumbre asociado. La inferencia estadística se divide en: 1) Estimación de parámetros. 2) Pruebas de hipótesis. 1)Estimación de parámetros: Proceso que consiste en utilizar información proveniente de una muestra con la finalidad de obtener información acerca de los valores numéricos de parámetros desconocidos pertenecientes a una población. Si se calcula un simple valor, para estimar el parámetro, el proceso se llama estimación puntual. Si se calcula un intervalo o conjunto cerrado de valores, el proceso es llamado estimación por intervalos. La estimación de parámetros poblacionales, se logra haciendo uso de los llamados estimadores. Un estimador: Consiste en una función de los elementos seleccionados en una muestra aleatoria, que especifica el valor de un parámetro (Ej: Media aritmética, mediana, varianza). Estimación: Es el valor numérico específico producido por un estimador. El término estimador hace referencia a la medida (por ejemplo, de tendencia central o dispersión), empleada para hacer la estimación, mientras que la estimación se refiere al resultado obtenido de la muestra elegida en particular. Los estimadores deben cumplir con las siguientes condiciones: a)Ausencia de sesgo: Se produce cuando el valor del estimador es igual al parámetro de la población que se va a estimar, en el caso del estimador media aritmética

[]

E X = µ , ( E [X ] = Esperanza de la media aritmética muestral). b)Consistente: El estimador debe aproximarse cada vez más al parámetro que estima, a medida que aumenta el tamaño de la muestra. c)Eficiente: Un estimador se considera eficiente si tiene una varianza menor que otros estadísticos con los que se pretende estimar el mismo parámetro. 59

d)Suficiente: Se dice que un estimador es suficiente cuando utiliza toda la información que posee una muestra, con respecto al parámetro que se está estimando. De las medidas de tendencia central estudiadas en el curso, la media aritmética

( )

muestral X , es un estimador insesgado, consistente, eficiente y suficiente de la media aritmética poblacional, de allí su importancia en la inferencia estadística. La media aritmética muestral es un estadístico y la distribución de probabilidad de un estadístico recibe el nombre de distribución muestral. DISTRIBUCIÓN MUESTRAL DE LA MEDIA ARITMÉTICA: Teorema Central del Límite: Si se seleccionan muestras aleatorias de n observaciones cada una, provenientes de una población con media aritmética (µ ) , y desviación típica

(σ ) ,

la distribución muestral de la media aritmética, tendrá

aproximadamente una distribución normal con media aritmética igual a desviación estándar igual a

(µ )

y

σ , la aproximación a la distribución normal será más n

exacta a medida que n sea cada vez mayor, en otras palabras, independientemente de la distribución de probabilidad de la cual provenga la muestra aleatoria, las formas de las distribuciones muestrales de X , tienden a aproximarse a la distribución normal, al aumentar el tamaño de la muestra (n).

ESTIMACIÓN DE PARÁMETROS POR INTERVALOS DE CONFIANZA. Intervalo de Confianza: Intervalo calculado u obtenido de una muestra de datos, el cual tiene una probabilidad específica que el parámetro de interés desconocido esté contenido entre los límites del intervalo. Coeficiente de confianza: El coeficiente de confianza de un intervalo de confianza, para un parámetro dado, es la probabilidad que el intervalo contenga el valor del parámetro de interés. Se puede interpretar también como el porcentaje de los intervalos (obtenidos de muestreos repetidos, cada uno de tamaño n, tomados de una población dada), que se espera incluyan el valor del parámetro que se está estimando. Se denota como (1 − α ), donde α = nivel de incertidumbre. Límites de confianza: Son los límites inferior y superior de un intervalo de confianza, que define el intervalo dentro del cual un parámetro poblacional, presumiblemente se encuentra.

60

Algunos coeficientes de confianza usados comúnmente son los de 90%, 95% y 99%. El intervalo de confianza de 99% será más ancho que el de 90%. La anchura de un intervalo de confianza depende también del tamaño de la muestra y de la varianza de la misma, en la medida que aumenta el tamaño de la muestra, disminuye el ancho del intervalo y aumenta dicho ancho, si la varianza es alta.

INTERVALO

DE

CONFIANZA

PARA

LA

MEDIA

ARITMÉTICA

POBLACIONAL (µ ) . Se presentan dos situaciones: a)Varianza poblacional conocida (σ 2 ) . b) Varianza poblacional desconocida. a)Si X es la media aritmética de una muestra aleatoria de tamaño n, de una población con varianza conocida (σ 2 ) , el intervalo de confianza (1 − α ).100 , para µ ,

X − Z (α / 2 ). es:

σ σ < µ < X + Z (α / 2 ). n n

Ej. Una muestra al azar de 100 becerros, tomada de la totalidad de becerros nacidos en un hato (población), tuvo un promedio de peso al nacer de 25 kg, con una varianza de 16. Se pide: Calcular el intervalo de confianza para la media aritmética poblacional (µ ) , con un nivel de confianza del 95%. Datos:

σ 2 = 16 ⇒ σ = 16 = σ = 4 ; desviación típica poblacional. n = 100 becerros. X =

25 kg.

Coeficiente de confianza = 95%, se procede a buscar el valor de Z para el coeficiente de confianza dado.

(1 − α ).100 = 95 ⇒ 1 − α =

95 α ⇒ 1 − α = 0,95 ⇒ α = 1 − 0,95 ⇒ α = 0,05 ⇒ = 0,025 100 2

El valor de Z, para un área bajo la curva normal de 0,025, ubicada en ambos extremos de la curva es: ± 1,96 . El intervalo de confianza será: 61

25kg − 1,96.

4 4 < µ < 25kg + 1,96. 100 100

25kg − 1,96.0,4 < µ < 25kg + 1,96.0,4 25kg − 0,784 < µ < 25kg + 0,784 24,216kg < µ < 25,784 P[24,216 < µ < 25,784] = 95% . Interpretación: a) µ pertenece o está comprendido en el intervalo cuyo límite inferior es 24,216 kg y el límite superior 25,784 kg, con un 95% de confianza. b)Si se realizan muestreos repetidos, bajo las mismas condiciones, 95% de los intervalos de confianza obtenidos, se espera que contengan el verdadero valor de la media aritmética (µ ) . c)Si se utiliza la media aritmética muestral

(X ), como estimador de µ , se puede

tener una confianza del 95% que el error de estimación no excederá de

Zα / 2 .

σ n

= 0,784. El error de estimación es igual al valor absoluto de la diferencia entre el verdadero valor del parámetro y el estimador = µ − X . Según esta última interpretación: Error máximo de estimación = E = Zα / 2 .

σ . n

Luego si se utiliza X , como una estimación de µ , se puede tener una confianza de (1 − α ).100% , que el error no excederá de una cantidad específica E, cuando el  Z .σ  tamaño de muestra es: n =  α / 2  .  E  2

b)La varianza poblacional (σ 2 ), se desconoce: La mayoría de las veces no se tiene

la suerte de conocer la varianza de la población (σ 2 ), de la cual se seleccionan las muestras aleatorias. En estos casos debe utilizarse la varianza muestral (S2), cuyos valores fluctúan considerablemente de una muestra a otra, haciendo inconveniente el uso de la distribución normal, en el cálculo de los intervalos de confianza.

En estos casos es necesario utilizar la distribución de probabilidad muestral de Student o distribución de t. Esta distribución de probabilidad tiene las siguientes propiedades: 1)Tiene forma acampanada.

62

2)Es simétrica con respecto a la media aritmética. 3)Se distribuye de manera que forma una familia de distribuciones, una en particular para cada tamaño de muestra. 4)La distribución de t se aproxima a la distribución normal conforme crece el tamaño muestral. La tabla de la distribución de t, difiere de la tabla de la distribución normal, en que las áreas bajo la curva se ubican ahora en los encabezados de las columnas y los valores del cuerpo de la tabla , son los valores de t. La columna de la izquierda proporciona los grados de libertad. Areas bajo la curva de t

Valores de t

Grados libertad

de

Los grados de libertad se calculan restándole a n (tamaño de la muestra), el número de variables consideradas en el estudio. Si el tamaño de la muestra es 10 y se está estudiando sólo una variable, los grados de libertad resultan en 10-1 = 9. Si X y S, son la media y la desviación estándar , de una muestra aleatoria, de una población normal con varianza (σ 2 ) desconocida, un intervalo de confianza del

(1 − α ).100 , para X − t (α

µ es:

.

/ 2;n −1)

S < µ < X + t (α n

.

/ 2;n −1)

S n

63

Donde t(α / 2; n −1) , es el valor t con grados de libertad (GL) = n-1, lo que deja un área de α / 2 , a la derecha de t.

t

α /2

α /2

Ej. Los contenidos de una muestra de 7 recipientes similares de ácido sulfúrico, tienen una media aritmética muestral de 10 lt y una desviación estándar de 0,283 lt. Encuentre un intervalo de confianza del 95%, para la media aritmética de la población de recipientes. X = 10 lt; S = 0,283 lt; GL = 7 –1 = 6; α / 2 = 0,05 / 2 = 0,025

t(α / 2; n −1) = t(0,025;6 ) = 2,447.

  0,283lt   0,283lt  P 10lt − (2,447 ).  < µ < 10lt + (2,447 ).  = 95% 7  7     P[9,74 < µ < 10,26] = 95%

64

INTERVALO DE CONFIANZA PARA UNA PROPORCION (P). Un estimador puntual de la proporción poblacional P, en un experimento binomial está dado por el estadístico p =

x , donde x representa el número de veces que ocurre el n

fenómeno de interés en n intentos. Si p es la proporción de éxitos en una muestra aleatoria de tamaño n y q=1-p, un intervalo de confianza aproximado de (1 − α ).100% , para el parámetro P es:

p − Z (α / 2 ).

p.q p.q < P < p + Z (α / 2 ). n n

Donde Z (α / 2 ) , es el valor de Z con un área bajo la curva de la distribución normal, de α / 2 , a la derecha. Cuando n es pequeño y se cree que la proporción desconocida se acerca a 0 ó a 1, el intervalo de confianza, no es adecuado. Para estar seguro, se requiere que n.p y n.q (ambos), sean mayores o iguales a 5 (n . p y n . q ≥ 5 ). Ej. En una muestra aleatoria de n = 500 familias que poseen televisiones, en cierta ciudad, se encontró que x = 340 estaban suscritos a determinada compañía de cable. Encuentre un intervalo de confianza del 95% para la proporción actual de familias, en esa ciudad que están suscritas a la compañía. p =

340 500

= 0 , 68 ; Z

 P 0,68 − (1,96). 



/ 2

)

= Z

(0 , 05

/ 2

)

= Z

0 , 025

= 1 , 96

(0,68)(. 0,32) < P < 0,68 + (1,96). (0,68)(. 0,32)  = 95% 500

500

 

P[0,68 − 0,04 < P < 0,68 + 0,04] = 95% P[0,64 < P < 0,72] = 95% . Interpretación: Se tiene una confianza del 95%, que la proporción muestral (p=0,68), difiere de la proporción poblacional (P), en una cantidad que no excede de 0,04. E = (1,96 ).

(0,68)(. 0,32) 500

= 0,04 = Error máximo de estimación.

65

CALCULO DEL TAMAÑO DE LA MUESTRA (n). Si p se utiliza como una estimación de P, se puede tener una confianza de

(1 − α ).100% ,

que el error máximo de estimación, será menor que una cantidad

especificada E, cuando el tamaño de la muestra sea: n

=

Z (2α / 2 ). p.q E2

.

INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS ARITMETICAS POBLACIONALES; CUANDO SE CONOCEN LAS VARIANZAS DE AMBAS POBLACIONES. Sean X1 y X2, dos variables aleatorias independientes y distribuidas normalmente con medias aritméticas

µ1 y µ 2 y varianzas σ 1 y σ 2 , respectivamente.

Sean X 1 y X 2 , las medias aritméticas muestrales, de muestras aleatorias de tamaño n1 y n2, tomadas de la primera y segunda población. La distribución de la diferencia d = X 1 − X 2 , se puede demostrar que se distribuye normalmente, con

esperanza

()

()

σ 12 σ 22 + E d = µ d = µ1 − µ 2 y varianza: V d = σ = n1 n2 2 d

.

Tomando en cuenta lo anterior, se puede demostrar que el intervalo de confianza para la diferencia entre dos medias aritméticas poblacionales, cuando se conocen las varianzas de ambas poblaciones, viene dado por la siguiente expresión:

(

)

(

)

σ 12 σ 22 σ 12 σ 22 + ≤ µ1 − µ 2 ≤ X 1 − X 2 + Zα . + X 1 − X 2 − Zα . 2 2 n1 n2 n1 n2

Ej: Dos grupos de cerdos fueron cebados con dietas diferentes. Se tomó una muestra aleatoria de 9 cerdos de cada grupo y las medias aritméticas muestrales encontradas fueron X 1 = 80kg y X 2 = 90kg . Se admite que los pesos estaban distribuidos normalmente y las desviaciones típicas fueron σ 1 = 9kg y σ 2 = 18kg . Hallar el intervalo de confianza del 90% para la diferencia de medias aritméticas poblacionales. Utilizando la expresión antes mencionada, se tiene:

X 1 − X 2 = 80 − 90 = −10

1 − α = 0,9 ⇒ α = 0,10

66

Zα = Z 0,10 = Z 0, 05 = 1,64 2

2

σ 12 σ 22 + = n1 n2

9 2 182 + = 9 + 36 = 45 = 6,71 9 9

. 6,71) ≤ µ1 − µ 2 ≤ −10 + (1,64 )( . 6,71) − 10 − (1,64 )(

− 21kg ≤ µ1 − µ 2 ≤ 1kg . Interpretación:

µ1 − µ 2 Pertenece

o está comprendido en el intervalo cuyo

límite inferior es –21Kg y el límite superior es 1 Kg, con un 95% de confianza.

INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS ARITMETICAS POBLACIONALES; CUANDO

NO SE CONOCEN LAS

VARIANZAS DE AMBAS POBLACIONES. Se considerarán dos casos de comparación de medias aritméticas poblacionales que se distribuyen normalmente, cuando las varianzas son desconocidas. En el primero se supondrá que las varianzas son iguales, en el otro se supondrá que son distintas. Nota: Para comprobar la hipótesis

σ 12 = σ 22 ,

debe hacerse previamente, una

comparación de varianzas poblacionales, la cual se estudiará en el tema correspondiente a pruebas de hipótesis. a)

σ 12 = σ 22 , pero desconocidas:

El intervalo de confianza se obtiene mediante la siguiente expresión:

(X

1

)

(

)

1 1 1 1 − X 2 − t(α ).SC . + ≤ µ1 − µ 2 ≤ X 1 − X 2 + t(α ).SC . + 2 2 n1 n2 n1 n2

t El valor de α , se encuentra utilizando la tabla de la distribución de Student, 2

con

n1 + n2 − 2 , grados de libertad. SC = desviación típica combinada = Raíz cuadrada positiva de

SC2 (varianza

combinada).

67

Donde:

b)

S

=

2 C

σ 12 ≠ σ 22

(n 1

− 1 ). S 12 + (n 2 − 1 ). S 22 n1 + n 2 − 2

y desconocidas.

En esta situación el intervalo de confianza se expresa como:

(X

1

− X2

)

(

)

S 12 S 22 S 12 S 22 − t (α ). + ≤ µ 1 − µ 2 ≤ X 1 − X 2 + t (α ). + 2 2 n1 n 2 n1 n 2

Ej: Se tienen dos fincas productoras de cerdos. Se desea estimar la diferencia entre el peso promedio de sus animales usando un nivel de confianza del 95% o 0,95. Para lograr tal fin se tomaron muestras de cada finca y se obtuvo la siguiente información: Finca 1

Finca 2

Número de cerdos

12

15

Peso promedio

78 Kg

70 Kg

Desviación típica

15 Kg

20 Kg

Se supondrá que se hizo la prueba de hipótesis correspondiente y se acepta que

σ 12 = σ 22 , en este caso debe calcularse SC2 (Varianza combinada). 11.(15) + 14.(20) 2475 + 5600 8075 S = = = = 323 12 + 15 − 2 25 25 2

2

2 C

SC = 323 = 17,97 Kg . Para encontrar el valor de t, se utiliza la tabla de Student con

n1 + n2 − 2 =

12+15-2 = 25 grados de libertad y tα = t0,05 = 2,060 2

2

X 1 − X 2 = 78 − 70 = 8Kg Luego:

8 − (2,060)( . 17,97 ).

1 1 1 1 . 17,97 ). + ≤ µ1 − µ 2 ≤ 8 + (2,060)( + 12 15 12 15

Efectuando:

68

− 6,33Kg ≤ µ1 − µ 2 ≤ 44,65Kg . Interpretación:

µ1 − µ 2 , está comprendido en el intervalo cuyo límite inferior es

–6,33 Kg y el límite superior es 44,65 Kg, con un 95% de confianza.

INTERVALO DE CONFIANZA CON RESPECTO A LAS PROPORCIONES DE DOS DISTRIBUCIONES BINOMIALES INDEPENDIENTES. Sean X1 y X2, los números de éxitos en dos experimentos aleatorios binomiales independientes con muestras de tamaño n1 y n2, respectivamente. Para estimar la diferencia (P1-P2), donde P1 y P2 son las proporciones de la característica de interés en dos poblaciones, se pueden considerar las proporciones en que se encuentra la característica a estudiar, en dos muestras extraídas aleatoriamente de cada población:

x ) p1 = 1 n1

y

x ) p2 = 2 n2

.

El teorema del límite central establece que si los tamaños de las muestras n1 y n2, ) ) tienen el tamaño suficiente, la distribución de muestreo de ( p1 − p2 ) , es aproximadamente normal y en consecuencia se puede obtener un intervalo de confianza para la diferencia de proporciones poblacionales, como el que se muestra a continuación:

) ) ) ) ) ) ) ) p1.q1 p2 .q2 p1.q1 p2 .q2 ) ) ) ) + ≤ P1 − P2 ≤ ( p1 − p2 ) + Zα . + ( p1 − p2 ) − Zα . 2 2 n1 n2 n1 n2 Nota: Se considera que n1 y n2 tienen un tamaño suficiente, para que la expresión sea válida, cuando se cumple la siguiente regla práctica:

) ) ) ) p1.n1 〉 5; p2 .n2 〉5; q1.n1 〉 5; q2 .n2 〉 5 .

Ej: Supóngase que una máquina 1 produce 49 artículos, con un determinado defecto de cada 100 y otra máquina 2, produce 19 artículos defectuosos de cada 100 elaborados. Establezca un intervalo de confianza del 99%, para (P1 – P2), donde P1 es la verdadera proporción (poblacional), de productos defectuosos elaborados por la máquina 1 y P2 es la verdadera proporción de productos defectuosos elaborados por la máquina 2. 69

Las proporciones muestrales son:

49 ) p1 = = 0,49 100

y

19 ) p2 = = 0,19 . 100

Obsérvese que:

) p1.n1 = 49 ) p2 .n2 = 19

y

) q1.n1 = 51 ) q2 .n2 = 81 .

Exceden de 5, por lo tanto se puede utilizar la expresión para el cálculo de la diferencia entre dos proporciones expuesta antes.

(1 − α ) = 99% ⇒ (1 − α ) = 0,99 ⇒ α = 0,01

Zα = Z 0,01 = Z 0,005 = 2,58 , 2

2

(utilizando la tabla de la distribución

normal estandarizada).

(0,49−0,19) − 2,58. (0,49)(. 0,51) + (0,19)(. 0,81) ≤ P1 − P2 ≤ (0,49−0,19) + 2,58. (0,49)(. 0,51) + (0,19)(. 0,81) 100

100

100

100

Efectuando se tiene:

0,3 − 0,164 ≤ P1 − P2 ≤ 0,3 − 0,164

0,136 ≤ P − P2 ≤ 0,3164 Interpretación: La verdadera diferencia, entre las proporciones de elementos defectuosos en las máquinas, se encuentra entre 0,136 y 0,3164, con un 99% de certeza. Puesto que el límite inferior de la estimación es positivo, se puede estar razonablemente seguro que la proporción de artículos defectuosos elaborados por la máquina 1 excede la proporción correspondiente a la máquina 2.

70

INTERVALOS DE CONFIANZA PARA VARIANZAS Y DESVIACIONES TIPICAS. Dada una muestra aleatoria de tamaño n, tomada de una población normal, se puede obtener un intervalo de confianza de (1 − α ).100%, para la varianza poblacional

(σ ), 2

utilizando:

(n − 1).S 2 σ2

, que es una variable aleatoria con distribución de

probabilidad χ 2 (jí cuadrado), con n-1 grados de libertad, donde: n = número de elementos de la muestra; S2 = Varianza muestral; σ 2 = Varianza poblacional. Intervalo de confianza para la varianza poblacional (σ 2 ), cuando se muestrea una distribución normal, con media aritmética poblacional desconocida (µ ) .

(n χ

− 1 ). S 2 (α

/ 2 ;n − 1

2

)

〈σ

2



(n χ

2

(1

− 1 ). S − α

2

/ 2 ;n − 1

)

Equivalentemente, un intervalo de confianza para la desviación estándar o típica será:

(n χ

− 1 ). S

2

2 (α / 2 ; n − 1

)

〈σ



(n

χ

− 1 ). S 2

(1 −

2

α / 2 ;n −1

)

Distribución contínua de probabilidad jí-cuadrado χ 2 . (χ = jí ) . La forma de la distribución de probabilidad jí-cuadrado, así como la de la distribución de t, depende de los grados de libertad υ (υ = ipsilon ) , asociados con la varianza muestral (S2). La distribución jí-cuadrado no está definida para valores menores de cero y no es simétrica.

71

Curva de densidad de probabilidad de jí-cuadrado, con 12 grados de libertad, el área a la derecha de 5,226 es 0,95. El área a la derecha de 21,026 es 0,05. Las probabilidades de la distribución jí cuadrado (χ 2 ), están tabuladas para ciertos valores de υ (grados de libertad). La primera columna de la tabla indica los grados de libertad de la variable, las probabilidades se dan en la parte superior de la tabla y los valores de χ 2 , en el cuerpo de la tabla, para combinaciones dadas de probabilidad y grados de libertad. Ejemplos de uso dela tabla χ 2 : Encontrar el valor de χ 2 con 15 grados de libertad, que sea excedido con una probabilidad de 0.05, esto es encontrar χ 2 , tal que P (χ 2 ≥ χ12 ) = 0,05. Se entra en la tabla con 15 grados de libertad y se lee bajo la columna encabezada con el valor 0,05. Allí χ 2 = 32,801 y P (χ 2 ≥ 32,801) = 0,05.

72

Probabilidad

Valor de χ 2

Grados de libertad

Ej :Se desea investigar si la concentración de vitaminas C, en tejidos animales varía según el tipo de tejido. Para probarlo se seleccionó una muestra de 25 tejidos y se les midió el contenido de vitamina C, en mg/100g. Las observaciones arrojaron una varianza muestral de S2 = 15,25. Suponiendo que la muestra proviene de una población normal; estime con un 95% de confianza la verdadera varianza.

(1 − α ).100% = 95% ⇒ (1 − α ) =

(n χ

− 1 ). S 2 (α

/ 2 ;n − 1

2

)

〈σ

95% α ⇒ (1 − α ) = 0,95 ⇒ α = 0,05 ⇒ = 0,025 100% 2 2



(n χ

2

(1

− 1 ). S − α

2

/ 2 ;n − 1

)

73

(25 − 1).15,25 〈σ 2 〈 (25 − 1).15,25 χ (20,025; 25 −1)

χ (21− 0,025; 25 −1)

(24).15,25 〈σ 2 〈 (24).15,25 χ (20,025; 24 )

χ (20.975; 24 )

366 2 366 〈σ 〈 39,4 39,4 9,289〈σ 2 〈 29,516 En la tabla siguiente se muestra como hallar los valores de jí-cuadrado, correspondientes a valores de grados de libertad de 24 y valores de α , de 0,95 y 0,05.

Interpretación: En base a las observaciones de la muestra, con un nivel de confianza del 95%, se puede afirmar que el verdadero valor de σ 2 , se hallará entre 9,289 y 29,516. Si se quiere estimar el verdadero valor para la desviación estándar poblacional

(σ ) , este sería: 74

9,289 〈σ 〈 29,516 3,048mg / g 〈σ 〈5,433mg / g .

75

INTERVALO DE CONFIANZA PARA EL COCIENTE DE DOS VARIANZAS σ 2  POBLACIONALES  2  , DE DOS DISTRIBUCIONES NORMALES. σ  σ 2  Una estimación puntual del cociente de dos varianzas poblacionales  2  , está σ   S2  dada por la razón  2  de las varianzas muestrales, debido a lo anterior, al estadístico S   S2   2  , se le denomina estimador de S 

σ 2   2  . σ 

Si σ 12 y σ 22 , son varianzas poblacionales de poblaciones normales, se puede

σ2 establecer una estimación del intervalo de 2 , utilizando el estadístico: σ S12 .σ 22 F = 2 2 , la variable aleatoria F, tiene una distribución F con υ1 = n1 − 1 y S 2 .σ 1

υ 2 = n2 − 1 , grados de libertad. Distribución continua de probabilidad F. Características: 1)Toma valores desde cero a más infinito (+ ∞ ) . 2)La curva de la distribución de F es siempre asimétrica y su forma depende de los grados de libertad ( υ1 y υ 2 ), asociados a las varianzas muestrales (S12 y S22). 3)En la medida que aumentan los grados de libertad ( υ1 y υ 2 ), la curva de la distribución de F, tiende a ser simétrica.

76

USO DE LA TABLA DE F: . Ejemplo: Encontrar el valor crítico de F para muestras de tamaño 8 y 9 con 5% del área en la extremidad o cola de la derecha Las entradas en esta tabla son valores de Fυ1 ,υ 2 , 0,05 ; para los cuáles el valor crítico con un área a la derecha, debajo de la curva de F, con υ1 y υ 2 , grados de libertad igual a 0,05 es de 3,50.

77

Ej. 2: Encontrar el valor crítico de F para muestras de tamaño 11 y 5; con 1% del área en la extremidad o cola derecha

Ej. 2: Encontrar el valor crítico de F para muestras de tamaño 6 y 4; con 5% del área en la extremidad o cola derecha

Las tablas de valores críticos de F sólo presentan los del lado derecho. En caso que se necesite el valor crítico en la cola izquierda, este se obtiene calculando el recíproco del valor crítico relacionado de la tabla. Lo anterior se puede resumir con la siguiente expresión:

78

F (gl1 ; gl2 ;1 − α ) =

1 F (gl2 ; gl1 ; α )

α

F (gl1 ; gl 2 ;1 − α )

F (gl2 ; gl1 ; α )

Ej 4 : Encontrar P (F ≤ 0,351) = ? . cuando υ1 = 8 y υ 2 = 12 . R: 0,05. 1  1 1  P (F ≤ 0,351) = P ≥  = P ≥ 2,58  . F   F 0,351 

79

Ejercicio: Se desea estimar la razón entre las varianzas de la cantidad de ortofósforo medido en dos localidades de un río. El ortofósforo se mide en miligramos por litro (mg/l). Se obtuvieron 15 muestras en la estación 1 y 12 muestras en la localidad 2. Las cuáles tuvieron una desviación estándar de 3,07 mg/l y 0,8 mg/l, respectivamente. Encuentre un intervalo de confianza para la razón de las varianzas, con un nivel de confianza de 98%.

 2  S1 1 σ 12 S12  P 2 . 〈 2 〈 2 .Fα .(υ ,υ1)  = 1 − α 2 2  S 2 Fα .(υ1 ,υ2 ) σ 2 S 2  2   La expresión anterior permite determinar un intervalo de confianza para

donde



.(υ ,υ ) , es un valor de F con 2 1 2

grados de libertad, con un área de

υ1 = n − 1

y

σ 12 σ 22

,

υ 2 = n2 − 1 ,

α 2.

Del planteamiento del ejercicio se tiene: n1= 15; n2= 12; S1=3,07; S2 = 0,80; (1 − α ).100% = 98% ⇒ (1 − α ) =

1 − α = 0,98 ⇒ α = 0,02 ;

98% 100%

α = 0,01 . 2

En la tabla de la distribución de F se encuentra F0,01 (14, 11) = 4,29 y F0,01 (11,14)= 3,86.

El intervalo de confianza para

σ 12 σ 22

, es:

3,07 2  1  σ 12 3,07 2 . .(3,87 ) 〈 2 〈 2 2 0,80  4,30  σ 2 0,80 σ 3 , 45 〈 σ

2 1 2 2

〈 56 , 99

80

Al calcular las raíces cuadradas de los límites inferior y superior, se encuentra que

un intervalo de confianza para

σ 12 σ 22

es:

σ 12 1,851〈 2 〈 7,549 σ2

81

PRUEBAS DE HIPÓTESIS Hipótesis estadística: Suposición o especulación que se hace con respecto al parámetro de una población. Prueba de hipótesis: Procedimiento mediante el cuál se toma una decisión con respecto a la diferencia entre un estadístico y el parámetro de la población estudiada. Hipótesis nula o de trabajo (H0): Hipótesis o suposición con respecto a un parámetro que deseamos probar, también se puede definir como el valor supuesto del parámetro, antes de tomar la muestra. Hipótesis alternativa (HA): Conclusión que se acepta cuando los datos no respaldan la hipótesis nula. Error de tipo I: Rechazo de una hipótesis nula, cuando en realidad es cierta. Error de tipo II: Aceptación de una hipótesis nula, cuando en realidad es falsa. Nivel de significación (α ) : Probabilidad de cometer error de tipo I. La forma de lograr la disminución de ambos tipos de errores simultáneamente, es aumentar el tamaño de la muestra. Valor crítico: Valor del estadístico estándar o tabulado, más allá del cual se rechaza la hipótesis nula. Puede definirse también como el límite entre las regiones de aceptación y rechazo de la hipótesis nula.

82

Pasos para realizar una prueba de hipótesis:

1)Se establece la hipótesis de trabajo o hipótesis nula y la hipótesis alternativa, que excluye a la anterior, en otras palabras es su negación.

2)Se escoge el nivel de significación de la prueba

(α ),

los niveles de

significación más comunes son: 5% (0,05) y 1% (0,01).

3)Se calculan el o los valores críticos y se establecen las regiones de aceptación y rechazo de la hipótesis nula.

4)Se calcula el estadístico de prueba.

5)Se toma la decisión de aceptar o no, la hipótesis nula.

1)Inferencias acerca de una población: 1.1)Prueba de hipótesis acerca de la media poblacional

(µ ) :

( ), es conocida.

1.1.1)La varianza poblacional σ

2

83

SITUACIONES: Tipos de Hipótesis Estadístico de Prueba

Decisión Se rechaza H0 a favor de HA, al nivel de significación de α , si:

H 0 : µ = µ0 H A : µ 〉 µ0

H 0 : µ = µ 0 Z = X − µ0 C σ0 H A : µ〈µ0

n

H 0 : µ = µ0 H A : µ ≠ µ0

84

Donde:

µ= µ0 =

X = σ0 =

n=

Zc =

Media aritmética poblacional. Media aritmética hipotética. Media aritmética muestral. Desviación típica poblacional. Número de elementos de la muestra. Estadístico de prueba.

Ejemplo 1: Se ha asegurado que el peso promedio de un conjunto de individuos es de 54 Kgs. Para determinar si tal aseveración es correcta, se reunió una muestra aleatoria de 100 pesos. La media aritmética de dicha muestra fue de 53,75 Kg. La desviación típica poblacional se conoce y es igual a σ = 5,4 Kg. ¿Es esta evidencia suficiente para rechazar la hipótesis nula?. Utilice α = 0,05.

H 0 : µ = µ 0 ⇒ µ = 54,4 1)

H A : µ ≠ µ 0 ⇒ µ ≠ 54,4

2)

α = 0,05

3)

85

4) Z c =

X − µ0 − 0 , 65 − 0 , 65 53 , 75 − 54 , 4 = = = = − 1, 204 σ 5,4 5,4 0 , 54 10 n 100

5) El valor del estadístico de prueba (Zc), está ubicado en el área de aceptación, en consecuencia la decisión es: No puede rechazarse Ho. 6)Conclusión: La evidencia (media aritmética muestral), encontrada no contradice el supuesto que la media poblacional es igual a 54,4 Kg, al nivel de significación de 0,05.

( )

1.1.2)La varianza poblacional σ , no es conocida. Situaciones. Decisión Tipos de Hipótesis Estadístico de Prueba Se rechaza H0 a favor de HA, al nivel de significación de α , si: 2

H 0 : µ = µ0 H A : µ 〉 µ0

H 0 : µ = µ0 H A : µ〈µ0

tC =

X − µ0 S0 n

86

H 0 : µ = µ0 H A : µ ≠ µ0

Ejemplo 2: Un ecologista está interesado en demostrar que una ciudad tiene problemas de contaminación ambiental. Específicamente está interesado en demostrar “que el nivel medio de monóxido de carbono (CO), en el aire del centro de la ciudad es no mayor que 4,9 partes por millón (ppm). Se tomaron 25 lecturas del nivel de CO, cuya media aritmética fue de 5,1 ppm y la desviación típica fue de: 2,1 ppm. Se pregunta: ¿Las lecturas tomadas constituyen suficiente evidencia para rechazar la afirmación del ecologista?. Use α = 0,05.

H 0 : µ ≤ µ 0 ⇒ µ ≤ 4,9 1)

H A : µ 〉 µ 0 ⇒ µ 〉 4,9

2)

α = 0,05

3)

tt (n − 1;α ) = tt (25 − 1;0,05) = tt (24;0,05) = 1,71

4)

tC =

X − µ0 5,1 − 4,9 0,2 0,2 = = = = 0,476 S0 2,1 2,1 0,42 5 25 n 87

5)Decisión: Dado que el estadístico de prueba (tc), se ubica en el área de aceptación de H0, no se rechaza la hipótesis nula. 6)No se tiene suficiente evidencia, al nivel de significación del 0,05, para rechazar la aseveración que el nivel medio de monóxido de carbono es no mayor de 4,9 ppm. 1.2) Prueba de hipótesis para la proporción poblacional: Tipos de Estadístico de Decisión Hipótesis Prueba Se rechaza H0 a favor de HA, al nivel de significación de α , si:

H 0 : P = P0 H A : P〉 P0

ZC =

p − P0 P0 .Q0 n

H 0 : P = P0 H A : P 〈 P0

88

H 0 : P = P0 H A : P ≠ P0

Donde: P0= Valor hipotético de la proporción de elementos, en la población, que presentan la característica de interés. Q0= Valor hipotético de la proporción de elementos, en la población, que no presentan la característica de interés. p= Valor de la proporción de elementos, en la muestra, que presentan la característica de interés. n= Número de elementos de la muestra. Ej 3: Se afirma que el 15% o más de los productores agropecuarios lleva registros contables en sus fincas. Para verificar esta afirmación se tomó una muestra aleatoria de 200 productores, entre los cuáles 17 poseían registros. Determine si existen evidencias suficientes como para rechazar la anterior afirmación. Utilice α = 0,10. En experimentos aleatorios de tipo binomial, cuando ocurre que n . P0 ≥ 5 y n . Q0 ≥ 5, es posible utilizar la distribución normal como una aproximación a la distribución binomial, siempre que n sea mayor que 20.

H 0 : P ≥ P0 ⇒ P ≥ 0,15 1)

H A : P 〈 P0 ⇒ P 〈0,15

2)

α = 0,10

17 = 0,085 200 P0 = 0,15; Q0 = 1 − 0,15 = 0,85 p=

89

3)

4)

ZC =

0,085 − 0,15 p − P0 − 0,065 − 0,065 = = = = −2,57 (0,15).(0,85) 0,1275 0,0006375 P0.Q0 200 200 n

5)Decisión: Dado que Zc, está ubicado en la región de rechazo, se rechaza Ho. 6)Conclusión: La evidencia hallada, contradice la afirmación inicial, al nivel de significación del 10%. En otras palabras, menos del 15% de los productores tienen registros contables.

90

1.3)Prueba de hipótesis relativa a la varianza o desviación típica. En muchas situaciones es necesario hacer inferencias acerca de la variabilidad de una población; por ejemplo los instrumentos de precisión utilizados en el trabajo de laboratorio deben ser bastante precisos en promedio, pero además, las mediciones deben mostrar poca variación. La variabilidad del porcentaje de impurezas en una clase determinada de conservas de frutas no debe exceder de un determinado valor, según normas de calidad. Si la varianza de una población es

χ

σ2 2

, entonces el estadístico de prueba:

( n − 1).S 2 = σ2

Donde: S2 = Varianza muestral. n = Número de elementos de la muestra.

σ 2 = Valor específico de la hipótesis nula. tiene una distribución Ji cuadrada ( χ es la letra griega ji minúscula), con n-1 grados de libertad. Este resultado es exacto si la población es normal; pero incluso para muestras tomadas de poblaciones no normales, con frecuencia es una buena aproximación. Se puede, entonces, usar la distribución Ji cuadrada para probar hipótesis 2 con respecto a σ . Reglas de Decisión: Tipos de Hipótesis

Estadístico de Prueba

Decisión Se rechaza H0 a favor de HA, al nivel de significación de α , si:

H0 :σ = σ 0 H A : σ 〉σ 0 Si χ 2calc〉 χ 2 (α ) , se rechaza Ho.

91

χ

2

( n − 1).S 2 =

H0 :σ = σ 0

σ2

H A : σ 〈σ 0

Si χ 2Calc 〈 χ 2 (1 − α ) , se rechaza Ho.

H0 :σ = σ 0 H A :σ ≠ σ 0 Si χ 2Calc 〈 χ 2 (1 − α ) o rechaza Ho.

χ 2calc〉 χ 2 (α ) , se

Ej: Una máquina llena frascos de medicina, los cuáles tienen una capacidad de 32 onzas. Se necesita controlar la varianza σ 2 , de la cantidad de líquido con que se llena cada botella, se considera aceptable una varianza igual a 0,0004, la máquina se ajustará cuando la varianza exceda ese valor. Para cumplir con tal propósito, se toma una muestra de 28 frascos y se le calcula la varianza, el resultado fue: 0,0007. Se pide: Determine con un nivel de significación del 5%, si el proceso de embotellamiento está bajo control.

( )

H 0 : σ ≤ 0,0004

1)

H A : σ 〉 0,0004

2) α = 0,05

=3)Región de rechazo:

92

=0,05

Grados de libertad: 28-1=27.

χ 2 (27;0,05) = 40,1 4)Estadístico de prueba: 2 χ CALC =

5)Decisión: Se rechaza Ho

(27 )(. 0,0007 ) = 47,25 0,0004

(χ ), se encuentra en la región de rechazo. 2

6) Conclusión: Al nivel de significación del 0,05 se concluye que el proceso de embotellamiento no está bajo control con respecto a la varianza.

93

2)Inferencias acerca de dos poblaciones: Al realizar inferencias acerca de dos poblaciones, se pueden utilizar dos tipos básicos de muestras: Independientes y dependientes. La dependencia o independencia de una muestra, está determinada por el tipo de fuente utilizada, la cual puede ser un objeto, animal o persona, de los cuales se extraen o toman los datos. Si se utiliza el mismo conjunto de fuentes, o conjuntos relacionados a fin de obtener los datos, se está en presencia de muestreo dependiente. Si se utilizan conjuntos de fuentes no relacionados (un conjunto para cada población), se tiene muestreo independiente. 2.1)Muestras independientes: 2.1.1)Diferencia entre las medias aritméticas de dos muestras: 2.1.1.1)Varianzas conocidas: Si se seleccionan aleatoriamente muestras independientes de tamaño n1 y n2, de grandes poblaciones con medias aritméticas µ1 y µ 2 , con varianzas σ 12 y σ 22 respectivamente, la distribución de muestreo de X 1 − X 2 : Está distribuida aproximadamente normal, tiene media aritmética µ X − X = µ1 − µ 2 , tiene desviación 1

estándar o típica: σ X 1 − X 2

2

σ 12 σ 22 = + . n1 n 2

Es necesario destacar que la aproximación a la distribución normal es aceptable, siempre que las poblaciones de donde se extraen las muestras se distribuyan 2 2 normalmente y sus respectivas varianzas poblacionales σ 1 yσ 2 , sean conocidas.

(

Zc = El estadístico de prueba será:

(X

1

)

)

− X 2 − (µ 1 − µ 2 )

σ 12 σ 22 + n1 n 2

94

Tipos de Hipótesis

Estadístico de Prueba

Decisión Se rechaza H0 a favor de HA, al nivel de significación de α , si:

H 0 : µ1 − µ 2 ≤ d 0 H A : µ1 − µ 2 〉 d 0

H 0 : µ1 − µ 2 ≥ d 0 H A : µ1 − µ 2 〈 d 0

Zc =

(X

1

)

− X 2 − (µ 1 − µ 2 )

σ 12 σ 22 + n1 n 2

H 0 : µ1 − µ 2 = d 0 H A : µ1 − µ 2 ≠ d 0

95

Ej: Dos lotes de pollos fueron seleccionados para alimentarlos con las raciones R1 y R2. Ambos lotes se colocaron en un ambiente homogéneo tratando de controlar los factores que pudieran incidir sobre los resultados de la experiencia, luego de transcurrido el tiempo que se estableció para el trabajo, se obtuvo la información siguiente: LOTE

Nº de Animales

Ración

Peso promedio

Desviación típica

1

25

R1

1,5 Kg

0,5 Kg

2

25

R2

1,3 Kg

0,3 Kg

Las desviaciones típicas son las correspondientes a las poblaciones de donde se muestrearon. Existe interés en comprobar si la ración 1 es igual o inferior a la ración 2.

α = 0,05

.

H 0 : µ1 − µ 2 ≤ 0 1)

H A : µ1 − µ 2 〉 0

2)

α = 0,05

3)Región de rechazo:

=1,65 Valor crítico (Zt)= 1,65.

96

4) Estadístico de prueba:

Zc =

(X

1

)

− X 2 − (µ 1 − µ 2 )

σ 12 σ 22 + n1 n2 0,2

Zc =

0,25 0,09 + 25 25

= Zc =

(1,5 − 1,3) − (0) =

0,2

= Zc =

0,01 + 0,036

0,5 2 0,3 2 + 25 25 = Zc =

0,2 = 0.932 0,2145

5) Decisión: No se puede rechazar H0 (Zc está en la región no crítica). 6)conclusión: La afirmación que la ración 1 tiene efectos sobre el incremento de peso en pollos, iguales o menores no puede rechazarse al nivel de significación del 0,05. 2.1.1.2)Varianzas no conocidas: Las situaciones que más prevalecen en pruebas sobre dos medias aritméticas son aquellas en las cuales se desconocen las varianzas. En este caso existen unos supuestos básicos: a) Las muestras se toman de poblaciones normales b) Las varianzas poblacionales, aunque desconocidas se asume que son iguales



2 1

= σ 22 ) .

El estadístico de prueba es:

t=

(X

1

)

− X 2 − (µ1 − µ 2 ) 1 1 S p. + n1 n2

Donde Sp simboliza la estimación ponderativa de la desviación estándar (se denomina ponderativa debido a que la información de ambas muestras se combina con el propósito de obtener la mejor estimación posible).

Sp =

(n1 − 1).S12 + (n2 − 1).S 22 n1 + n2 − 2

; Donde grados de libertad = n1+ n2 -2.

97

Tipos de Hipótesis

Estadístico de Prueba

Decisión Se rechaza H0 a favor de HA, al nivel de significación de α , si:

H 0 : µ1 − µ 2 ≤ d 0 H A : µ1 − µ 2 〉 d 0

tc =

(X

1

)

− X 2 − (µ 1 − µ 2 ) Sp.

1 1 + n1 n 2

H 0 : µ1 − µ 2 ≥ d 0 H A : µ1 − µ 2 〈 d 0

H 0 : µ1 − µ 2 = d 0 H A : µ1 − µ 2 ≠ d 0

98

Ej: En un experimento sobre alimentación, se seleccionaron 8 pares de individuos con características muy semejantes entre los animales de cada par , a los cuales se les suministraron dos concentrados diferentes. Se obtuvieron los incrementos de peso (Kg) que se indican a continuación: Número del par

Concentrado A

Concentrado B

1

10

8

2

12

15

3

16

10

4

15

15

5

11

8

6

9

10

7

12

6

8

14

8

12,375

10,00

5,98

11,14

Medias aritméticas Varianzas

Se está interesado en conocer, si los concentrados producen efectos diferentes sobre el incremento de peso.

Use

α = 0,01 .

H 0 : µ1 − µ 2 = 0 1)Hipótesis:

2)

H A : µ1 − µ 2 ≠ 0

α = 0,01 .

99

3) Región de rechazo:

=-2,98

=2,98

tt (α / 2;n1 −1+ n2 −1) = (0,005;8−1+8−1) = (0,005;14) = ±2,98 4) Estadístico de prueba:

(n1 − 1).S12 + (n2 − 1).S 22

Sp = Sp =

tc =

n1 + n 2 − 2

=

(8 − 1).5,98 + (8 − 1).11,14 8+8−2

41,86 + 77,98 119,84 = = 8,56 = 2,93 14 14

(X

1

)

− X 2 − (µ1 − µ 2 ) 1 1 + Sp. n1 n2

= (12,375 − 10) − 0 2,93.

1 1 + 8 8

=

2,375 2,93 0,25

=

2,375 =1,62. 1,465

5)Decisión: Dado que el estadístico de prueba (tc), se ubica en el área de aceptación de la prueba, se concluye que no se puede rechazar H0, al nivel de significación de 0,01.

100

Si se supone que las dos poblaciones tienen varianzas distintas, el contraste de hipótesis para la diferencia entre dos medias aritméticas independientes se realiza utilizando el siguiente estadístico de prueba:

tt =

(X

1

)

− X 2 − (µ1 − µ 2 )

(S

2 1

) (

/ n1 + S 22 / n2

)

Los grados de libertad estarían determinados por el valor más pequeño entre n1-1 y n2-1. Nota: Para determinar si las varianzas de las dos poblaciones son iguales

(σ 1 = σ 2 ) , se debe utilizar la prueba de hipótesis sobre la igualdad de dos varianzas. 2.1.2)Diferencia entre las proporciones de dos muestras: La distribución muestral de p1-p2 es de tipo aproximadamente normal, con media

aritmética

µ p1 − p 2 = P1 − P2 y desviación estándar

P1 .Q1 P2 .Q2 + n1 n2

, siempre

y cuando n1 y n2 , sean lo suficientemente grandes, esta condición se da, si: a)n1 y n2 ≥ 20. b)n1 . p1 > 5 y n1 . q1 > 5. c)n2 . p2 > 5 y n2 . q2 > 5. Debido a que los valores de P1 y P2 son desconocidos pero se les presume iguales, según la hipótesis nula, la mejor estimación disponible para P, es la que se obtiene

ponderando las dos muestras:

pp =

valor del estadístico de prueba sería:

x1 + x2 n1 + n2

Zc =

, por lo tanto:

q p = 1 − p p . El

p1 − p 2  1 1   p p . q p  + n n 2   1 101

Tipos de Hipótesis

Estadístico de Prueba

Decisión Se rechaza H0 a favor de HA, al nivel de significación de α , si:

H 0 : P1 − P2 ≤ d 0 H A : P1 − P2 〉 d 0

Zc = H 0 : P1 − P2 ≥ d 0

p1 − p2 1 1 p p .q p  +   n1 n2 

H A : P1 − P2 〈 d 0

pp =

x1 + x2 n1 + n2

qp = 1 − pp H 0 : P1 − P2 = d 0 H A : P1 − P2 ≠ d 0

102

Ej:se cree que de todos los pacientes atendidos en un hospital, debido a problemas cardíacos, la proporción de mujeres con hipertrofia ventricular (HV), es menor que la proporción correspondiente en hombres. Una muestra aleatoria de 36 mujeres con problemas cardíacos reveló que 20 padecían HV, mientras que una muestra aleatoria de 40 hombres con el mismo mal reveló que 21 padecían HV. ¿A qué conclusión llegará usted con un nivel de significación del 10%?. P1 = Proporción poblacional de pacientes femeninos con HV. P2 = Proporción poblacional de pacientes masculinos con HV. p1 = Proporción muestral de pacientes femeninos con HV. p2 = Proporción muestral de pacientes masculinos con HV. Condiciones:

n1 = 36 ≥ 20 n2 = 40 ≥ 20 n1. p1 = 36.0,56 = 20 n2 . p2 = 40.0,50 = 20 n1.q1 = 36.0,44 = 16 n2 .q2 = 40.0,50 = 20

p1 =

Proporción ponderada =

pp =

20 36

,

p2 =

21 40

20 + 21 = 0,54 . 36 + 40

q p = 1 − p p ⇒ 1 − 0,54 = 0,46 .

H 0 : P1 − P2 ≤ 0 1)

H A : P1 − P2 〉 0

2) α

= 0,10 . 103

3)Zona de rechazo:

=1,28 4)Estadístico de prueba: Zc =

(20 / 36) − (21 / 40)  1  1  0,54.0,46. +     36  40  

= 0,27 .

5)Decisión: Dado que Zc se encuentra en el área de aceptación de la prueba, no se rechaza la hipótesis nula. 6)Conclusión: la evidencia que proporcionan las muestras, a un nivel de significación del 10%, indica que no existe diferencia significativa entre las proporciones de hombres y mujeres con HV. 2.1.3)Prueba de hipótesis acerca de la igualdad entre dos varianzas. Cuando se seleccionan muestras independientes, de poblaciones normales, con

varianzas iguales, la razón de las varianzas muestrales

S12 S 22

, tendrá una distribución de

probabilidad conocida como distribución de F.

104

El estadístico de prueba, cuando se contrasta la razón entre dos varianzas es:

S12 F = 2 , Donde: S12 = Varianza de la muestra número 1, generalmente se trata S2 de la varianza con mayor valor, S 22 = Varianza de la muestra número 2, generalmente se trata de la varianza con menor valor. Reglas de Decisión: Tipos de Hipótesis

Estadístico de Prueba

Decisión Se rechaza H0 a favor de HA, al nivel de significación de α , si:

H 0 :σ1 /σ 2 = 1 H A : σ 1 / σ 2 〉1 Si FCalc 〉 F (ν 1 ,ν 2 ,α ), se rechaza Ho.

H 0 : σ 1 / σ 2 = 1 FCalc H A : σ 1 / σ 2 〈1

S12 = 2 S2

Si FCalc 〈 F (ν 1 ,ν 2 ,1 − α ), se rechaza Ho.

105

H0 :σ1 /σ 2 = 1 H A :σ1 /σ 2 ≠ 1

Si FCalc 〈 F (ν 1 ,ν 2 ,1 − α ) o FCalc 〉 F (ν 1 ,ν 2 ,α ), se rechaza Ho.

Donde:

ν 1 = Grados de libertad de la muestra 1 (n -1). 1

ν 2 = Grados de libertad de la muestra 2 (n -1). 2

Ej: Un criterio para la evaluación de anestésicos orales de uso en odontología es la variabilidad de la cantidad de tiempo (medido en segundos), entre la inyección y la pérdida completa de sensibilidad en el paciente. Una compañía farmacéutica ha desarrollado dos nuevos anestésicos orales, que comercializará con los nombres de Oralcaine y Novasthetic. A partir de las similitudes en la estructura química de los dos compuestos, se ha predicho que deberían mostrar la misma varianza en el efecto sobre el paciente. A continuación se muestran los datos de las pruebas realizadas en los dos compuestos. Anestésico

Tamaño de muestra

Varianza muestral

Oralcaine

31

1296

Novasthetic

41

784

106

La compañía desea probar con un nivel de significación del 2%, si los dos anestésicos tienen la misma varianza, con respecto al tiempo en que surten efecto.

H0 :σ1 /σ 2 = 1

1)

H A :σ1 /σ 2 ≠ 1

2)

α = 0,02

3)región de rechazo y valores críticos: Como se trata de una prueba de dos extremos:

α / 2 = 0,01 y 1 − α / 2 = 1 − 0,01 = 0,99 .

Las tablas de valores críticos de F sólo presentan los del lado derecho. En caso de que se necesite el valor crítico en el extremo izquierdo, éste se obtiene calculando el recíproco del valor crítico que resulta de la tabla, en otras palabras:

F (ν 1 ,ν 2 ,1 − α ) =

0,43 =

F(30;40;0,99)

1 F (ν 2 ,ν 1 ,α )

F(30;40;0,01)

=2,20

F(30;40;0,01)= 2,20 Se obtiene directo de la tabla de la distribución de F. F(30;40;0,99)= 1 / F(40;30;0,01) F(30;40;0,99)= 1 / 2,30 F(30;40;0,99)= 0,43. 4)Estadístico de prueba:

FCalc

S12 = 2 S2

; FCalc =

1296 = 1,65 784 107

5)Decisión: Dado que el estadístico de prueba se ubica en la zona de aceptación de la prueba, no se rechaza la hipótesis nula. 6)Conclusión: Al nivel de significación del 1%, las muestras no presentan evidencia suficiente para rechazar la afirmación del fabricante.

108

2.2)PRUEBAS DE HIPÓTESIS PARA MUESTRAS CORRELACIONADAS O PAREADAS. Cuando se comparan dos poblaciones, por ejemplo, se necesitan dos muestras. Pueden utilizarse dos tipos básicos: Muestras independientes y dependientes (también llamadas pareadas). La dependencia o independencia de una muestra está determinada por el orígen de los datos (unidades experimentales), si se decide utilizar el mismo conjunto de unidades experimentales o conjuntos relacionados para obtener los datos que representan ambas poblaciones, se tiene el muestreo dependiente. Si se utilizan unidades experimentales no relacionadas para obtener los datos, un conjunto diferente, se tiene muestreo independiente. A menudo, el uso de muestras correlacionadas o pareadas, permite llevar a cabo un análisis más preciso, debido a que facilita controlar factores externos. El procedimiento de este tipo de pruebas se explica a continuación: 1)Hipótesis nula:

H 0 : µ D = 0 ; Donde: µ D = Promedio de las diferencias. Hipótesis alternativas:

Se rechaza H0 cuando:

(

H A : µD ≠ 0

)

tC ≤ tt α ; n − 1 2

ó

(

)

t C ≥ t t α ; n −1 2

t C ≥ t t (α ; n − 1)

H A : µ D 〉0

tC ≤ tt (α ; n − 1)

H A : µ D 〈0 2)Estadístico de prueba:

t

C

=

d − µ S d n

d

Donde:

d = Media aritmética de la diferencia entre las observaciones. µ d = Media aritmética de la diferencia ente las observaciones hipotetizada (generalmente igual a cero).

109

∑ (d

Sd =

i =1

)

2

n

i

−d

n −1

S d = Desviación estándar de la diferencia entre las observaciones. n = Número de observaciones pareadas.

di = Diferencia entre cada par de observaciones. Ej: Un investigador médico está interesado en determinar, si un fármaco nuevo tiene el efecto colateral no deseado de elevar la presión arterial. Para realizar el estudio se seleccionan, en forma aleatoria, 12 personas de diferentes edades y condiciones de salud. En un ambiente controlado de laboratorio se toma la presión arterial de las 12 personas y se les administra el fármaco durante un lapso de tiempo, después del cuál se vuelve a tomar la presión arterial. Los datos y parte de los cálculos, se muestran a continuación: Sujeto

Presión (antes)

Presión

Diferencia (d)

(después) Después-antes

(d − d )

d −d

2

1

128

134

6

6-3,75=2,25

5,0625

2

176

174

-2

-2-3,75=5,75

33,0625

3

110

118

8

8-3,75=4,25

18,0625

4

149

152

3

3-3,75=-0,75

0,5625

5

183

187

4

4-3,75=0,25

0,0625

6

136

136

0

0-3,75=-3,75

14,0625

7

118

125

7

7-3,75=3,25

10,5625

8

158

168

10

10-3,75=6,25

39,0625

9

150

152

2

2-3,75=1,75

3,0625

10

130

128

-2

-2-3,75=-5,75

33,0625

11

126

130

4

4-3,75=0,25

0,0625

12

162

167

5

5-3,75=1,25

1,5625

12

∑d i =1

i

= 45

12

∑(d − d)

2

i

= 158,25

1

110

d=

45 = 3,75 12

; Sd =

158,25 = 14,386 ⇒ S d = 3,793 11

Se pregunta:¿Tendrá el medicamento, el efecto colateral no deseado, de elevar la presión arterial en los pacientes?. Use

α = 0,01 .

H0 : µD = 0 H A : µ D 〉0

1)

2) α 3) tt

= 0,01 .

(α ; n − 1) ⇒ tt (0,01;12 − 1) ⇒ tt (0,01;11) = 2,718 ;Valor buscado en la

tabla de student.

4)

tC =

3,75 = 3,425 3,793 12

5)Dado que tc > tt, se rechaza H0 , a favor de HA , el medicamento tiene el efecto colateral indeseado.

111

PRUEBA DE HIPÓTESIS PARA MUESTRAS PAREADAS, CUANDO SE TRATA DE PROPORCIONES. Llamada también “Prueba de significación de cambios”, es particularmente adecuada para diseños “Antes y después”, en los cuáles cada unidad actúa como su propio control. Se utiliza también para determinar concordancia o discordancia de resultados, cuando un mismo material se analiza por dos métodos analíticos diferentes. PROCEDIMIENTO: Se elabora una tabla de doble entrada, Ej: Ejemplo 1, de tabla de doble entrada:

ANTES

DESPUÉS -

+

+

A

B

-

C

D

Ejemplo 2, de tabla de doble entrada:

METODO 2

METODO 1 -

+

+

A

B

-

C

D

Los signos + y -, simbolizan las dos respuestas posibles. El estadístico de prueba es:

ZC =

D− A D+ A

Siempre y cuando, se cumpla con la siguiente condición: D + A ≥ 10 . Zt =(Valor tabulado de Z), Sigue la distribución normal estandarizada. Ej: Se toma al azar una muestra de 120 perros y se determina la presencia o ausencia de una condición dada. Se somete a los perros a un estado de tensión, para determinar el cambio que se produce en la condición que se está estudiando.

112

Se quiere determinar si la tensión, aumenta la proporción de perros que presentan la condición. Datos:

ANTES

DESPUÉS -

+

+

22 (A)

20 (B)

42

-

28 (C)

60 (D)

88

50

80

130

1)

H 0 : P2 = P1 H A : P2 ≠ P1 Donde: P2 = Proporción de perros con la condición, después del Stress. P1 = Proporción de perros con la condición, antes del Stress. 2)

α = 0,01 .

3)Región de rechazo y valor crítico:

ZC ≥ Zt .

El valor de Zt se obtiene en la tabla de la distribución normal

estandarizada y es igual a 2,33.

113

4)Estadístico de prueba:

ZC =

60 − 22 38 D−A = = 4,196 . = 60 + 22 82 D+ A

5)Decisión: Dado que

Z C ≥ Z t , se rechaza H0 , a favor de HA, en otras palabras

el Stress aumenta la proporción de perros que presentan la condición.

114

CORRELACION LINEAL SIMPLE Antes de estudiar la correlación entre dos variables, se harán algunas definiciones que serán de utilidad para el posterior estudio de la correlación lineal simple. Datos bivariados: Valores de dos variables distintas, obtenidos de la misma población. Pares ordenados: Los datos bivariados se componen de pares ordenados. Si se llama X a la primera variable y Y a la segunda, un par ordenado se escribe (X , Y). Ej: Se considerará una población de constituida por los estudiantes de cierta universidad, en un determinado año, se seleccionan cuatro estudiantes y se observa su peso y su talla, los resultados se pueden resumir así: ESTUDIANTE

PESO (Kg.)

TALLA (cm)

1

70

170

2

81

178

3

60

165

4

62

170

Los datos pueden presentarse como pares ordenados (Peso, Talla), así: (70, 170); (81, 178); (60, 165); (62, 170). La correlación mide el grado de asociación entre variables (variables aleatorias). Se habla de correlación lineal simple, cuando la asociación o relación entre dos variables viene dada por una línea recta. Propósito del análisis de correlación lineal simple: En el análisis de correlación el interés se centra en la variación conjunta de dos variables, no se asume a priori que una variable sea dependiente de la otra. Una presunción típica (pero no esencial), es que ambas variables son efectos de una causa común. Resumiendo, cuando se desea establecer el grado de asociación entre pares de variables, el análisis de correlación lineal simple es la aproximación apropiada. Por último, el análisis de correlación se considera técnicamente neutral, es decir, no prueba relación de causa efecto entre las variables estudiadas. Sólo mediante una investigación más completa en las ciencias donde es aplicado el análisis de correlación, se puede llegar a alguna conclusión con respecto a saber si X es o no la causa de Y. Diagrama de dispersión: Es la representación gráfica de los pares de valores, que conforman las variables en estudio e indica la asociación existente entre ellas.

115

Ejemplos de Diagramas de dispersión:

Fuerte correlación lineal positiva.

Fuerte correlación lineal negativa.

116

No hay correlación.

Existe correlación, pero esta no es lineal. Coeficiente de correlación lineal simple: Expresión cuantitativa que expresa el grado de correlación lineal entre dos variables. Varía entre –1 y +1 (ambos incluidos). Un valor igual a +1 indica correlación positiva perfecta y un valor de –1 correlación negativa perfecta, un valor de cero indica inexistencia de asociación entre las variables. El coeficiente de correlación lineal simple se denota como:

ρ (ro) = Coeficiente de

correlación poblacional y r = Coeficiente de correlación muestral.

El valor de r (para una muestra), se obtiene de:

117

r=

n

n

n

1

1

1

n.∑ X .Y − ∑ X .∑ Y  n 2  n 2   n 2  n 2  n.∑ X −  ∑ X  .n.∑ Y −  ∑ Y    1    1  1    1

Tabla para los valores de r: De 0,00 a +/- 0,2 Muy bajo De +/- 0,21 a +/- 0,4 Bajo De +/- 0,41 a +/- 0,7 Sustancial De +/- 0,71 a +/- 1,00Alto

Ej. ;En una finca dedicada a la explotación de aves para consumo de huevos, se desea estudiar el grado de asociación entre las variables: Peso de las gallinas y peso de sus huevos. Con este propósito se toma una muestra de 5 gallinas y se obtiene la siguiente información. Peso

aves

(kg)

Peso

huevos

X2

Y2

X.Y

(gr) X

Y 1,50

60

2,25

3600

90

1,35

57

1,8225

3249

76,95

1,20

40

1,44

1600

48

1,35

56

1,8225

3136

75,6

1,70

62

2,89

3844

105,4

∑ = 7,1

∑ = 275

∑ = 10 ,225

∑ = 15429

∑ = 395,95

Sustituyendo valores:

r=

5.(395,95) − (7,1)( . 275)

[5.(10,225) − (7,1) ].[5.(15429) − (275) ] 2

r=

2

27,25 = 0,83 32,96665

118

Como se puede observar existe una alta correlación lineal positiva entre las variables. Cuando aumenta el peso de las aves, también aumenta el peso de los huevos. INFERENCIA ACERCA DEL COEFICIENTE DE CORRELACION LINEAL: Una vez calculado el coeficiente de correlación lineal, para datos provenientes de una muestra, es necesario determinar si existe asociación lineal entre las dos variables estudiadas, en la población de donde fueron muestreadas. Esta determinación se efectúa con un contraste de hipótesis. El procedimiento sería, como a continuación se detalla:

H0 : ρ = 0 1)

HA : ρ ≠ 0

La hipótesis indica que: las dos variables no están relacionadas linealmente. La hipótesis alternativa indica que: existe evidencia de una dependencia lineal entre las dos variables de la población. 2) Nivel de significación: Los más comunes son

α = 0,01 yα = 0,05 .

3)Región de rechazo: Se puede demostrar que cuando

t=

ρ = 0 , la variable:

r 1− r2 n−2

Tiene una distribución t, con n-2 grados de libertad, debido a esto se puede emplear la tabla de t para comprobar la significación de r.

119

tt (α / 2, n − 2 )

− tt (α / 2, n − 2 ) 4) Estadístico de prueba:

tC =

r 1− r2 n−2

Donde: n= Número de pares de observaciones. r= Coeficiente de correlación lineal muestral. 5)Decisión: Si

tc ≥ tt (α / 2, n − 2 )

ó

− tc ≤ −tt (α / 2, n − 2 ) ,

se

rechaza H0, en favor de HA, es decir, existe correlación lineal entre las dos variables. Ej.: Dado un coeficiente de correlación muestral calculado de r = -0,98 y n = 12.

H0 : ρ = 0 1)

HA : ρ ≠ 0

2) Se asumirá

α = 0,05 .

3) Áreas de rechazo:

120

t t (α / 2, n − 2) = 2,228

− t t (α / 2, n − 2) = −2,28

α / 2 = 0,05 / 2 = 0,025 y n-2 = 12-2 = 10. 4) Estadístico de prueba:

tC =

5) Decisión: Dado que

− 0,98 1 − (− 0.98) 10

2

=

− 3,099 = −15,57 0,19899

− tC ≤ −tt (0,025;10 )

ó

− 15,57 ≤ −2,228 ,

Se

rechaza la hipótesis nula y se acepta la hipótesis alternativa. 6) Conclusión: Existe asociación lineal simple negativa entre las dos variables que se están estudiando.

121

REGRESION LINEAL SIMPLE La regresión lineal simple es la relación funcional entre una variable dependiente o variable de respuesta (Y) y una variable independiente o explicativa (X). Dicha relación funcional está representada por una recta, en el caso de la regresión lineal. A diferencia de la correlación lineal simple, en el caso de la regresión la variable Y (dependiente), es una variable aleatoria y la variable X no es aleatoria. Se tratará de ilustrar esta particularidad con un ejemplo: Supóngase que se tiene una población, donde interesa observar el peso (Y) y altura (X), de un grupo de individuos, si estos individuos se agrupan de acuerdo con determinadas alturas (Ej: Los individuos que midan 168 cm, los que midan 170 cm, etc), la característica de esta población es que los valores de la variable X se han fijado o determinado previamente (variables no aleatorias), si de cada grupo se eligen al azar individuos y se registra su peso y altura, se estaría en presencia de un problema de regresión lineal simple. Los valores de la variable Y dependen o están condicionados por los valores previamente fijados de la variable X. En el caso de la correlación se tomarían individuos al azar (sin agruparlos previamente según su altura) y se anotarían el peso y altura de cada uno (ambas variables serían, por lo tanto, aleatorias). Se mencionó al principio que la relación funcional entre las variables X e Y, es una línea recta y esta puede representarse a través de la siguiente expresión:

y = a + bx Donde: y = Valor predicho de la variable dependiente (Y), para un valor dado de la variable X. a = Intercepto u ordenada en el origen. b = pendiente de la recta de regresión.

122

x = Valor de la variable X. Tanto a como b, se denominan coeficientes o parámetros de regresión. Utilizando el método de los mínimos cuadrados, se obtienen las expresiones que permiten calcular a y b.

b=

n

n

n

1

1

1

n.∑ X .Y − ∑ X .∑ Y  n  2 n.∑ X −  ∑ X  1  1  n

a = Y − b. X

2

;

Donde:

Y = Media aritmética de los valores de Y. X = Media aritmética de los valores de X. Ej.: Se tiene una población hipotética de individuos, como la mostrada a continuación, donde las variables estudiadas son la estatura (variable independiente X, en pulgadas) y el peso (variable Y dependiente, en libras). X pulgadas

Y libras

50

40

41

42

43

44

51

41

43

44

46

46

52

41

44

45

48

52

53

43

46

47

49

55

54

44

46

49

51

60

De cada grupo de estatura se elegirá, al azar, un individuo, tal como se muestra en la siguiente tabla:

123

X Estatura

Y Peso 50

40

51

46

52

44

53

55

54

49

Para obtener la ecuación de regresión se calculan los parámetros a y b, para ello se amplía la tabla anterior, del siguiente modo: Estatura X

Peso Y 50

40

51

46

52

44

53

55

54

49

Σ = 260

X2

X. Y

Σ = 234

2000

2500

2346

2601

2288

2704

2915

2809

2646

2916

Σ = 12195

Σ = 13530

Sustituyendo valores en la expresión para calcular la pendiente de la recta de regresión:

X =

260 234 = 52 ; Y = = 46,8 5 5

b=

5.12195 − 260.234 135 = = 2,7 5.13530 − 2602 50

a = 46,8 − 2,7.52 = −93,6

124

La ecuación de la recta de regresión, es:

y = −93,6 + 2,7.x

Interpretación de los valores de los parámetros de regresión a y b: b = Pendiente de la recta de regresión. En que cantidad se incrementa o disminuye (de acuerdo con el signo que tenga el coeficiente), la variable dependiente (Y), cuando la variable independiente (X), se incrementa en una unidad. En el ejemplo, b = 2,7, esto significa que por cada incremento de una pulgada en la estatura de los individuos, el peso se incrementará (debido a que el signo del coeficiente b es positivo), en 2,7 libras. a = Punto en el cuál la línea de regresión cruza o corta el eje de coordenadas Y, en otras palabras el valor que adquiere Y, cuando X es igual a cero. Es importante destacar, que cuando se hagan predicciones acerca del valor de Y, con base en un valor de X, se debe estar seguro que el valor de X está dentro del dominio de los valores de X observados. En el ejemplo el valor de X = 0, está fuera del dominio de valores de los datos (el dominio va de 50 pulgadas a 54 pulgadas), para un valor de X = 0 pulgadas, obtenemos un valor de estatura de Y = -93,6 libras, el cual es un valor no razonable. Uso de la ecuación de regresión para hacer predicciones: El análisis de regresión calcula una ecuación que produce valores de Y para valores dados de X. Uno de los principales objetivos del análisis de regresión es hacer predicciones. Por ejemplo predecir el volumen de ventas que tendrá una empresa, tomando como base los recursos invertidos en publicidad. Ej.: ¿Cuál será el peso de un individuo cuya estatura es de 52,5 pulgadas?. Se procede a sustituir el valor de 52,5 pulgadas, en la ecuación de regresión.

125

y = −93,6 + 2,7.x

;

y = −93,6 + 2,7.(52,5)

y = −93,6 + 141,75

;

y = 48,15libras . El valor

predicho o pronosticado es de 48,15 libras. Para trazar la recta de regresión, es necesario localizar dos puntos en el diagrama de dispersión, haciendo uso para ello, de la ecuación de regresión, Ej: Se introducen, en la ecuación de regresión, los valores de 50 y 54, en sustitución de la variable X.

y = −93,6 + 2,7.(50) = 41,4 y = −93,6 + 2,7.(54) = 52,2 Regresión de pesos VS Estaturas de individuos 54

Recta de regresión 52

Libras

50 48 46 44 42 40 49

50

51

52

53

54

55

Pulgadas

(50; 41,2) y (54; 52,2) puntos extremos de la recta de regresión.

ERROR ESTÁNDAR DE ESTIMACIÓN: Es una medida de la dispersión o variabilidad de los datos observados, con respecto a la línea de regresión. Se denota como Se.

126

n

Se =

2 ( ) y y − ∑ i e 1

n−2

Donde:

yi = Valores observados de la variable dependiente. ye = Valores predichos (utilizando la ecuación de

regresión), de la variable

dependiente. Ej: Se utilizará el ejemplo de las estaturas y pesos, con el cual se venía abordando el tema de regresión. 2 Estatura X Peso Y y = −93,6 + 2,7.x

yi − ye

50 51 52 53 54

Se =

40

( yi − ye )

y = −93,6 + 2,7.(50 ) = 41,4

-1,4

1,96

44,1

1,9

3,61

46,8

-2,8

7,84

49,5

5,5

30,25

52,2

-3,2

10,24 ∑ 53,9

46 44 55 49

53,9 53,9 = = 17,96666667 = 4,24 5−2 3

Interpretación del error estándar de estimación: Mientras mayor sea el error de estimación, mayor será la dispersión de los datos observados, alrededor de la línea de regresión. Si Se es igual a cero (Se = 0), esto implica que la ecuación de regresión es un estimador perfecto de la variable dependiente (Y), en otras palabras, todas las observaciones se encontraran en la recta de regresión.

127

PRUEBA DE HIPÓTESIS RESPECTO A LA PENDIENTE DE LA LINEA DE REGRESIÓN: Los valores utilizados para calcular la recta de regresión, generalmente provienen de una muestra. Por lo tanto, se debe comprobar, por medio de una prueba de hipótesis, si el coeficiente poblacional (β = Beta ), que representa la pendiente de la recta de regresión, es igual o diferente de cero. Si

β =0

, esto significa que X es

irrelevante en la predicción de Y. Prueba de hipótesis:

H0 : β = 0

1)

HA : β ≠ 0

β = Coeficiente

que representa a la recta de regresión

poblacional. 2)Nivel de significación; Los más comúnmente utilizados son:

α = 0,01 .

α = 0,05

y

3)Regiones de aceptación y de rechazo de H0:

Área de aceptación de H0

− tt (α / 2, n − 2 )

tt (α / 2, n − 2 )

4)Estadístico de prueba:

tC =

b−β Sβ

Donde: β = 0 , según lo establece la hipótesis nula

128



= Desviación estándar estimada de la pendiente de la línea de regresión.

Sβ =

Se

∑ (X − X ) n

2

1

Se = Error estándar de estimación. 5)Decisión:

tc ≥ tt (α / 2, n − 2 )

Si

ó

− tc ≤ −tt (α / 2, n − 2 ) ,

Se rechaza la

hipótesis nula, es decir existe una relación funcional lineal entre la variable dependiente (Y) y la variable independiente (X). Ej. Se utilizarán los datos del ejemplo utilizado para el cálculo de la recta de regresión.

H0 : β = 0 1)

HA : β ≠ 0

2)

α = 0,01 .

3)

129

t t (α / 2, n − 2) = 5,84

− t t (α / 2, n − 2 ) = −5,84

α 0,01 = = 0,005 ; n − 2 = 5 − 2 = 3 . 2 2 4)Estadístico de prueba:

S e = 4,24

X = 52 pu lg adas Estatura X

(x − X )

xi − X

2

i

50 -2

4

-1

1

0

0

1

1

2

4

51 52 53 54

Sβ =

∑ = 10

4,24 4,24 = = 1,341 3 , 16 10

tc =

2,7 = 2,01 1,341

5)Decisión: Dado que el estadístico de prueba se ubica en la zona de aceptación de la hipótesis nula, no se rechaza dicha hipótesis.

130

6)Conclusión: Al nivel de significación del 0,01. La evidencia indica que no existe una relación lineal entre el peso de los individuos (Y) y su talla (X). La pendiente de la recta de mejor ajuste, en la población, es igual a cero.

131

BIBLIOGRAFÍA Croxton F y Cowden D; Estadística general aplicada; 1965 6ª edición en castellano; Fondo de cultura económica; México DF. Dixon W y Massey F; Introducción al análisis estadístico; 1974 2ª edición; Instituto Cubano del libro; La Habana. Facultad de Agronomía UCV; Estadística (mimeografía); 1980; Maracay Venezuela. Glass G y Stanley j; Métodos estadísticos aplicados a las ciencias sociales; 1973; México DF. Jonson, R; Estadística elemental; Editorial Íbero América; 1990 1ª Edición en castellano; México DF. Levin R Y Rubin D; Estadística para administradores; Prentice Hall; 1996 6ª edición; México DF. Lison L; Estadística aplicada a la biología experimental; 1976; Eudeba; Buenos Aires. Mendoza José; Bioestadística problemas resueltos; 1988; 1ª edición; Universidad de los Andes; Venezuela. Mosquera G; Hipótesis estadística con aplicaciones; 1974 2ª edición; Diseño y composición litográfica S.A; México DF. Panse V y Sukhatme; Métodos estadísticos para investigadores agrícolas; 1959; Fondo de cultura económica; México DF. Ponce Manuel; Curso básico de estadística aplicada; 1996; Caracas. Raposo M; Investigación e inferencia; 1990; Universidad de los Andes; Venezuela. Snedecor W y Cochran W; Métodos estadísticos; 1971 1ª edición en castellano; Editorial Continental; México DF. Sokal R y Rohlf J; Biometry; 1996; Freeman and company; San Francisco; USA. Spiegel M; Estadística; 1970 1ª edición en castellano; McGraw-Hill; Bogotá. Taro Yamane; Estadística; Editorial Harla; 1979 3ª Edición; México DF. Walpole R y Meyers R; Probabilidad y estadística; 1992 3ª edición; México DF.

132

Related Documents

Apuntes De A 181006
November 2019 5
Apuntes De Ion Inorganic A
November 2019 7
Apuntes
October 2019 72
Apuntes
June 2020 45
Apuntes
May 2020 43