UNIVERSIDAD RICARDO PALMA CURSO: ESTADISTICA Y PROBABILIDADES
FACULTAD DE INGENIERIA
ESTADISTICA E INGENIERIA LA ESTADÍSTICA se ha hecho sentir en todos los campos y/o especialidades como en la ingeniería, en la administración, y en la industria. Se aplica en la producción, en el uso de materiales y fuerza de trabajo, en el desarrollo de nuevos productos, etc. LA ESTADÍSTICA se considera como una herramienta de la ingeniería ya que sin ella no se puede apreciar, entender, comprender o aplicar parte de los trabajos que se realizan en su campo. El método estadístico en ingeniería se puede utilizar de diferentes formas. Como para: estimar el coeficiente de dilatación térmica de un metal Comparar la resistencia de dos aleaciones. En el control de calidad, con sus respectivos diagramas (medias, desviaciones), calidad de producción de masa, problemas de inspección muestral, etc. En la aplicación de la confiabilidad de los productos. En el área de la investigación de operaciones usan la teoría de probabilidad y estadística en forma general.
ESTADISTICA Es una ciencia que usa un conjunto de métodos y/o técnicas que son necesarias para RECOLECTAR, RESUMIR, CLASIFICAR, ANALIZAR e INTERPRETAR, el comportamiento de los datos con respecto a una característica materia de estudio. Es decir que se encarga de obtener información para describirla y luego la usa para predecir "algo" de ella. División de la Estadística: 1.- Estadística Descriptiva 2.- Estadística Inferencial
1.- ESTADISTICA DESCRIPTIVA.Se conoce como el conjunto de métodos usados para la RECOLECCIÓN, PRESENTACIÓN Y CARACTERIZACIÓN de un conjunto de datos. En conclusión la estadística descriptiva, ANALIZA Y DESCRIBE los datos.
2.- ESTADISTICA INFERENCIAL.Es la encargada de la PREDICCIÓN DE ALGO. Es la que posibilita la toma de decisiones en base a una información parcial obtenida mediante técnicas descriptivas. Usa el cálculo de la probabilidad, en las decisiones.
CONCEPTOS BASICOS DE LA ESTADISTICA 1.- POBLACION Es el conjunto total de individuos, objetos u entes que tienen determinadas características que se puede estudiar. Ejemplo: todas las personas (tienen razas, sexo, religión, edad, talla, idiomas, peso, nacionalidad etc.) Todos los estudiantes de la URP. (¿Que tienen en común?)
La Población puede ser: Finita.- cuando los elementos se pueden contar, o el número de elementos que la conforman se puede determinar. Ejemplo: - Todos los alumnos de la URP - Toda la producción de tornillos durante un mes Infinita.- cuando el número de elementos que la conforman no se puede determinar. Ejemplo: - Todas las estrella del firmamento - Todos los árboles de la selva peruana.
Lic. América Paula Campomanes Morán
1
UNIVERSIDAD RICARDO PALMA CURSO: ESTADISTICA Y PROBABILIDADES
FACULTAD DE INGENIERIA
2.- MUESTRA.Es una parte relativamente pequeña de la población, o también se define como un subconjunto de la población. Ejemplo: Un grupo de 500 alumnos de la URP
3.- UNIDAD ESTADISTICA.Es un solo elemento de la población o muestra. Ejemplo: un alumno de la URP
4.-CARACTERISTICA (VARIABLE) Es lo que le interesa al investigador para su estudio o trabajo La característica es la propiedad de los fenómenos y puede tomar diferentes valores Ejemplo: Edad, sexo, peso, cociente intelectual, ventas. LA VARIABLE.-Está relacionada con la características y se denota con letras mayúsculas del alfabeto, X, Y, Z. Las variables pueden ser: - CUALITATIVA.Se refiere a la cualidad que presenta un fenómeno (se expresa en palabras) - DISCRETA.Son valores enteros. - CONTINUA. Son infinitos valores que se encuentran entre dos números.
5.- TIPOS DE DATOS Depende de la característica (variable) y se dividen en: Datos cualitativos Datos cuantitativos. Datos Cualitativos.Son atributos o cualidades que solo se expresan en forma literal. Ejemplo: Especialidad, lugar de origen, etc. Estos se dividen en nominales y ordinales. Datos Cuantitativos.Son expresiones numéricas, y se dividen en: 1.- Cuantitativo Discreto.- Cuando los valores de los datos son enteros, y se obtiene por medio del conteo. Ejemplo: número de hermanos, números de hijos, números de cursos matriculados, números de créditos aprobados, etc. 2.- Cuantitativo Continuo.-Los valores que toman, pueden ser enteros y/o fraccionario, es decir entre dos números pueden tomar infinitos valores. Se obtienen por medio de la medición, duración o tiempo. Ejemplos: estatura, edad, peso, etc. DISTRIBUCION DE FRECUENCIAS. Es la presentación de la información de forma ordenada, en una tabla que contiene en forma general lo siguiente: I.- Variable o característica II.- Frecuencias que son seis (6): 1.- frecuencia absoluta (fi), 2.- frecuencia relativa (hi), 3.- frecuencia absoluta acumulada (Fi), 4.- frecuencias relativa acumulada (Hi), 5.frecuencia absoluta acumulada decreciente (F’i), 6.- frecuencias relativa acumulada decreciente (H’i). Frecuencia absoluta (fi).- se obtiene de contar cuantas veces se repite cada valor de la variable. Como se obtiene por conteo, siempre es un valor entero. La suma de las frecuencias absolutas es igual al número total de datos (n) (∑fi = n)
Lic. América Paula Campomanes Morán
2
UNIVERSIDAD RICARDO PALMA CURSO: ESTADISTICA Y PROBABILIDADES
FACULTAD DE INGENIERIA
Frecuencias Relativa (hi).- se obtiene usando la operación de división (fi/n) y sus valores son expresados en forma decimal. La suma de las (hi) por definición es igual a 1.0000. (∑ hi = 1.0000) Frecuencia Absoluta acumulada (Fi).- se obtiene de sumar las frecuencias absolutas (fi) hasta un determinado valor de la variable. La primera frecuencia absoluta (F1) es igual a la primera frecuencia absoluta simple (f1) La última frecuencia absoluta (Fm) es igual al número total de datos (n). (Fm = n) Frecuencia Relativa acumulada (Hi).- se obtiene de sumar las frecuencias relativas (hi) hasta un determinado valor de la variable. La primera frecuencia relativa (H1) es igual a la primera frecuencia relativa simple (h1) La última frecuencia relativa (Hm) es igual a la unidad. Frecuencia Absoluta acumulada decreciente (F’i).- se obtiene de restar las frecuencias absolutas simples (fi) La primera frecuencia absoluta acumulada (F’1) es igual a “n” (Donde n = número total de datos) (F’1 = n) La última frecuencia absoluta acumulada (F’m) es igual a “fm” Frecuencia Relativa acumulada decreciente (H’i).- se obtiene de restar las frecuencias relativas simple (hi). La primera frecuencia relativa acumulada (H’1) es igual a “1.000” (H’1 = 1.0000) La última frecuencia relativa acumulada (H’m) es igual a “hm”
DISTRIBUCION DE FRECUENCIAS EN FORMA GENERAL Variable Xi X1 X2 X3 X4 X5 Xm TOTALES
Frec. Absoluta fi f1 f2 f3 f4 f5 fm n=
Frec. Relativa hi h1 h2 h3 h4 h5 hm 1.00
FRECUENCIAS ACUMULADAS Fi Hi F´i H'i F1 H1 F’1 H’1 F2 H2 F’2 H’2 F3 H3 F’3 H’3 F4 H4 F’4 H’4 F5 H5 F’5 H’5 Fm Hm F’m H’m
TIPOS DE DISTRIBUCIONES DE FRECUENCIAS Está relacionada con los tipos de datos y son tres (3) I.-DISTRIBUCION DE FRECUENCIAS PARA DATOS CUALITATIVOS La distribución de frecuencias para este tipo de datos contiene : 1.- variable o característica 2.- Frecuencia absoluta, frecuencia relativa y porcentaje. Grafico adecuado es el circular, aunque también se puede graficar el de barra o bastones.
Lic. América Paula Campomanes Morán
3
UNIVERSIDAD RICARDO PALMA CURSO: ESTADISTICA Y PROBABILIDADES
FACULTAD DE INGENIERIA
Frecuencia Absoluta (fi)
Frecuencia Relativa (hi)
Porcentajes ( % )
X1 X2
f1 f2
h1 h2
% %
X3 : :
f3
h3
Xm TOTALES
fm n = ∑ fi
hm 1.0000
Variable
(Xi)
% 100%
Ejemplo: Se seleccionan 60 estudiantes de la facultad de Ingeniería y se le pregunta su especialidad, las respuestas que se obtienen son las siguientes: C C C
E C M
C M M
C C H
M E E
M C C
I I M
M I E
E C I
M E F
M F M
E F M
E F I
M E E
M I F
I F I
I F I
C I C
C C C
C E C
Leyenda: C= Civil, E= Electrónica, I= Industrial, F= Informática, M= Mecatrónica. a) b) c) d) e)
Se pide formar la distribución de frecuencias. Grafico circular de frecuencia absoluta y frecuencia relativa Dar el valor y significado de f2 y h4 Graficar una barra porcentual Graficar una barra de frecuencia absoluta.
II. DISTRIBUCION DE FRECUENCIAS PARA DATOS CUANTITATIVO DISCRETO.Gráficos adecuados: Barras o bastones para (fi y hi) y las escaleras para las acumuladas (Fi, Hi, F’i, H’i)
Variable Xi X1 X2 X3
Frec. Absoluta fi f1 f2 f3
Xm TOTALES
fm n = ∑ fi
Frec. Relativa hi h1 h2 h3
FRECUENCIAS ACUMULADAS Fi Hi F´i H'i
hm 1.00
Ejemplo.- A un grupo de estudiantes de ingeniería se le pregunta sobre el número de cursos aprobados y las respuestas son las siguientes: 3 2 5
2 3 5
3 6 4
5 4 3
6 2 3
1 4 4
3 2 6
2 4 1
Lic. América Paula Campomanes Morán
5 5 2
6 2 3
4 3 4
6 3 3
1 4 5
2 2 4
3 3 6
4 2 4
4
UNIVERSIDAD RICARDO PALMA CURSO: ESTADISTICA Y PROBABILIDADES
a) b) c) d) e) f) g) h)
FACULTAD DE INGENIERIA
Se pide formar la distribución de frecuencias. Graficar la frecuencia absoluta y frecuencia relativa. Formar la distribución de frecuencias relativas. Graficar una escalera porcentual Formar la distribución de frecuencias absolutas Graficar una escalera decreciente de frecuencia absoluta Dar valor y significado de f2 , h4, F3 , F´4. H`3. Graficar la frecuencia absoluta acumulada creciente
III. DISTRIBUCION DE FRECUENCIAS PARA DATOS CUANTITATIVO CONTINUO.Gráficos adecuados: 1.-Histogramas, 2.- polígonos de frecuencias. (Para las frecuencias simples (fi y hi)) 3.-Ojivas (Para las frecuencias acumuladas crecientes y decrecientes (Fi , Hi, F´i , H´i ))
Intervalos
marca clase
Frec. Absoluta
Frec. Relativa
X'i-1 - X'i
Xi
fi
hi
TOTAL
n = ∑ fi
Frecuencias Acumuladas Fi
Hi
F'i
H'i
1.0000
INTERVALOS Tipos de intervalos: - cerrados [ ] - semicerrados: por la derecha ( ] Por la izquierda [ ) Tipos de Límites.- Límites Aparentes (cuando los intervalos son cerrados) - Límites Reales de Clase (cuando los intervalos son semicerrados) Proceso de obtención de los intervalos: I.- Determinar: El número menor (X min.) El número mayor (X máx.) II.- Calcular el Rango o Recorrido ( R ) R = X max - X min III.- Determinar el número de intervalos (m ) Regla de Sturgen: m = 1 + 3.322 lóg.n Empírico: m = √ n Propiedad.- “m” siempre es un número entero IV.- Calcular la Amplitud ( C ) de cada intervalo También se le conoce como distancia de cada intervalo C = R m
Lic. América Paula Campomanes Morán
5
UNIVERSIDAD RICARDO PALMA CURSO: ESTADISTICA Y PROBABILIDADES
FACULTAD DE INGENIERIA
Propiedad.- La magnitud de la amplitud debe de ser igual al de los datos originales. (X min. y X máx.) V.- Corrección (D) D = (m)*(C) – R D > 0. Satisface la amplitud (C) y el número de intervalos (m) y la diferencia se reparte equitativamente en los extremos ( X min y X máx.) D < 0. Se tiene que efectuar 2 correcciones. En D1 solo se corrige la amplitud (C corregido) En D2 solo se corrige el número de intervalo (m corregido) De los 2 se escoge el que tiene el valor menor. D = 0. Satisface la amplitud (C) y el número de intervalos (m) y se forma los intervalos con los X min. y X máx. iniciales. Ejemplo.-Los siguientes datos corresponden a los pesos de 45 alumnos y los resultados se muestran a continuación: 60 67 72
75 53 75
a) b) c) d) e) f) g) h) i)
68 68 61
76 72 63
70 90 74
72 75 63
78 79 73
58 87 81
65 83 75
73 85 79
79 69 59
67 69 71
67 72 84
59 79 73
62 71 84
Elaborar la distribución de frecuencias (usando la regla de sturgen) Graficar un histograma de frecuencia absoluta Graficar un polígono de frecuencia absoluta Graficar un polígono porcentual Formar una distribución de frecuencias absolutas Graficar una ojiva porcentual creciente Graficar una ojiva de frecuencia relativa decreciente graficar una ojiva de frecuencia absoluta decreciente Dar valor y significado a f3, h5, H4, H´2
DISTRIBUCIONES CON DOS ( 2) VARIABLES Cuando se trabajan con 2 variables (o Características) toman el nombre de DISTRIBUCIONES BIDIMENSIONALES DE FRECUENCIAS Son tablas donde se presenta en forma ordenada dos características de cada individuo o elementos que se desee estudiar o investigar. Por ejemplo: edad y peso; estatura y peso; número de hijos y nivel educativo de los padres; edad y estado civil; producción y venta etc. Cada frecuencia es un par ordenado (X, Y) Una variable es independiente y se le denota con (X) y la otra variable es dependiente y se le denota con ( Y ) Existen 4 cuadros de distribución bidimensional de frecuencias 1.- Distribución Bidimensional de frecuencias absolutas (fxy). (Tiene marginales) 2.- Distribución Bidimensional de frecuencias relativas (hxy). (Tiene marginales) 3.- Distribución Bidimensional de frecuencia absoluta acumulada (Fxy), no tiene marginales
Lic. América Paula Campomanes Morán
6
UNIVERSIDAD RICARDO PALMA CURSO: ESTADISTICA Y PROBABILIDADES
FACULTAD DE INGENIERIA
4.- Distribución Bidimensional de frecuencias relativa acumulada (Hxy), No tiene marginales 1.- Distribución Bidimensional de frecuencias absolutas (fxy). (Tiene marginales)
X1
X2
...
XJ
f .y
y1
f11
f21
...
fj1
fy1
y2
f12
f22
...
fj2
fy2
f13
f23
fj3
fy3
f24 f2k
fj4
yk
f14 f1k
fjk
fy4 fyk
f x.
fx1
fx2
fxj
n
Y
\ X
...
Donde: (f x .) Se denota a la marginal de la variable X (f . y) se denota a la marginal de la variable Y ´n = es el número total de pares ordenados 2.- Distribución Bidimensional de frecuencias relativas (hxy). (Tiene marginales)
Y \ X
X2
X2
…..
Xj
h .y
Y1
h11
h21
…..
hj1
hy1
Y2
h12
h22
…..
hj2
hy2
h13
h23
…..
hj3
hy3
h14
h24
…..
hj4
hy4
Yk
h1k
h2k
…..
hjk
hyk
hx.
hx1
hx2
…..
hxk
1
MEDIDAS DE TENDENCIA CENTRAL 1.- MEDIA ARITMÉTICA.Es el promedio de un conjunto de datos (o Punto de Equilibrio). Se denota por “x raya” = ( X ) PARA DATOS NO TABULADO.La media aritmética es la suma de todos los valores de los datos de la muestra dividida por el número total de datos (n) _ FORMULA: X = ∑Xi N
Lic. América Paula Campomanes Morán
7
UNIVERSIDAD RICARDO PALMA CURSO: ESTADISTICA Y PROBABILIDADES
FACULTAD DE INGENIERIA
Ejemplo: los valores que se detallan corresponden a las cantidades cursos matriculados de 12 alumnos de la facultad de Ingeniería. 3 7 6 2 5 4 4 5 7 2 3 3 Calcular la media aritmética del número de cursos matriculados y exprese su significado e indique el tipo de variable y el tipo de dato. PARA DATOS TABULADOS.Es la sumatoria del producto de la variable con la frecuencia dividida por el número total de datos (n). _ FORMULA: X = ∑ Xifi n Ejemplo: En la siguiente distribución de frecuencias con seis intervalos de clase se muestran las ganancias en miles de soles, de un grupo de empresas de Lima. Ganancias 12.5 – 17.5 17.5 – 22.5 22.5 – 27.5 … … … Empresas 8 12 10 14 18 13 a) Calcule la media aritmética y exprese su significado PROPIEDADES P1.- La unidad de medida de la Media Aritmética es la misma que la unidad de las observaciones. P2.- La Media Aritmética es influenciada por todos los valores de la serie de datos. P3.- Si a cada valor de los datos, se le suma o resta una constante, la media aritmética del nuevo conjunto es igual a la media aritmética original más ó menos la constante. _____ __ Es decir: X±K = X±K P4.- Si a cada valor del conjunto de datos, se le multiplica por una constante, la media aritmética del nuevo conjunto es igual la Media Aritmética original multiplicado por la constante. _____ _ Es decir: X*K = K* X P5.- La suma algebraica de las desviaciones de cada valor de la variable con la media aritmética es igual a cero. _ ∑ (Xi - X) = 0 P6.- Dado dos (2) conjuntos de datos, cada uno con un número de observaciones, se puede obtener la Media Total, mediante la siguiente formula. _ __ XT = ∑ ni* xi. ∑ni
2.- MEDIANA Es un valor central, ya que divide a la distribución en dos partes iguales, cada parte tiene el valor de 50%. Se denota: Md PARA DATOS NO TABULADOS (pocos datos) Se obtiene de la siguiente forma: 1) Ordenar los valor de menor a mayor 2) Hay que determinar si el número de datos es par o impar entonces si:
Lic. América Paula Campomanes Morán
8
UNIVERSIDAD RICARDO PALMA CURSO: ESTADISTICA Y PROBABILIDADES
FACULTAD DE INGENIERIA
IMPAR.- ( n = impar). Entonces Md = X(n+1)/2
PAR.-
( n = par )
Entonces Md =1/2( Xn/2+ X(n+2)/2 )
Ejemplos: los pesos de ciertas cajas de un almacén se detallan a continuación: 55 62 72.5 48 60 68 44 Calcule su mediana y exprese su significado.
82
79
64.5
55.3
49.7
PARA DATOS TABULADOS a) 1.2.3.4.5.-
SIN INTERVALOS Calcular la Frecuencia Acumulada ( FJ ) Posición de la mediana ( n/2) Hallar el FJ (que es el valor inmediatamente superior a la posición de la mediana) Hallar el FJ-1 (valor anterior al FJ) Comparar el FJ-1 con n/2 Y se tiene 2 condiciones: (<) o (=) Entonces: Md = X J cuando el FJ-1 < n/2 Entonces: Md = ½ (X J + X J-1) cuando el Ejemplo: hoja adicional de problemas b) 1.2.3.4.5.6.7.-
FJ-1 = n/2
CON INTERVALOS Calcular la Frecuencia Acumulada (FJ) Posición de la mediana (n/2) Hallar el FJ Hallar el FJ-1 Hallar el lJ (es el límite real inferior de la recta del FJ) Calcular la amplitud ( CJ ) del intervalo de la recta de FJ Aplicar la FORMULA.- Md = lj + (n/2 – Fj-1) * Cj
( Fj – Fj-1 ) Ejemplo: El tiempo que demoran un grupo profesores en llegar a la universidad (en minutos), se muestra en la siguiente distribución de frecuencia acumulada. Tiempo(min.) 10 – 14 15 - 20 21 - 28 29 – 35 36 - 43 Profesores 1.00 0.87 0.52 0.29 0.12. Calcule la mediana y exprese su significado 3.- MODA Se denota “Mo” y se define de acuerdo a como se presente los datos: DATOS NO TABULADOS Es el valor de la variable que se repite más veces Ejemplo: DATOS TABULADOS: a)
SIN INTERVALOS Es el valor de la variable que tiene la frecuencia más alta
Ejemplo: a) 3, 9, 8, 7, 4, 4, 4,3, 9, 2
Lic. América Paula Campomanes Morán
9
UNIVERSIDAD RICARDO PALMA CURSO: ESTADISTICA Y PROBABILIDADES
FACULTAD DE INGENIERIA
b)23, 27, 54, 38, 40, 29, 10 b) CON INTERVALOS Es el valor de la variable donde tiende a concentrarse más la información y se obtiene con la siguiente FORMULA. Mo = lmo + ( ∆1 ) *Cmo (∆1 + ∆2 ) Ejemplo: hoja adicional de problemas 4.- CUANTILAS 4.1- CUARTILES Se denota “Qi ” Son tres ( 3 ) números que dividen a la distribución en cuatro partes iguales. Valor de cada parte es de 25 %. FORMULAS 1.- DATOS NOTABULADOS:
Qi = i(n+1)/4 2.- DATOS TABULADOS: Para datos tabulados la posición es: (in/4) donde (i = 1, 2,3) 1.- Tabulados sin Intervalos.-
Cuando Fj-1 < in/4 Cuando Fj-1 = in/4
entonces entonces
Qi = Xj Qi = (Xj + Xj-1) 2
2.- Tabulados con Intervalos.-
Qi = lj + (n/4 – Fj-1) * Cj ( Fj – Fj-1 ) Ejemplo: hoja adicional de problemas 4.2.- DECILES Se denota “Di” Son nueve (9 ) números que dividen a la distribución en 10 partes iguales. El valor de cada parte es de 10 % FORMULAs 1.- DATOS NOTABULADOS:
Di = i(n+1)/10 2.- DATOS TABULADOS: Para datos tabulados la posición es: (in / 10) donde ( i = 1,2,......,9) 1.- Tabulados sin Intervalos.-
Cuando Fj-1 < in/10 Cuando Fj-1 = in/10
Di = Xj Di = (Xj + Xj-1)/2
2.- Tabulados con Intervalos
Di = lj + (n/10 – Fj-1) * Cj ( Fj – Fj-1 ) Ejemplo: : hoja adicional de problemas 4.3-PERCENTILES Se denota Pi Son noventa y nueve (99) números que dividen a la distribución en 100 partes iguales. El valor de cada parte es 1 % FORMULAs
Lic. América Paula Campomanes Morán
10
UNIVERSIDAD RICARDO PALMA CURSO: ESTADISTICA Y PROBABILIDADES
FACULTAD DE INGENIERIA
1.- DATOS NOTABULADOS:
Pi = i(n+1)/100 2.- DATOS TABULADOS: Para datos tabulados la posición es: (in / 100 ) donde ( i= 1,2,....., 99 ) 1.- Tabulados sin Intervalos.-
Cuando Fj-1 < in/100 Cuando Fj-1 = in/100
Pi = X j Pi = ½ (Xj + Xj-1)
2.- Tabulados con Intervalos
Pi = lj + (in/100 – Fj-1) * Cj (Fj – Fj-1 ) Ejemplo: hoja adicional de problemas
MEDIDAS DE DISPERSION (También conocida como medidas de Variación). Tiende a medir el grado en que los datos numéricos que se encuentran alrededor de un valor central. I.- VARIANZA Se denota con “ V(X)” se define: “COMO LA MEDIA ARITMÉTICA DEL CUADRADO DE LAS DESVIACIONES DE LOS DATOS CON RESPECTO A LA MEDIA ARITMÉTICA DE ESOS DATOS”.
Es el grado promedio de dispersión al cuadrado. FORMULAS: 1.- DATOS SIN TABULAR __ V(x) = ∑(Xi – X)2 n 2.- DATOS TABULADOS __ V(x) = ∑(Xi – X)2 * fi n Ejemplo: hoja adicional de problemas PROPIEDADES 1.- La varianza siempre es un número NO NEGATIVO V (X) ≥ 0 2.- La varianza de una constante es igual a cero V (K) = 0 donde K = constante 3.- Si a cada valor de la serie de datos se le SUMA O RESTA una constante; la varianza de la nuevas serie de datos, es igual a la varianza original. V ( Xi ± K ) = V(X) ± V (K) = V(X) 4.- Si a cada valor de la serie de datos se le multiplica una constante; la varianza de la nueva serie de datos es igual a la varianza original multiplicado por la constante al cuadrado. V ( Xi *K ) = K2 V(X) 5.- Dado dos series de datos donde se conoce la media aritmética y la varianza de cada serie se puede calcular la varianza de las dos series mediante la siguiente formula: VT = ∑ni*Vi. ∑ni
Lic. América Paula Campomanes Morán
11
UNIVERSIDAD RICARDO PALMA CURSO: ESTADISTICA Y PROBABILIDADES
FACULTAD DE INGENIERIA
II.- DESVIACION Estándar Se define como la raíz cuadrada positiva de la varianza. Da un grado promedio simple de variación o dispersión. La unidad de media es la misma que la de los datos observados FORMULAS: a) DATOS SIN TABULAR __ S(x) = √ ∑(Xi – X)2 n b) DATOS TABULADOS __ S(x) = √ ∑(Xi – X)2 * fi n Ejemplo: Hoja adicional de Problemas PROPIEDADES 1.- Es siempre un valor positivo 2.- Es influenciado por todos los valores de la serie de datos. 3.- Mayor influencia ejerce los valores extremos que los que están cerca del promedio. 4.- Si la distribución es normal o ligeramente asimétrica se cumple la siguiente relación: _ X ± S = 68.23% = 68% _ X ± 2S = 95.46% = 95% _ X ± 3S = 99.73% = 99.7 CORRECCION DE SHEPPARD Se usa solo para datos agrupados con intervalos de amplitudes iguales. El factor de corrección es (C2 / 12) FORMULA V corregida = V(x) –
C2 12
Ejemplo: Hoja adicional de Problemas III.- RANGO (DESVIACION) SEMIINTERCUARTILICA Mide la dispersión entre el 50% de los valores centrales No está afectada por los valores extremos Una desviación semiintercuartilica baja, indica una pequeña variación entre el 50% de los datos centrales Se denota con RS RS = ( Q3 – Q1) 2 Ejemplo: Hoja adicional de Problemas IV.- COEFICIENTE DE VARIACIÓN ( C.V.) SE USA PARA COMPARAR DOS O MÁS MUESTRAS. Significa el número de veces que supone la desviación típica (estándar) con respecto a la media aritmética. Generalmente se expresa en porcentaje
Lic. América Paula Campomanes Morán
12
UNIVERSIDAD RICARDO PALMA CURSO: ESTADISTICA Y PROBABILIDADES
FACULTAD DE INGENIERIA
Es independiente de la unidad de medida en que están expresados los datos. Es mejor o aceptable la tiene menor coeficiente de variación. C.V. = ( S )*100 _ X Ejemplo: Hoja adicional de Problemas
MEDIDAS DE ASIMETRIA Nos indica la deformación horizontal de la distribución de frecuencia. -
La distribución es simétrica cuando su curva es igual a una campana, la media aritmética, la mediana y la moda coinciden. Grafico.
-
La distribución tiene asimetría positiva (a la derecha).- si su ramificación es extendida hacia la derecha o hacia los valores mayores. Grafico:
-
La distribución tiene asimetría negativa (a la izquierda) la ramificación extendida hacia la izquierda o hacia los valores pequeños. Grafico:
I.- PRIMER COEFICIENTE DE PEARSON Se denota A1, nos indica el sesgo de la distribución Se usa cuando la distribución es unimodal. Formula: _ A1 = (X – Mo) S Propiedades: A1 = 0 la distribución es simétrica A1 > 0 la distribución tiene sesgo positivo ó esta sesgada a la derecha. A1 < 0 la distribución tiene sesgo negativo ó está sesgada a la izquierda. Ejemplo: Hoja adicional de Problemas
II.- SEGUNDO COEFICIENTE DE PEARSON. Se denota con A2, nos indica el sesgo de la distribución Se usa cuando se tiene más de una moda o cuando no exista moda. Formula: _ A2 = 3 * (X – Md) S Propiedades: A2 = 0 la distribución es simétrica A2 > 0 la distribución tiene sesgo positivo ó esta sesgada a la derecha. A2 < 0 la distribución tiene sesgo negativo ó está sesgada a la izquierda.
Lic. América Paula Campomanes Morán
13
UNIVERSIDAD RICARDO PALMA CURSO: ESTADISTICA Y PROBABILIDADES
FACULTAD DE INGENIERIA
Ejemplo: Hoja adicional de Problemas
III.- MEDIA ASIMETRICA Se denota con ¨Asq¨ Se usa cuando los intervalos no tienen definidos los límites de los intervalos. Casos especiales de distribuciones. Formula: Asq = Q1 + Q3 – 2*Q2 Q3 – Q1 Propiedades: Asq. = 0 la distribución es simétrica Asq. > 0 la distribución tiene sesgo positivo ó esta sesgada a la derecha. Asq. < 0 la distribución tiene sesgo negativo ó está sesgada a la izquierda. Ejemplo: Hoja adicional de Problemas
MEDIDAS DE ANALISIS PARA 2 VARIABLE I.- DIAGRAMAS DE DISPERSIÓN.Es la representación gráfica de los datos en el sistema de coordenadas (x , y), además de determinar la relación que existe entre las dos variables, también nos puede indicar el tipo de tendencia de los elementos. TIPOS DE RELACION.a) Relación directa A medida que aumenta los valores de “x” también aumentan los valores de “y” (es decir tiene una forma ascendente). Gráfico:
b) Relación Inversa A medida que los valores de “x” son pequeños los valores de “y” son grandes y viceversa. (Su forma es descendente).Gráfico:
c) Relación nula Cuando los valores de “X” e “Y” están dispersos sin coordinación. Gráfico:
Lic. América Paula Campomanes Morán
14
UNIVERSIDAD RICARDO PALMA CURSO: ESTADISTICA Y PROBABILIDADES
FACULTAD DE INGENIERIA
d) Relación Directa Perfecta Cuando los valores de “X” e “Y” todos caen en una recta ascendente. Gráfico
e) Relación Inversa Perfecta Cuando los valores de “X” e “Y” todos caen en una recta descendente. Gráfico:
II. COEFICIENTE DE CORRELACION Es el estadígrafo que mide el grado de relación que existe entre dos variables que están relacionadas entre si, se denota por “ r ” El coeficiente de correlación siempre está dentro de un intervalo:
-1 ≤ r ≤ +1 PROPIEDADES: a) Si b) Si c) Si d) Si e) Si
r>0 r<0 r=0 r=1 r = -1
existe relación directa existe relación inversa existe relación nula existe relación directa perfecta existe relación inversa perfecta
FORMULA PARA DATOS NO TABULADOS
r = . n∑XY - ∑X∑Y . 2 2 2 2 √[n∑X – (∑X) ][n∑Y – (∑Y) ] ___ r=
C(X , Y)
donde
C(X,Y) = ∑XY
V(x) V(y)
- XY
n
Donde C (X,Y) ES LA COVARIANZA LA COVARIANZA, Mide el grado de dispersión o variación cuando se usan 2 variables (X,Y) que están relacionadas. Sus valores pueden ser positivos, negativos o cero
Lic. América Paula Campomanes Morán
15
UNIVERSIDAD RICARDO PALMA CURSO: ESTADISTICA Y PROBABILIDADES
FACULTAD DE INGENIERIA
FORMULA PARA DATOS TABULADOS ___
C(X,Y) = ∑XYfxy n
- XY
Ejemplo: Hoja adicional de Problemas
III.-RECTA DE REGRESION DE MINIMOS CUADRADOS Nos permite estimar o predecir valores futuros o anteriores o aquellos valores que no están definidos dentro de la serie de datos. Existen dos rectas de regresión: 1.- Recta de Regresión de Y sobre X
2.- Recta de Regresión de X sobre Y a) Recta de Regresión de Y sobre X ŷ = a + b (x)
La ecuación es Donde: ´b =.
n∑XY - ∑X∑Y [n∑X2 – (∑X)2]
´a = Y – (b ) X
O también
b = C(X , Y) S(x)
b) Recta de Regresión de X sobre Y La ecuación es
X* = a + b (y)
Donde: ´b = .
n∑XY - ∑X∑Y [n∑Y2 – (∑Y)2]
´a = X – (b) Y O también se puede la siguiente formula b = C(X , Y) S(y)
Ejemplo: Hoja adicional de Problemas
Lic. América Paula Campomanes Morán
16
UNIVERSIDAD RICARDO PALMA CURSO: ESTADISTICA Y PROBABILIDADES
FACULTAD DE INGENIERIA
ESTIMAR DATOS QUE SIGUEN SERIE DE TIEMPO Se tiene que cambiar las variables tiempos (años, meses o días) por números naturales en forma consecutiva. (Ejem: 1, 2, 3, 4,…, etc.). La variable tiempo se considera como variable independiente(X). Ejemplo: la siguiente tabla nos muestra las ventas de equipos mecánicos durante 6 años Años Ventas a) b) c) d) e) f)
2010 3.3
2011 3.9
2012 4.7
2013 4.1
2014 4.9
2015 5.2
Estime la venta para el año 2016 Estime en que año la venta será de 6.1 miles de dólares. Grafique las 2 rectas. Sobre el diagrama de dispersión. Grado de relación que existe entre los años y la venta Calcular el valor promedio de la venta Use el diagrama de dispersión, para determinar la relación existe entre los años y la venta.
Lic. América Paula Campomanes Morán
17