Estadistica Primera Parte.docx

  • Uploaded by: Milton Tinoco Briones
  • 0
  • 0
  • June 2020
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Estadistica Primera Parte.docx as PDF for free.

More details

  • Words: 4,979
  • Pages: 17
UNIVERSIDAD RICARDO PALMA CURSO: ESTADISTICA Y PROBABILIDADES

FACULTAD DE INGENIERIA

ESTADISTICA E INGENIERIA LA ESTADÍSTICA se ha hecho sentir en todos los campos y/o especialidades como en la ingeniería, en la administración, y en la industria. Se aplica en la producción, en el uso de materiales y fuerza de trabajo, en el desarrollo de nuevos productos, etc. LA ESTADÍSTICA se considera como una herramienta de la ingeniería ya que sin ella no se puede apreciar, entender, comprender o aplicar parte de los trabajos que se realizan en su campo. El método estadístico en ingeniería se puede utilizar de diferentes formas. Como para:  estimar el coeficiente de dilatación térmica de un metal  Comparar la resistencia de dos aleaciones.  En el control de calidad, con sus respectivos diagramas (medias, desviaciones), calidad de producción de masa, problemas de inspección muestral, etc.  En la aplicación de la confiabilidad de los productos.  En el área de la investigación de operaciones usan la teoría de probabilidad y estadística en forma general.

ESTADISTICA Es una ciencia que usa un conjunto de métodos y/o técnicas que son necesarias para RECOLECTAR, RESUMIR, CLASIFICAR, ANALIZAR e INTERPRETAR, el comportamiento de los datos con respecto a una característica materia de estudio. Es decir que se encarga de obtener información para describirla y luego la usa para predecir "algo" de ella. División de la Estadística: 1.- Estadística Descriptiva 2.- Estadística Inferencial

1.- ESTADISTICA DESCRIPTIVA.Se conoce como el conjunto de métodos usados para la RECOLECCIÓN, PRESENTACIÓN Y CARACTERIZACIÓN de un conjunto de datos. En conclusión la estadística descriptiva, ANALIZA Y DESCRIBE los datos.

2.- ESTADISTICA INFERENCIAL.Es la encargada de la PREDICCIÓN DE ALGO. Es la que posibilita la toma de decisiones en base a una información parcial obtenida mediante técnicas descriptivas. Usa el cálculo de la probabilidad, en las decisiones.

CONCEPTOS BASICOS DE LA ESTADISTICA 1.- POBLACION Es el conjunto total de individuos, objetos u entes que tienen determinadas características que se puede estudiar. Ejemplo: todas las personas (tienen razas, sexo, religión, edad, talla, idiomas, peso, nacionalidad etc.) Todos los estudiantes de la URP. (¿Que tienen en común?)

La Población puede ser: Finita.- cuando los elementos se pueden contar, o el número de elementos que la conforman se puede determinar. Ejemplo: - Todos los alumnos de la URP - Toda la producción de tornillos durante un mes Infinita.- cuando el número de elementos que la conforman no se puede determinar. Ejemplo: - Todas las estrella del firmamento - Todos los árboles de la selva peruana.

Lic. América Paula Campomanes Morán

1

UNIVERSIDAD RICARDO PALMA CURSO: ESTADISTICA Y PROBABILIDADES

FACULTAD DE INGENIERIA

2.- MUESTRA.Es una parte relativamente pequeña de la población, o también se define como un subconjunto de la población. Ejemplo: Un grupo de 500 alumnos de la URP

3.- UNIDAD ESTADISTICA.Es un solo elemento de la población o muestra. Ejemplo: un alumno de la URP

4.-CARACTERISTICA (VARIABLE) Es lo que le interesa al investigador para su estudio o trabajo La característica es la propiedad de los fenómenos y puede tomar diferentes valores Ejemplo: Edad, sexo, peso, cociente intelectual, ventas. LA VARIABLE.-Está relacionada con la características y se denota con letras mayúsculas del alfabeto, X, Y, Z. Las variables pueden ser: - CUALITATIVA.Se refiere a la cualidad que presenta un fenómeno (se expresa en palabras) - DISCRETA.Son valores enteros. - CONTINUA. Son infinitos valores que se encuentran entre dos números.

5.- TIPOS DE DATOS Depende de la característica (variable) y se dividen en:  Datos cualitativos  Datos cuantitativos. Datos Cualitativos.Son atributos o cualidades que solo se expresan en forma literal. Ejemplo: Especialidad, lugar de origen, etc. Estos se dividen en nominales y ordinales. Datos Cuantitativos.Son expresiones numéricas, y se dividen en: 1.- Cuantitativo Discreto.- Cuando los valores de los datos son enteros, y se obtiene por medio del conteo. Ejemplo: número de hermanos, números de hijos, números de cursos matriculados, números de créditos aprobados, etc. 2.- Cuantitativo Continuo.-Los valores que toman, pueden ser enteros y/o fraccionario, es decir entre dos números pueden tomar infinitos valores. Se obtienen por medio de la medición, duración o tiempo. Ejemplos: estatura, edad, peso, etc. DISTRIBUCION DE FRECUENCIAS. Es la presentación de la información de forma ordenada, en una tabla que contiene en forma general lo siguiente: I.- Variable o característica II.- Frecuencias que son seis (6): 1.- frecuencia absoluta (fi), 2.- frecuencia relativa (hi), 3.- frecuencia absoluta acumulada (Fi), 4.- frecuencias relativa acumulada (Hi), 5.frecuencia absoluta acumulada decreciente (F’i), 6.- frecuencias relativa acumulada decreciente (H’i). Frecuencia absoluta (fi).- se obtiene de contar cuantas veces se repite cada valor de la variable. Como se obtiene por conteo, siempre es un valor entero. La suma de las frecuencias absolutas es igual al número total de datos (n) (∑fi = n)

Lic. América Paula Campomanes Morán

2

UNIVERSIDAD RICARDO PALMA CURSO: ESTADISTICA Y PROBABILIDADES

FACULTAD DE INGENIERIA

Frecuencias Relativa (hi).- se obtiene usando la operación de división (fi/n) y sus valores son expresados en forma decimal. La suma de las (hi) por definición es igual a 1.0000. (∑ hi = 1.0000) Frecuencia Absoluta acumulada (Fi).- se obtiene de sumar las frecuencias absolutas (fi) hasta un determinado valor de la variable. La primera frecuencia absoluta (F1) es igual a la primera frecuencia absoluta simple (f1) La última frecuencia absoluta (Fm) es igual al número total de datos (n). (Fm = n) Frecuencia Relativa acumulada (Hi).- se obtiene de sumar las frecuencias relativas (hi) hasta un determinado valor de la variable. La primera frecuencia relativa (H1) es igual a la primera frecuencia relativa simple (h1) La última frecuencia relativa (Hm) es igual a la unidad. Frecuencia Absoluta acumulada decreciente (F’i).- se obtiene de restar las frecuencias absolutas simples (fi) La primera frecuencia absoluta acumulada (F’1) es igual a “n” (Donde n = número total de datos) (F’1 = n) La última frecuencia absoluta acumulada (F’m) es igual a “fm” Frecuencia Relativa acumulada decreciente (H’i).- se obtiene de restar las frecuencias relativas simple (hi). La primera frecuencia relativa acumulada (H’1) es igual a “1.000” (H’1 = 1.0000) La última frecuencia relativa acumulada (H’m) es igual a “hm”

DISTRIBUCION DE FRECUENCIAS EN FORMA GENERAL Variable Xi X1 X2 X3 X4 X5 Xm TOTALES

Frec. Absoluta fi f1 f2 f3 f4 f5 fm n=

Frec. Relativa hi h1 h2 h3 h4 h5 hm 1.00

FRECUENCIAS ACUMULADAS Fi Hi F´i H'i F1 H1 F’1 H’1 F2 H2 F’2 H’2 F3 H3 F’3 H’3 F4 H4 F’4 H’4 F5 H5 F’5 H’5 Fm Hm F’m H’m

TIPOS DE DISTRIBUCIONES DE FRECUENCIAS Está relacionada con los tipos de datos y son tres (3) I.-DISTRIBUCION DE FRECUENCIAS PARA DATOS CUALITATIVOS La distribución de frecuencias para este tipo de datos contiene : 1.- variable o característica 2.- Frecuencia absoluta, frecuencia relativa y porcentaje. Grafico adecuado es el circular, aunque también se puede graficar el de barra o bastones.

Lic. América Paula Campomanes Morán

3

UNIVERSIDAD RICARDO PALMA CURSO: ESTADISTICA Y PROBABILIDADES

FACULTAD DE INGENIERIA

Frecuencia Absoluta (fi)

Frecuencia Relativa (hi)

Porcentajes ( % )

X1 X2

f1 f2

h1 h2

% %

X3 : :

f3

h3

Xm TOTALES

fm n = ∑ fi

hm 1.0000

Variable

(Xi)

% 100%

Ejemplo: Se seleccionan 60 estudiantes de la facultad de Ingeniería y se le pregunta su especialidad, las respuestas que se obtienen son las siguientes: C C C

E C M

C M M

C C H

M E E

M C C

I I M

M I E

E C I

M E F

M F M

E F M

E F I

M E E

M I F

I F I

I F I

C I C

C C C

C E C

Leyenda: C= Civil, E= Electrónica, I= Industrial, F= Informática, M= Mecatrónica. a) b) c) d) e)

Se pide formar la distribución de frecuencias. Grafico circular de frecuencia absoluta y frecuencia relativa Dar el valor y significado de f2 y h4 Graficar una barra porcentual Graficar una barra de frecuencia absoluta.

II. DISTRIBUCION DE FRECUENCIAS PARA DATOS CUANTITATIVO DISCRETO.Gráficos adecuados: Barras o bastones para (fi y hi) y las escaleras para las acumuladas (Fi, Hi, F’i, H’i)

Variable Xi X1 X2 X3

Frec. Absoluta fi f1 f2 f3

Xm TOTALES

fm n = ∑ fi

Frec. Relativa hi h1 h2 h3

FRECUENCIAS ACUMULADAS Fi Hi F´i H'i

hm 1.00

Ejemplo.- A un grupo de estudiantes de ingeniería se le pregunta sobre el número de cursos aprobados y las respuestas son las siguientes: 3 2 5

2 3 5

3 6 4

5 4 3

6 2 3

1 4 4

3 2 6

2 4 1

Lic. América Paula Campomanes Morán

5 5 2

6 2 3

4 3 4

6 3 3

1 4 5

2 2 4

3 3 6

4 2 4

4

UNIVERSIDAD RICARDO PALMA CURSO: ESTADISTICA Y PROBABILIDADES

a) b) c) d) e) f) g) h)

FACULTAD DE INGENIERIA

Se pide formar la distribución de frecuencias. Graficar la frecuencia absoluta y frecuencia relativa. Formar la distribución de frecuencias relativas. Graficar una escalera porcentual Formar la distribución de frecuencias absolutas Graficar una escalera decreciente de frecuencia absoluta Dar valor y significado de f2 , h4, F3 , F´4. H`3. Graficar la frecuencia absoluta acumulada creciente

III. DISTRIBUCION DE FRECUENCIAS PARA DATOS CUANTITATIVO CONTINUO.Gráficos adecuados: 1.-Histogramas, 2.- polígonos de frecuencias. (Para las frecuencias simples (fi y hi)) 3.-Ojivas (Para las frecuencias acumuladas crecientes y decrecientes (Fi , Hi, F´i , H´i ))

Intervalos

marca clase

Frec. Absoluta

Frec. Relativa

X'i-1 - X'i

Xi

fi

hi

TOTAL

n = ∑ fi

Frecuencias Acumuladas Fi

Hi

F'i

H'i

1.0000

INTERVALOS Tipos de intervalos: - cerrados [ ] - semicerrados: por la derecha ( ] Por la izquierda [ ) Tipos de Límites.- Límites Aparentes (cuando los intervalos son cerrados) - Límites Reales de Clase (cuando los intervalos son semicerrados) Proceso de obtención de los intervalos: I.- Determinar: El número menor (X min.) El número mayor (X máx.) II.- Calcular el Rango o Recorrido ( R ) R = X max - X min III.- Determinar el número de intervalos (m )  Regla de Sturgen: m = 1 + 3.322 lóg.n  Empírico: m = √ n Propiedad.- “m” siempre es un número entero IV.- Calcular la Amplitud ( C ) de cada intervalo También se le conoce como distancia de cada intervalo C = R m

Lic. América Paula Campomanes Morán

5

UNIVERSIDAD RICARDO PALMA CURSO: ESTADISTICA Y PROBABILIDADES

FACULTAD DE INGENIERIA

Propiedad.- La magnitud de la amplitud debe de ser igual al de los datos originales. (X min. y X máx.) V.- Corrección (D) D = (m)*(C) – R  D > 0. Satisface la amplitud (C) y el número de intervalos (m) y la diferencia se reparte equitativamente en los extremos ( X min y X máx.)  D < 0. Se tiene que efectuar 2 correcciones. En D1 solo se corrige la amplitud (C corregido) En D2 solo se corrige el número de intervalo (m corregido) De los 2 se escoge el que tiene el valor menor.  D = 0. Satisface la amplitud (C) y el número de intervalos (m) y se forma los intervalos con los X min. y X máx. iniciales. Ejemplo.-Los siguientes datos corresponden a los pesos de 45 alumnos y los resultados se muestran a continuación: 60 67 72

75 53 75

a) b) c) d) e) f) g) h) i)

68 68 61

76 72 63

70 90 74

72 75 63

78 79 73

58 87 81

65 83 75

73 85 79

79 69 59

67 69 71

67 72 84

59 79 73

62 71 84

Elaborar la distribución de frecuencias (usando la regla de sturgen) Graficar un histograma de frecuencia absoluta Graficar un polígono de frecuencia absoluta Graficar un polígono porcentual Formar una distribución de frecuencias absolutas Graficar una ojiva porcentual creciente Graficar una ojiva de frecuencia relativa decreciente graficar una ojiva de frecuencia absoluta decreciente Dar valor y significado a f3, h5, H4, H´2

DISTRIBUCIONES CON DOS ( 2) VARIABLES Cuando se trabajan con 2 variables (o Características) toman el nombre de DISTRIBUCIONES BIDIMENSIONALES DE FRECUENCIAS Son tablas donde se presenta en forma ordenada dos características de cada individuo o elementos que se desee estudiar o investigar. Por ejemplo: edad y peso; estatura y peso; número de hijos y nivel educativo de los padres; edad y estado civil; producción y venta etc. Cada frecuencia es un par ordenado (X, Y) Una variable es independiente y se le denota con (X) y la otra variable es dependiente y se le denota con ( Y ) Existen 4 cuadros de distribución bidimensional de frecuencias 1.- Distribución Bidimensional de frecuencias absolutas (fxy). (Tiene marginales) 2.- Distribución Bidimensional de frecuencias relativas (hxy). (Tiene marginales) 3.- Distribución Bidimensional de frecuencia absoluta acumulada (Fxy), no tiene marginales

Lic. América Paula Campomanes Morán

6

UNIVERSIDAD RICARDO PALMA CURSO: ESTADISTICA Y PROBABILIDADES

FACULTAD DE INGENIERIA

4.- Distribución Bidimensional de frecuencias relativa acumulada (Hxy), No tiene marginales 1.- Distribución Bidimensional de frecuencias absolutas (fxy). (Tiene marginales)

X1

X2

...

XJ

f .y

y1

f11

f21

...

fj1

fy1

y2

f12

f22

...

fj2

fy2

f13

f23

fj3

fy3

f24 f2k

fj4

yk

f14 f1k

fjk

fy4 fyk

f x.

fx1

fx2

fxj

n

Y

\ X

...

Donde: (f x .) Se denota a la marginal de la variable X (f . y) se denota a la marginal de la variable Y ´n = es el número total de pares ordenados 2.- Distribución Bidimensional de frecuencias relativas (hxy). (Tiene marginales)

Y \ X

X2

X2

…..

Xj

h .y

Y1

h11

h21

…..

hj1

hy1

Y2

h12

h22

…..

hj2

hy2

h13

h23

…..

hj3

hy3

h14

h24

…..

hj4

hy4

Yk

h1k

h2k

…..

hjk

hyk

hx.

hx1

hx2

…..

hxk

1

MEDIDAS DE TENDENCIA CENTRAL 1.- MEDIA ARITMÉTICA.Es el promedio de un conjunto de datos (o Punto de Equilibrio). Se denota por “x raya” = ( X ) PARA DATOS NO TABULADO.La media aritmética es la suma de todos los valores de los datos de la muestra dividida por el número total de datos (n) _ FORMULA: X = ∑Xi N

Lic. América Paula Campomanes Morán

7

UNIVERSIDAD RICARDO PALMA CURSO: ESTADISTICA Y PROBABILIDADES

FACULTAD DE INGENIERIA

Ejemplo: los valores que se detallan corresponden a las cantidades cursos matriculados de 12 alumnos de la facultad de Ingeniería. 3 7 6 2 5 4 4 5 7 2 3 3 Calcular la media aritmética del número de cursos matriculados y exprese su significado e indique el tipo de variable y el tipo de dato. PARA DATOS TABULADOS.Es la sumatoria del producto de la variable con la frecuencia dividida por el número total de datos (n). _ FORMULA: X = ∑ Xifi n Ejemplo: En la siguiente distribución de frecuencias con seis intervalos de clase se muestran las ganancias en miles de soles, de un grupo de empresas de Lima. Ganancias 12.5 – 17.5 17.5 – 22.5 22.5 – 27.5 … … … Empresas 8 12 10 14 18 13 a) Calcule la media aritmética y exprese su significado PROPIEDADES P1.- La unidad de medida de la Media Aritmética es la misma que la unidad de las observaciones. P2.- La Media Aritmética es influenciada por todos los valores de la serie de datos. P3.- Si a cada valor de los datos, se le suma o resta una constante, la media aritmética del nuevo conjunto es igual a la media aritmética original más ó menos la constante. _____ __ Es decir: X±K = X±K P4.- Si a cada valor del conjunto de datos, se le multiplica por una constante, la media aritmética del nuevo conjunto es igual la Media Aritmética original multiplicado por la constante. _____ _ Es decir: X*K = K* X P5.- La suma algebraica de las desviaciones de cada valor de la variable con la media aritmética es igual a cero. _ ∑ (Xi - X) = 0 P6.- Dado dos (2) conjuntos de datos, cada uno con un número de observaciones, se puede obtener la Media Total, mediante la siguiente formula. _ __ XT = ∑ ni* xi. ∑ni

2.- MEDIANA Es un valor central, ya que divide a la distribución en dos partes iguales, cada parte tiene el valor de 50%. Se denota: Md PARA DATOS NO TABULADOS (pocos datos) Se obtiene de la siguiente forma: 1) Ordenar los valor de menor a mayor 2) Hay que determinar si el número de datos es par o impar entonces si:

Lic. América Paula Campomanes Morán

8

UNIVERSIDAD RICARDO PALMA CURSO: ESTADISTICA Y PROBABILIDADES

FACULTAD DE INGENIERIA



IMPAR.- ( n = impar). Entonces Md = X(n+1)/2



PAR.-

( n = par )

Entonces Md =1/2( Xn/2+ X(n+2)/2 )

Ejemplos: los pesos de ciertas cajas de un almacén se detallan a continuación: 55 62 72.5 48 60 68 44 Calcule su mediana y exprese su significado.

82

79

64.5

55.3

49.7

PARA DATOS TABULADOS a) 1.2.3.4.5.-

SIN INTERVALOS Calcular la Frecuencia Acumulada ( FJ ) Posición de la mediana ( n/2) Hallar el FJ (que es el valor inmediatamente superior a la posición de la mediana) Hallar el FJ-1 (valor anterior al FJ) Comparar el FJ-1 con n/2 Y se tiene 2 condiciones: (<) o (=) Entonces: Md = X J cuando el FJ-1 < n/2 Entonces: Md = ½ (X J + X J-1) cuando el Ejemplo: hoja adicional de problemas b) 1.2.3.4.5.6.7.-

FJ-1 = n/2

CON INTERVALOS Calcular la Frecuencia Acumulada (FJ) Posición de la mediana (n/2) Hallar el FJ Hallar el FJ-1 Hallar el lJ (es el límite real inferior de la recta del FJ) Calcular la amplitud ( CJ ) del intervalo de la recta de FJ Aplicar la FORMULA.- Md = lj + (n/2 – Fj-1) * Cj

( Fj – Fj-1 ) Ejemplo: El tiempo que demoran un grupo profesores en llegar a la universidad (en minutos), se muestra en la siguiente distribución de frecuencia acumulada. Tiempo(min.) 10 – 14 15 - 20 21 - 28 29 – 35 36 - 43 Profesores 1.00 0.87 0.52 0.29 0.12. Calcule la mediana y exprese su significado 3.- MODA Se denota “Mo” y se define de acuerdo a como se presente los datos: DATOS NO TABULADOS Es el valor de la variable que se repite más veces Ejemplo: DATOS TABULADOS: a)

SIN INTERVALOS Es el valor de la variable que tiene la frecuencia más alta

Ejemplo: a) 3, 9, 8, 7, 4, 4, 4,3, 9, 2

Lic. América Paula Campomanes Morán

9

UNIVERSIDAD RICARDO PALMA CURSO: ESTADISTICA Y PROBABILIDADES

FACULTAD DE INGENIERIA

b)23, 27, 54, 38, 40, 29, 10 b) CON INTERVALOS Es el valor de la variable donde tiende a concentrarse más la información y se obtiene con la siguiente FORMULA. Mo = lmo + ( ∆1 ) *Cmo (∆1 + ∆2 ) Ejemplo: hoja adicional de problemas 4.- CUANTILAS 4.1- CUARTILES Se denota “Qi ” Son tres ( 3 ) números que dividen a la distribución en cuatro partes iguales. Valor de cada parte es de 25 %. FORMULAS 1.- DATOS NOTABULADOS:

Qi = i(n+1)/4 2.- DATOS TABULADOS: Para datos tabulados la posición es: (in/4) donde (i = 1, 2,3) 1.- Tabulados sin Intervalos.-

Cuando Fj-1 < in/4 Cuando Fj-1 = in/4

entonces entonces

Qi = Xj Qi = (Xj + Xj-1) 2

2.- Tabulados con Intervalos.-

Qi = lj + (n/4 – Fj-1) * Cj ( Fj – Fj-1 ) Ejemplo: hoja adicional de problemas 4.2.- DECILES Se denota “Di” Son nueve (9 ) números que dividen a la distribución en 10 partes iguales. El valor de cada parte es de 10 % FORMULAs 1.- DATOS NOTABULADOS:

Di = i(n+1)/10 2.- DATOS TABULADOS: Para datos tabulados la posición es: (in / 10) donde ( i = 1,2,......,9) 1.- Tabulados sin Intervalos.-

Cuando Fj-1 < in/10 Cuando Fj-1 = in/10

Di = Xj Di = (Xj + Xj-1)/2

2.- Tabulados con Intervalos

Di = lj + (n/10 – Fj-1) * Cj ( Fj – Fj-1 ) Ejemplo: : hoja adicional de problemas 4.3-PERCENTILES Se denota Pi Son noventa y nueve (99) números que dividen a la distribución en 100 partes iguales. El valor de cada parte es 1 % FORMULAs

Lic. América Paula Campomanes Morán

10

UNIVERSIDAD RICARDO PALMA CURSO: ESTADISTICA Y PROBABILIDADES

FACULTAD DE INGENIERIA

1.- DATOS NOTABULADOS:

Pi = i(n+1)/100 2.- DATOS TABULADOS: Para datos tabulados la posición es: (in / 100 ) donde ( i= 1,2,....., 99 ) 1.- Tabulados sin Intervalos.-

Cuando Fj-1 < in/100 Cuando Fj-1 = in/100

Pi = X j Pi = ½ (Xj + Xj-1)

2.- Tabulados con Intervalos

Pi = lj + (in/100 – Fj-1) * Cj (Fj – Fj-1 ) Ejemplo: hoja adicional de problemas

MEDIDAS DE DISPERSION (También conocida como medidas de Variación). Tiende a medir el grado en que los datos numéricos que se encuentran alrededor de un valor central. I.- VARIANZA Se denota con “ V(X)” se define: “COMO LA MEDIA ARITMÉTICA DEL CUADRADO DE LAS DESVIACIONES DE LOS DATOS CON RESPECTO A LA MEDIA ARITMÉTICA DE ESOS DATOS”.

Es el grado promedio de dispersión al cuadrado. FORMULAS: 1.- DATOS SIN TABULAR __ V(x) = ∑(Xi – X)2 n 2.- DATOS TABULADOS __ V(x) = ∑(Xi – X)2 * fi n Ejemplo: hoja adicional de problemas PROPIEDADES 1.- La varianza siempre es un número NO NEGATIVO V (X) ≥ 0 2.- La varianza de una constante es igual a cero V (K) = 0 donde K = constante 3.- Si a cada valor de la serie de datos se le SUMA O RESTA una constante; la varianza de la nuevas serie de datos, es igual a la varianza original. V ( Xi ± K ) = V(X) ± V (K) = V(X) 4.- Si a cada valor de la serie de datos se le multiplica una constante; la varianza de la nueva serie de datos es igual a la varianza original multiplicado por la constante al cuadrado. V ( Xi *K ) = K2 V(X) 5.- Dado dos series de datos donde se conoce la media aritmética y la varianza de cada serie se puede calcular la varianza de las dos series mediante la siguiente formula: VT = ∑ni*Vi. ∑ni

Lic. América Paula Campomanes Morán

11

UNIVERSIDAD RICARDO PALMA CURSO: ESTADISTICA Y PROBABILIDADES

FACULTAD DE INGENIERIA

II.- DESVIACION Estándar Se define como la raíz cuadrada positiva de la varianza. Da un grado promedio simple de variación o dispersión. La unidad de media es la misma que la de los datos observados FORMULAS: a) DATOS SIN TABULAR __ S(x) = √ ∑(Xi – X)2 n b) DATOS TABULADOS __ S(x) = √ ∑(Xi – X)2 * fi n Ejemplo: Hoja adicional de Problemas PROPIEDADES 1.- Es siempre un valor positivo 2.- Es influenciado por todos los valores de la serie de datos. 3.- Mayor influencia ejerce los valores extremos que los que están cerca del promedio. 4.- Si la distribución es normal o ligeramente asimétrica se cumple la siguiente relación: _ X ± S = 68.23% = 68% _ X ± 2S = 95.46% = 95% _ X ± 3S = 99.73% = 99.7 CORRECCION DE SHEPPARD Se usa solo para datos agrupados con intervalos de amplitudes iguales. El factor de corrección es (C2 / 12) FORMULA V corregida = V(x) –

C2 12

Ejemplo: Hoja adicional de Problemas III.- RANGO (DESVIACION) SEMIINTERCUARTILICA Mide la dispersión entre el 50% de los valores centrales No está afectada por los valores extremos Una desviación semiintercuartilica baja, indica una pequeña variación entre el 50% de los datos centrales Se denota con RS RS = ( Q3 – Q1) 2 Ejemplo: Hoja adicional de Problemas IV.- COEFICIENTE DE VARIACIÓN ( C.V.) SE USA PARA COMPARAR DOS O MÁS MUESTRAS. Significa el número de veces que supone la desviación típica (estándar) con respecto a la media aritmética. Generalmente se expresa en porcentaje

Lic. América Paula Campomanes Morán

12

UNIVERSIDAD RICARDO PALMA CURSO: ESTADISTICA Y PROBABILIDADES

FACULTAD DE INGENIERIA

Es independiente de la unidad de medida en que están expresados los datos. Es mejor o aceptable la tiene menor coeficiente de variación. C.V. = ( S )*100 _ X Ejemplo: Hoja adicional de Problemas

MEDIDAS DE ASIMETRIA Nos indica la deformación horizontal de la distribución de frecuencia. -

La distribución es simétrica cuando su curva es igual a una campana, la media aritmética, la mediana y la moda coinciden. Grafico.

-

La distribución tiene asimetría positiva (a la derecha).- si su ramificación es extendida hacia la derecha o hacia los valores mayores. Grafico:

-

La distribución tiene asimetría negativa (a la izquierda) la ramificación extendida hacia la izquierda o hacia los valores pequeños. Grafico:

I.- PRIMER COEFICIENTE DE PEARSON Se denota A1, nos indica el sesgo de la distribución Se usa cuando la distribución es unimodal. Formula: _ A1 = (X – Mo) S Propiedades: A1 = 0 la distribución es simétrica A1 > 0 la distribución tiene sesgo positivo ó esta sesgada a la derecha. A1 < 0 la distribución tiene sesgo negativo ó está sesgada a la izquierda. Ejemplo: Hoja adicional de Problemas

II.- SEGUNDO COEFICIENTE DE PEARSON. Se denota con A2, nos indica el sesgo de la distribución Se usa cuando se tiene más de una moda o cuando no exista moda. Formula: _ A2 = 3 * (X – Md) S Propiedades: A2 = 0 la distribución es simétrica A2 > 0 la distribución tiene sesgo positivo ó esta sesgada a la derecha. A2 < 0 la distribución tiene sesgo negativo ó está sesgada a la izquierda.

Lic. América Paula Campomanes Morán

13

UNIVERSIDAD RICARDO PALMA CURSO: ESTADISTICA Y PROBABILIDADES

FACULTAD DE INGENIERIA

Ejemplo: Hoja adicional de Problemas

III.- MEDIA ASIMETRICA Se denota con ¨Asq¨ Se usa cuando los intervalos no tienen definidos los límites de los intervalos. Casos especiales de distribuciones. Formula: Asq = Q1 + Q3 – 2*Q2 Q3 – Q1 Propiedades: Asq. = 0 la distribución es simétrica Asq. > 0 la distribución tiene sesgo positivo ó esta sesgada a la derecha. Asq. < 0 la distribución tiene sesgo negativo ó está sesgada a la izquierda. Ejemplo: Hoja adicional de Problemas

MEDIDAS DE ANALISIS PARA 2 VARIABLE I.- DIAGRAMAS DE DISPERSIÓN.Es la representación gráfica de los datos en el sistema de coordenadas (x , y), además de determinar la relación que existe entre las dos variables, también nos puede indicar el tipo de tendencia de los elementos. TIPOS DE RELACION.a) Relación directa A medida que aumenta los valores de “x” también aumentan los valores de “y” (es decir tiene una forma ascendente). Gráfico:

b) Relación Inversa A medida que los valores de “x” son pequeños los valores de “y” son grandes y viceversa. (Su forma es descendente).Gráfico:

c) Relación nula Cuando los valores de “X” e “Y” están dispersos sin coordinación. Gráfico:

Lic. América Paula Campomanes Morán

14

UNIVERSIDAD RICARDO PALMA CURSO: ESTADISTICA Y PROBABILIDADES

FACULTAD DE INGENIERIA

d) Relación Directa Perfecta Cuando los valores de “X” e “Y” todos caen en una recta ascendente. Gráfico

e) Relación Inversa Perfecta Cuando los valores de “X” e “Y” todos caen en una recta descendente. Gráfico:

II. COEFICIENTE DE CORRELACION Es el estadígrafo que mide el grado de relación que existe entre dos variables que están relacionadas entre si, se denota por “ r ” El coeficiente de correlación siempre está dentro de un intervalo:

-1 ≤ r ≤ +1 PROPIEDADES: a) Si b) Si c) Si d) Si e) Si

r>0 r<0 r=0 r=1 r = -1

existe relación directa existe relación inversa existe relación nula existe relación directa perfecta existe relación inversa perfecta

FORMULA PARA DATOS NO TABULADOS

r = . n∑XY - ∑X∑Y . 2 2 2 2 √[n∑X – (∑X) ][n∑Y – (∑Y) ] ___ r=

C(X , Y)

donde

C(X,Y) = ∑XY

V(x) V(y)

- XY

n

Donde C (X,Y) ES LA COVARIANZA LA COVARIANZA, Mide el grado de dispersión o variación cuando se usan 2 variables (X,Y) que están relacionadas. Sus valores pueden ser positivos, negativos o cero

Lic. América Paula Campomanes Morán

15

UNIVERSIDAD RICARDO PALMA CURSO: ESTADISTICA Y PROBABILIDADES

FACULTAD DE INGENIERIA

FORMULA PARA DATOS TABULADOS ___

C(X,Y) = ∑XYfxy n

- XY

Ejemplo: Hoja adicional de Problemas

III.-RECTA DE REGRESION DE MINIMOS CUADRADOS Nos permite estimar o predecir valores futuros o anteriores o aquellos valores que no están definidos dentro de la serie de datos. Existen dos rectas de regresión: 1.- Recta de Regresión de Y sobre X

2.- Recta de Regresión de X sobre Y a) Recta de Regresión de Y sobre X ŷ = a + b (x)

La ecuación es Donde: ´b =.

n∑XY - ∑X∑Y [n∑X2 – (∑X)2]

´a = Y – (b ) X

O también

b = C(X , Y) S(x)

b) Recta de Regresión de X sobre Y La ecuación es

X* = a + b (y)

Donde: ´b = .

n∑XY - ∑X∑Y [n∑Y2 – (∑Y)2]

´a = X – (b) Y O también se puede la siguiente formula b = C(X , Y) S(y)

Ejemplo: Hoja adicional de Problemas

Lic. América Paula Campomanes Morán

16

UNIVERSIDAD RICARDO PALMA CURSO: ESTADISTICA Y PROBABILIDADES

FACULTAD DE INGENIERIA

ESTIMAR DATOS QUE SIGUEN SERIE DE TIEMPO Se tiene que cambiar las variables tiempos (años, meses o días) por números naturales en forma consecutiva. (Ejem: 1, 2, 3, 4,…, etc.). La variable tiempo se considera como variable independiente(X). Ejemplo: la siguiente tabla nos muestra las ventas de equipos mecánicos durante 6 años Años Ventas a) b) c) d) e) f)

2010 3.3

2011 3.9

2012 4.7

2013 4.1

2014 4.9

2015 5.2

Estime la venta para el año 2016 Estime en que año la venta será de 6.1 miles de dólares. Grafique las 2 rectas. Sobre el diagrama de dispersión. Grado de relación que existe entre los años y la venta Calcular el valor promedio de la venta Use el diagrama de dispersión, para determinar la relación existe entre los años y la venta.

Lic. América Paula Campomanes Morán

17

Related Documents

Estadistica
November 2019 25
Estadistica
August 2019 43
Estadistica
June 2020 19

More Documents from "Pamela Yanina Tapara Suca"

June 2020 6
Apuntes Videos.docx
June 2020 2
Tablas.docx
June 2020 3
Datos Chinchina.xlsx
June 2020 2