Formulario-descriptiva.pdf

  • Uploaded by: Jorge Madrigal
  • 0
  • 0
  • August 2019
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Formulario-descriptiva.pdf as PDF for free.

More details

  • Words: 2,862
  • Pages: 5
FORMULARIO II.- ESTADISTICA DESCRIPTIVA Y MEDIDAS ESTADÍSTICAS IIA.- DISTRIBUCIONES DE FRECUENCIAS: Muestra el número (frecuencia) de elementos correspondientes a cada una de varias clases que no se traslapan. Datos cualitativos Telenovela Noticieros; clase categoría

o

Noticieros Deportivos Culturales Comedias Telenovelas total

frecuencia absoluta f i

frecuencia

f fr  i n

1 10  5  8 6 n=30

relativa

s; 6

frecuencia porcentual

f %  fr  100

0.0333 0.3333 0.1667 0.2667 0.2000 1.00



3.33% 33.33% 16.67% 26.67% 20.00% 100%

Comedias; 8

gráfica: barras Datos cuantitativos Construcción distribución de frecuencias 1.- Determinar el rango = dato mayor – dato menor 2.- determinar # clases  1  3.3  logn →redondear a entero

30 – 39 40 – 49 50 – 59 60 – 69 70 – 79 80 - 89 total



W

7 12 18 9 3 1 n=50

0.14 0.24 0.36 0.18 0.06 0.02 1



34.5 44.5 54.5 64.5 74.5 84.5

Culturales; 5

pastel

Gráficas:

rango →redondear según la precisión de los datos # clases 4.- formar las clases usando como li de la primera clase un número menor o igual que el dato menor. mi fa Clase fr fi Li a Ls

2.- Determinar

Deportivos ; 10

1

7 19 37 46 49 50

histograma: grafico de barras de ancho proporcional al tamaño de clase y altura proporcional a la frecuencia.

polígono de frecuencias: gráfico de líneas.

ojiva menor que: gráfico de líneas de la distribución de frecuencias acumuladas

50 45 40 35 30 25

20 15 10 5 0 29

39

49

59

69

79

89

Algunas formas características de distribución:

uniforme

sesgada hacia la derecha o positivamente asimétrica

normal o forma de campana

IIB.- MEDIDAS ESTADÍSTICAS: Medidas descriptivas para presentar de la tendencia central o la dispersión de una serie de datos. MEDIDAS DE TENDENCIA CENTRAL Igual que los promedios, la medida de tendencia central es un valor único que nos indica el punto medio o típico de los datos que cabe esperar. MEDIDA DATOS SIMPLES DATOS AGRUPADOS. (Distribuciones de frecuencias) ó NO AGRUPADOS EXCEL NO TIENE FUNCIONES PARA OBTENER

MEDIA ARITMÉTICA Es el más comúnmente usado. También llamado promedio o simplemente media.

x = media muestral

  media poblacional

Media de la muestra

x x



Media de la población

mi = punto medio de la clase i

n

x i =valor de cada observación

n =# elementos en el conjunto

MEDIDAS ESTADÍSTICAS CON DATOS AGRUPADOS





x 

i

m  f i

i

n

i

3. a) si i no es entero: El valor entero inmediato mayor que i indica la posición de la mediana b) Si i sí es entero, la mediana es el promedio de de los datos ubicados en los lugares los valores e i 1 EXCEL: =MEDIANA()

x

N

EXCEL: =PROMEDIO()   MEDIANA Md 1. Ordene los datos de manera ascendente Es el valor intermedio cuando los valores de los 2. Calcule un índice i n i datos se ordenan en forma ascendente. 2  se prefiere sobre la media cuando hay valores extremos (muy altos o muy bajos) en el conjunto de datos.

fi = frecuencia de clase

n = # elementos en el conjunto

 Aproxime su valor mediante el gráfico de ojiva

MODA Mo Se determina por inspección (buscamos el valor Es el valor de los datos que se presenta con más que más se presenta en el conjunto) frecuencia. Cuando hay dos o más modas en un EXCEL: =MODA() conjunto, los datos son llamados bimodales o multimodales. También puede ser que no haya moda.

Cuando los datos están agrupados, debemos suponer que la moda se halla en la clase que tenga más elementos, llamada Clase Modal.

MEDIDAS DE DISPERSION. Se usa el término dispersión para describir el grado en que una serie de valores varía respecto a su media. Los valores incluidos en un conjunto de datos usualmente varían en magnitud; algunos valores son pequeños y algunos son grandes. La variación de los valores es llamada Dispersión, y hay varios criterios para medirla: Una medida de dispersión es importante en dos modos: 1. Puede ser usada para mostrar el grado de variación de los valores en los datos 2. Puede ser usada para suplementar un promedio: si la dispersión es alta, el promedio no es significativo; si la dispersión es baja, el promedio se vuelve altamente significativo. RANGO R=(l.r.s. última clase)- (l.r.i. primera clase) R  valor máximo-valor mínimo Es La amplitud del intervalo en que están contenidos todos los datos observados. VARIANZA varianza muestral varianza muestral 2 2 Es una medida de la dispersión que emplea todos los fi  mi  x xi  x 2 datos para su cálculo. Es el promedio de las 2 s  s  desviaciones de los datos respecto a su media elevadas n 1 n 1 al cuadrado. Se mide en el cuadrado de las unidades EXCEL: =VAR() originales. s2= variancia muestral. varianza poblacional varianza poblacional 2= variancia poblacional. 2 2





2 

 



x

i

 

2 

N

EXCEL: =VARP() desviación estándar muestral

DESVIACIÓN ESTANDAR 2 Dispersión promedio de los datos alrededor de la xi  x media aritmética, se mide con las mismas unidades 2  s s  que las de los datos originales. n 1 Es la raíz cuadrada positiva de la varianza. n – 1 = grados de libertad. EXCEL: =DESVEST() desviación estándar poblacional





   2

s  s2 

i

 

N

 fi  m

 x

2

i

n 1

desviación estándar poblacional

  2 

 

2

i

 fi  m

desviación estándar muestral



x



 fi  m

i

 

2

N

N

EXCEL: =DESVESTP() MEDIDAS DE POSICIÓN Ó DE LOCALIZACIÓN. datos: P1 a P99.  Percentiles: limitan centésimas partes de los  Cuartiles: limitan cuartas partes de los datos: Q1, Q2, Q3 Nota: la mediana corresponde a Q2, a P50. PERCENTILES. El p-ésimo percentil es un valor tal que Cálculo del p-ésimo percentil por lo menos p porciento de las observaciones son 1. Ordene los datos de manera ascendente menores o iguales que p y (100 – p) porciento de las 2. Calcule un índice i  p  i   n observaciones son mayores o iguales que p. 100 

Aproxime su valor mediante el gráfico de ojiva

en donde p es el percentil de interés. 3. a) si i no es entero, se redondea. El valor entero inmediato mayor que i indica la posición del  percentil p-ésimo b) Si i sí es entero, el p-ésimo percentil es el promedio de los valores de los datos ubicados

i

en los lugares e i 1 EXCEL: =PERCENTIL(MATRIZ,K)

Q1 : i = 14 n Localización Q2 : i = 24 n Localización Q3 : i = 34 n

CUARTILES Valores que dividen los datos en cuatro partes: Q1= primer cuartil, Q2= segundo cuartil, Q3= tercer cuartil.

Aproxime su valor mediante el gráfico de ojiva

Localización

COEFICIENTE DE VARIACIÓN CV Es una medida de dispersión relativa. Para comparar la dispersión de variables que tienen distintas desviaciones estándar y distintos promedios.



 EXCEL: =CUARTIL(MATRIZ,CUARTIL) desviación estandar  C.V .  media aritmética 100 Indica lo grande que es la desviación  estándar en comparación con la media.



C.V . 

desviación estandar 100 media aritmética

APLICACIONES DE LA DESVIACIÓN ESTÁNDAR La desviación estándar nos permite determinar, con cierto grado de precisión, donde se sitúan los valores de una distribución en relación con la media. Cuando los valores de una serie de datos están concentrados cerca de su media, la desviación estándar es pequeña. REGLA EMPÍRICA: Para datos con distribución en forma de campana, se puede aplicar la regla empírica para determinar el porcentaje de elementos que debe estar dentro de determinada cantidad de desviaciones estándar respecto al promedio.  Aproximadamente 68.27% de los elementos están a menos de una desviación estándar de la media.  Aproximadamente 95.45% de los elementos están a menos de dos desviaciones estándar de la media.  Casi todos los elementos (99.73%) están a menos de tres desviaciones estándar de la media. Podemos medir con mayor precisión la proporción de elementos que caen dentro de intervalos específicos si estos están distribuidos normalmente, es decir, si la gráfica de la distribución es simétrica con forma de campana,   Md  Mo Distribución normal estándar

donde z 

xi  x ; s

se considera que cualquier elemento con valor z fuera del intervalo de 3 es un valor atípico.

 III.- REGRESIÓN LINEAL Y CORRELACIÓN. REGRESIÓN LINEAL SIMPLE: Nos interesa saber si dos variables cuantitativas Datos: un muestra de

n

pares ordenados

x x, y 

e

y

están asociadas, qué tan fuertemente lo están y como se asocian.

x  valor observado de la variable predictora o independiente y  valor observado de la variable a predecir o dependiente yˆ  valor de la variable dependiente, estimado mediante la ecuación de la línea de regresión, e   y  yˆ   residuo o error MÉTODO DE MÍNIMOS CUADRADOS PARA ESTIMAR LA LÍNEA DEL MEJOR AJUSTE Mediante excel:

yˆ  a  bx

Ecuación de la línea de regresión estimada:

La línea de regresión siempre pasa por el par ordenado a = intersección de la recta con el eje vertical

x, y 

a  y  bx

  xy  n  x  y b 2  x2  n  x

b = pendiente o inclinación de la recta

Insertar el gráfico de dispersión de los datos, Clic derecho en uno de los puntos de datos observados Agregar línea de tendencia Modelo lineal, Presentar la ecuación en el gráfico presentar r2 en el gráfico (r2 = coeficiente de determinación) =intercepción.eje(conocido_y,conocido_x)

Interpretación de la pendiente: representa el cambio promedio del valor de

=pendiente(conocido_y,conocido_x)

y

por cada unidad que aumenta x COEFICIENTE DE CORRELACIÓN DE PEARSON : Es una herramienta estadística que nos sirve para describir el grado de asociación entre dos variables. Su valor varía desde -1 hasta 1, el signo es el de la pendiente, su valor numérico informa la fuerza de la relación entre las variables, hasta una correlación perfecta en r=1 ó r=1.

r  xy

=Pearson(matriz1,matriz2)

  

 xy  n x y

2   2   x  n x  y 2  n y     



2

2



COEFICIENTE DE DETERMINACIÓN: r : corresponde al cuadrado del coeficiente de correlación; multiplicado por 100, Interpretación: nos informa qué porcentaje del valor de Y, está explicado por la  ecuación de regresión.

=coeficiente.r2(conocido_y,conocido_x)

IV. PROBABILIDAD Probabilidad de ocurrencia del evento A:

p A  

0 certeza # resultados favorables    # resultados posibles 1 certeza 

no

ocurrencia

de

ocurrencia

Al conjunto de todos los resultados de un experimento se llama espacio muestral S. Cada uno de los posibles resultados del experimento se llama punto muestral. Un subconjunto de uno o más resultados del espacio muestral se llama evento. TECNICAS DE CONTEO: Para determinar el número de formas en que ocurre un experimento o un evento, usando fórmulas o procedimientos sistemáticos. 1. Diagrama de árbol: Dispositivo gráfico útil para visualizar un experimento de varias etapas y enumerar los resultados posibles.. 2. 3.

n1  n 2    nk Permutaciones: Una permutación es cualquier arreglo u ordenación de todos o una parte de n elementos Técnica de conteo de etapas múltiples:

 4.

Permutaciones de r elementos tomados de n elementos elegibles: n Pr



n! , rn n  r!

=permutaciones(número, tamaño)

Combinaciones: Una combinación es un subconjunto de r objetos, tomado de un conjunto de n objetos elegibles. El orden de los elementos carece de importancia. El número de combinaciones es: nCr



n! r!n  r!

=combinat(número, tamaño)

 Métodos más comunes para asignar probabilidades:

N Número de resultados asociados con Ei Todos los resultados del experimento son pE i   E i  probables igualmente N Número de resultados posibles n E i número de veces que ocurre el evento Ei Se analiza como ha ocurrido el pE i    experimento en el pasado para calcular n Número de ensayos u observaciones probabilidades  Es una evaluación personal de la probabilidad de que ocurra un evento

Probabilidad clásica Probabilidad empírica o de frecuencia relativa Probabilidad subjetiva o de juicio



Reglas o requerimientos básicos para la asignación de probabilidades 1.

0  pEi   1

 pEi   1

2.-

3.-

pE1  E2   pE1   pE2 

Probabilidad marginal o simple.: Es una probabilidad sencilla; quiere decir que solo un evento puede llevarse a cabo, al margen de otros eventos o clasificaciones.

pA 

# resultados favorables f  # resultados posibles n

Ley aditiva: Sean A y B dos eventos de S, la probabilidad de que ocurra A ó B (ó ambos): p A  B  p A  p B , cuando A y B son mutuamente excluyentes.





 

 

p A  B   p A  pB   p A  B  , cuando A y B no son mutuamente excluyentes.

Ley multiplicativa: A y B se presenten al mismo tiempo o en sucesión. Sean A y B dos eventos de S, pA B  pA pB, si A y B son independientes.

pAB  pA pB A, si A y B no son independientes.

Probabilidad Condicional : la probabilidad de que ocurrencia del evento B, si se sabe que ha ocurrido el evento A, 

pB A 

 Si A y B son independientes,

pA  B ; pA

pB A  pB, o también pA  B  pA pB

VI. DISTRIBUCIONES DE PROBABILIDAD 

Distribución de probabilidad: describe como se espera que varíen los resultados de un experimento, si este se llevara a cabo: La distribución de  se distribuyen las probabilidades probabilidad de una variable aleatoria describe cómo de los diferentes valores de la variable aleatoria.  Variable aleatoria es aquella que asocia un valor numérico con cada resultado experimental posible. El valor numérico de la variable aleatoria depende del resultado del experimento. Se puede clasificar como discreta o continua, dependiendo de los valores numéricos que asume. Para variable aleatoria discrita,

Valor esperado,

E x      x  f x ,

varianza: Var  x   

2

donde

f (x)

es la probabilidad de ocurrencia del evento

x

  x     f x  2

DISTRIBUCIONES DISCRETAS DE PROBABILIDAD  DISTRIBUCION BINOMIAL: Para describir situaciones en las que tenemos fracaso, y los resultados de los ensayos son independientes. Probabilidad de x éxitos: x n x 

n

 ensayos, cada uno de los cuales tiene dos resultados posibles, éxito o Parámetros: n p

p xéxitos  n C x  p  q

Desviación estándar:

Media aritmética:

p= probabilidad de éxito en cada ensayo x= número de éxitos en los n ensayos n-x = número de fracasos en los n ensayos =distr.binom(núm_exito,ensayos,prob_exito)

  n p

  n pq

DISTRIBUCION DE POISSON: para describir situaciones donde nos interesa el número de veces que ocurre un fenómeno durante un intervalo dado o en una región específica se llaman experimentos de Poisson. Probabilidad de x ocurrencias: Parámetro:  x  Media aritmética: Desviación estándar

f x  

 e



x!

 

=poisson(x,media) APROXIMACIÓN DE POISSON A LA BINOMIAL: es adecuada cuando n≥20 , p≤0.05, consiste en

 poisson  binomial   n p

f x  



entonces calculamos la probabilidad de X éxitos:

 x  e x!

=poisson(x,media) DISTRIBUCIONES CONTINUAS DE PROBABILIDAD DISTRIBUCION NORMAL: Muy importante distribución continua de probabilidad. Proporciona una base sobre la cual se fundamenta gran parte de la teoría de Estadística Inferencial. Para definir una población distribuida normalmente, se necesitan solo 2 parámetros: la media  y la desviación estándar . Distribución normal estándar:

El área total bajo la curva es 1.00, por lo cual las áreas bajo la curva y dentro de dos límites corresponden a la probabilidad de que la variable tenga valor dentro de ésos límites. La tabla muestra las áreas bajo la curva normal a la izquierda de un valor Z, donde (Z es la forma estandarizada o tipificada de la variable aleatoria x).

z =distr.norm.estand(Z)

x 

x  z  



para obtener el área bajo la curva, a la izquierda de Z

=inv.norm.estand(probabilidad) ó =distr.norm.estand.inv(probabilidad) para obtener Z dada el área APROXIMACIÓN DE LA DISTRIBUCIÓN  NORMAL A LA BINOMIAL. Las áreas bajo la curva de la distribución normal se utilizan para aproximar

las probabilidades binomiales. Es aceptable cuando n30 y p0.05, y tanto np≥5 como nq 5. Se realiza una corrección por continuidad, sumando o restando 0.5 al valor de la variable a estandarizar, según corresponda. Media aritmética:

  n p

Desviación estándar:

z 

xcorr  



  n pq

More Documents from "Jorge Madrigal"

August 2019 85
The Spectacled Bear War[1]
November 2019 29
December 2019 25