Instituto Universitario Politécnico Santiago Mariño División de Pregrado
ESTADISTICA DESCRIPTIVA ESTADISTICA I
ALUMNA:
JEIRUSKA ACOSTA C.I.: V.-25.323.316
MARZO DE 2019
PROCEDIMIENTOS Problema 1.A. Calcule la media, mediana y moda de un grupo de estudiantes cuyas edades son: 18, 16, 18, 16, 20, 18, 14, 16, 18, 14, (interprete resultados obtenidos)
18 18
16 14
18 16
16 18
20 14
DATOS
Para calcular la media aritmetica, se emplea la siguiente ecuacion
� =(∑▒�_� )/ 𝑛=
168 10
X=
16.8
16 x5
18 x6
Para calcular la mediana, se emplea la siguiente ecuacion 1. Se ordenan los datos de menor a mayor 14 14 16 x1 x2 x3
16 x4
18 x7
18 x8
MD =
17
2. Para datos pares, la ecuación que se emplea viene representada por:
𝑀�=(�_(𝑛/2)+�_(𝑛/2+ 1))/𝑛
X5 X6
16 18
Para calcular la moda, se emplea la siguiente ecuacion 1. Se ordenan los datos y se cuenta el dato que tenga más frecuencia o repetición 14 16 18 20 2 3 4 1 2. La moda se define coomo el valoR que más se repite de un conjunto de datos MODA =
18
Interpretación de los resultados Las tres variables, son medidas de tendencia central, en el caso de la media es 16,8; es el valor medio del conjunto de datos. Mientras que la mediana, se ubica en el punto medio del conjunto de datos. Y la moda otorga el valor que más se repite
18 x9
20 x10
PROCEDIMIENTOS Problema 1.B. Se requiere hacer una encueta sobree las caracteristicas de cada vivienda dentro de una urbanizacion , conociendo que el numero total de viviendas es de 10000, los cuales se distribuyen en 3 tipos de casa con un margen de error de el 10% y de probabilidad de éxito o fracaso de 50-50 Tipo A hay 2000 Tipo B hay 7000 Tipo C hay 1000 Se pide estimar muestras a consultar y estratificar para conocer cuantas se tomaron por cada tipo de casa
Se aplicara la sigiente formula:
TIPO A N p q d Z 0,95
2000 0.5 0.5 0.05 1.65
N p q d Z 0,95
7000 0.5 0.5 0.05 1.65
N p q d Z 0,95
1000 0.5 0.5 0.05 1.65
nopt =
239.74
nopt =
262.09
nopt =
214.16
TIPO B
TIPO c
PROBLEMA 1. C. Una fabrica de helados proyecta lanzar al mercado un nuevo sabor, realizando un test de aceptacion a 20 alumnos de primer grado, cuys preferencia se medira del 1 al 10, con los resultados de: 2,6,8,7,4,5,10,6,6,7,6,7,3,8,7,6,8,6,5,4 Se pide limites superior e inferior del intervalo,marcas de clase y rango 2 6
6 7
8 3
7 8
DATOS NO AGRUPADOS 4 5 7 6
10 8
6 6
6 5
n=
20
7 4
Se pide: 1. Utilizar el método de datos agrupados 2. Para decidir el intervalo de clase trabaje con la regla de Sturgen
PROCEDIMIENTO 0. Distribución de frecuencias mediante la Regla de Sturges 1. La cantidad de clases (k): Para calcular la cantidad de clases necesarias en nuestra distribución se utiliza la siguiente fórmula Donde n es la cantidad de datos de nuestra muestra, el valor de k debe ser un número entero, por lo tanto, siempre se debe redondear al número entero próximo. 𝑛=20 �=6 2. El rango de nuestros datos R: El rango se encuentra de la siguiente manera: �=𝑉𝑀𝐴�−𝑉𝑚�𝑛 3. La amplitud de cada clase. (A): Para la amplitud se realiza lo siguiente: 𝐴=�/� Se redondea al digito mayor proximo, porque son enteros todos los datos de las calificaciones 4. Se determinan los limites ideales. El primer limite ideal (Inferior), es el valor minimo de todos los datos = 2 Para determinar el limite ideal superior, se le suma al limite ideal inferior la amplitud
𝐿𝐼�=𝐿𝐼𝐼+𝐴−1=2+1−1=2 5. Se determinan los limites reales, para esto de termina el limite real superior, con la semisuma de los limites ideal inferior y superior 𝐿��=(𝐿𝐼𝐼+𝐿𝐼�)/2=2,5
6. Al primer limite real superior le resto la amplitud para determinar el limite real inferior 1,5 7. Se detremina la Marca de Clase: Semisuma de los limites ideales MC1=(𝐿�𝐼1+𝐿��1)/2=2
DATOS AGRUPADOS Clases
Limites Reales
Marca de Clase (Xj)
2-2
1,5 - 2,5
2
3-3
2.5 - 3.5
3
4-4
3.5 - 4.5
4
5-5
4.5 - 5.5
5
6-6
5.5 - 6.5
6
7-7
6.5 - 7.5
7
8-8
7.5 - 8.5
8
9-9
8,5 - 9,5
9
5.322 8 1.000
6 2 1
k= R= A=
g
Nº 1
CLASES - LIMITES Inferior Superior 2 2
(XjAg)
Distribución de frecuencias mediante la Regla de Sturges Nº de intervalos 6 Rango Amplitud LIMITES REALES Inferior Superior 1.5 2.5
2
3
3
2.5
3.5
3
4
4
3.5
4.5
4
5
5
4.5
5.5
5
6
6
5.5
6.5
6
7
7
6.5
7.5
7
8
8
7.5
8.5
8
9
9
8.5
9.5
PROBLEMA 1. D. Establecer diferencias entre: Escala nominal, de razon, ordinal, (opor rango), por intervalo. Escala de Medición. Se entenderá por medición al proceso de asignar el valor a una variable de un elemento en observación. Este proceso utiliza diversas escalas: nominal, ordinal, de intervalo y de razón. Las variables de las escalas nominal y ordinal se denominan también categóricas, por otra parte las variables de escala de intervalo o de razón se denominan variables numéricas. Con los valores de las variables categóricas no tiene sentido o no se puede efectuar operaciones aritméticas. Con las variables numéricas sí. La escala nominal sólo permite asignar un nombre al elemento medido. Esto la convierte en la menos informativa de las escalas de medición. Los siguientes son ejemplos de variables con este tipo de escala: Nacionalidad. Uso de anteojos. Número de camiseta en un equipo de fútbol. Número de Cédula Nacional de Identidad. A pesar de que algunos valores son formalmente numéricos, sólo están siendo usados para identificar a los individuos medidos. La escala ordinal, además de las propiedades de la escala nominal, permite establecer un orden entre los elementos medidos. Ejemplos de variables con escala ordinal: Preferencia a productos de consumo. Etapa de desarrollo de un ser vivo. Clasificación de películas por una comisión especializada. Madurez de una fruta al momento de comprarla. La escala de intervalo, además de todas las propiedades de la escala ordinal, hace que tenga sentido calcular diferencias entre las mediciones. Los siguientes son ejemplos de variables con esta escala: Temperatura de una persona. Ubicación en una carretera respecto de un punto de referencia (Kilómetro 85 Ruta 5). Sobrepeso respecto de un patrón de comparación. Nivel de aceite en el motor de un automóvil medido con una vara graduada. Finalmente, la escala de razón permite, además de lo de las otras escalas, comparar mediciones mediante un cuociente. Algunos ejemplos de variables con la escala de razón son los siguientes: Altura de personas. Cantidad de litros de agua consumido por una persona en un día. Velocidad de un auto en la carretera. Número de goles marcados por un jugador de básquetbol en un partido. La escala de intervalo tiene un cero que se establece por convención y puede tener variaciones. Es arbitrario. Por otra parte, la escala de razón tiene un cero real, fijo, no sujeto a variaciones; es propio de la medición hecha.
Algunos ejemplos de variables con la escala de razón son los siguientes: Altura de personas. Cantidad de litros de agua consumido por una persona en un día. Velocidad de un auto en la carretera. Número de goles marcados por un jugador de básquetbol en un partido. La escala de intervalo tiene un cero que se establece por convención y puede tener variaciones. Es arbitrario. Por otra parte, la escala de razón tiene un cero real, fijo, no sujeto a variaciones; es propio de la medición hecha.
PROBLEMA 1. E. Establecer diferencias entre poblacion,muestra y muestreo. En la estadística la población y la muestra son dos conceptos completamente diferentes empleados en estudios de campo y de individuos. Población La población estadística es también denominada universo. Se trata de un conjunto de elementos sobre los que se realizan estudios y observaciones. La población es una variable aleatoria o magnitud de naturaleza aleatoria. Al definir las variables de un estudio se debe definir cuál será la población a investigar. La población es el conjunto conformado por todos los elementos a estudiar. En algunos casos las poblaciones son demasiado extensas para ser estudiadas, en ese caso es necesario seleccionar una muestra a la cual se le aplicaran los estudios con el fin de evaluar características y fenómenos presentes en la población. Muestra En la estadística una muestra es un subconjunto de caso o de individuos de una población. La muestra debe ser representativa por lo que la técnica de muestreo (selección) debe ser adecuada. Al seleccionar una muestra se debe evitar escoger una muestra sesgada cuya utilidad será limitada pues no representará adecuadamente el fenómeno o característica a estudiar. El objetivo de las muestras es la de inferir las propiedades de la totalidad de la población. El muestreo es mucho más exacto que el estudio de una población al completo, pues el manejo de un menor número de datos provoca menos errores en su manipulación. Diferencia entre población y muestra Una muestra es un subconjunto de individuos, eventos u objetos que se seleccionan de una población más grande. La población es un conjunto mayor que no es seleccionada de forma aleatoria, pues se seleccionan objetos, eventos y sujetos que presentan un fenómeno específico. El muestreo es la recolección de una muestra directamente de la población que se desea estudiar. El muestreo debe ser aleatorio y permite estudiar en mejor medida el fenómeno o evento. El muestreo Conjunto de operaciones encaminadas a determinar una muestra) su tamaño * demás características necesarios para identi&car a los elementos de la poblaciçon
PROBLEMA 2. Que se entiende por Regresiòn y Correlaciòn RESGRESIÇON LINEAL Si utilizamos un sistema de coordenadas cartesianas para representar la distribución bidimensional, obtendremos un conjunto de puntos conocido con el diagrama de dispersión, cuyo análisis permite estudiar cualitativamente, la relación entre ambas variables tal como se ve en la figura. El siguiente paso, es la determinación de la dependencia funcional entre las dos variables x e y que mejor ajusta a la distribución bidimensional. Se denomina regresión lineal cuando la función es lineal, es decir, requiere la determinación de dos parámetros: la pendiente y la ordenada en el origen de la recta de regresión, y=ax+b. La regresión nos permite además, determinar el grado de dependencia de las series de valores X e Y, prediciendo el valor y estimado que se obtendría para un valor x que no esté en la distribución. CORRELACION ESTADISTICA La correlación estadística constituye una técnica estadística que nos indica si dos variables están relacionadas o no. Por ejemplo, considera que las variables son el ingreso familiar y el gasto familiar. Se sabe que los aumentos de ingresos y gastos disminuyen juntos. Por lo tanto, están relacionados en el sentido de que el cambio en cualquier variable estará acompañado por un cambio en la otra variable. De la misma manera, los precios y la demanda de un producto son variables relacionadas; cuando los precios aumentan la demanda tenderá a disminuir y viceversa. Si el cambio en una variable está acompañado de un cambio en la otra, entonces se dice que las variables están correlacionadas. Por lo tanto, podemos decir que el ingreso familiar y gastos familiares y el precio y la demanda están correlacionados. RELACION ENTRE VARIABLES La correlación puede decir algo acerca de la relación entre las variables. Se utiliza para entender: si la relación es positiva o negativa la fuerza de la relación. La correlación es una herramienta poderosa que brinda piezas vitales de información. En el caso del ingreso familiar y el gasto familiar, es fácil ver que ambos suben o bajan juntos en la misma dirección. Esto se denomina correlación positiva.