1. Consulte y relacione en sus propias palabras las siguientes definiciones básicas en la unidad 1 del curso:
Vector de datos: Un vector de datos es un vector formado por una o más variables aleatorias escalares. La estadística se ocupa de los vectores que tienen aplicaciones en muchas ciencias y técnicas.
Matriz de datos: Una matriz es un conjunto ordenado en una estructura de filas y columnas. Los elementos de este conjunto pueden ser objetos matemáticos de muy variados tipos, aunque de forma particular, trabajaremos exclusivamente con matrices formadas por números reales. Normalmente las matrices son designadas por letras mayúsculas.
Variable cuantitativa continua: Una variable continua es aquella que puede adoptar cualquier valor en el marco de un intervalo que ya está predeterminado. Entre dos de los valores, siempre puede existir otro valor intermedio, susceptible de ser tomado como valor por la variable continua.
Variable cuantitativa discreta: solo puede adquirir un valor de un conjunto de números. Existen separaciones entre los valores sucesivos que pueden observarse: es decir, que no se “llenan” con otros valores intermedios.
Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio de orden, como por ejemplo los colores o el lugar de nacimiento.
Variable cualitativa categórica: una variable categórica es una variable que puede tomar uno de un
número limitado, y por lo general fijo, de posibles valores, asignando a cada unidad individual u otro tipo observación a un grupo en particular o categoría nominal sobre la base de alguna característica cualitativa. Por ejemplo, los predictores categóricos incluyen sexo, tipo de material y método de pago.
Tabla de frecuencias, como es la tabla de frecuencias de una variable continua y de una discreta, ¿cuál tiene intervalos?
Tablas de distribución de frecuencias: Las Tablas de Distribución de Frecuencias permiten la organización y presentación de un conjunto de datos de acuerdo con la variable estudiada. En estas tablas, el ordenamiento de los datos se realiza en función a algunos parámetros básicos que forman parte del contenido. Tabla de distribución de frecuencias para datos discretos: Se utilizan cuando la variable es cuantitativa discreta. Se caracteriza porque no hay que formar intervalos (no es necesario agrupar los datos). Una tabla de distribución de frecuencias puede tener la siguiente estructura:
Fuente: Cibertec análisis probabilístico
Tablas de frecuencias con datos agrupados
Cuando los valores de la variable son muchos, conviene agrupar los datos en intervalos o clases para así realizar un mejor análisis e interpretación de ellos. • Para construir una tabla de frecuencias con datos agrupados, conociendo los intervalos, se debe determinar la frecuencia absoluta (fi) correspondiente a cada intervalo, contando la cantidad de datos cuyo valor está entre los extremos del intervalo. Luego se calculan las frecuencias relativas y acumuladas, si es pertinente.
Tabla de frecuencias de variable cualitativa, explique el cuadro de la primera web.
Histograma, en que variables se usa: Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de la muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores continuos
Gráficos de barras, en que variables se usa: El diagrama de barras (o gráfico de barras) es un gráfico que se utiliza para representar datos de variables cualitativas o discretas. Está formado por barras rectangulares cuya altura es proporcional a la frecuencia de cada uno de los valores de la variable.
Media poblacional: La media poblacional, valor esperado o esperanza matemática de una variable aleatoria.
Media muestral: Es la media de los valores de una muestra (media muestral) sirve para estimar la media de la población de la que se ha extraído la misma; la varianza muestral podría usarse para estimar la varianza poblacional, etc. Esto se denomina como realizar una estimación puntual.
Formula
Varianza poblacional: Varianza poblacional: 𝜎 2 el cuadrado de la desviación estándar poblacional 𝜎
Varianza de la población 𝜎2 =
∑(𝑥1 −𝜇)2 𝑛
Donde: 𝜎 2 = 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛 𝑥𝑖 = 𝑡𝑒𝑟𝑚𝑖𝑛𝑜 𝑑𝑒𝑙 𝑐𝑜𝑛𝑗𝑢𝑛𝑡𝑜 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 ∑ = 𝑠𝑢𝑚𝑎𝑡𝑜𝑟𝑖𝑎
𝜇 = 𝑚𝑒𝑑𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛 𝑛 = 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛
Varianza maestral
La varianza establecerá la variabilidad de la variable aleatoria. En el caso de una varianza muestral estaremos ante el cálculo de la varianza de una comunidad o grupo de población en base a una muestra.
Formula
Mediana: (media aritmética o simplemente media). es el promedio aritmético de las observaciones, es decir, el cociente entre la suma de todos los datos y el número de ellos. Si xi es el valor de la variable y ni su frecuencia, tenemos que:
Moda: es el valor de la variable que más veces se repite, es decir, aquella cuya frecuencia absoluta es mayor. No tiene por qué ser única.
Cuartiles y percentiles:
Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales.
Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos. Q2 coincide con la mediana.
Cálculo de los cuartiles 1 Ordenamos los datos de menor a mayor.
2 Buscamos el lugar que ocupa cada cuartil mediante la expresión Cálculo de los cuartiles C álculo de los cuartiles
1 Ordenamos los datos de menor a mayor .
2 Buscamos el lugar que ocupa cada cuartil mediante la expresión
Cálculo de los cuartiles para datos agrupados
En primer lugar buscamos la clase donde se
encuentra
, en la tabla de las
frecuencias acumuladas .
Deciles Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales. Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos. D5 coincide con la mediana. Cálculo de los deciles
En primer lugar buscamos la clase donde se
encuentra
, en la tabla de las
frecuencias acumuladas.
2. El estudiante debe consultar la presentación de instalación del programa R e instalarlo en su PC.
3. Cada estudiante debe consultar la presentación DESCRIPTIVAEN R y seguirla para en el programa R correr el código suministrado. En el archivo código descriptiva. variable continua
16
18
20
Años 22
24
Boxplot Edad
1.5 0.0
0.5
1.0
Frequency
2.0
2.5
3.0
Histogram of edad
14
16
18
20 edad
variable discreta
22
24
26
0
1
2
3
4
5
0.0
0.5
1.0
1.5
2.0
Frecuencias absolutas 2.5
3.0
Diagrama de barras Hermanos
0 1 2 3 4 5
Grafico de tarta de Hermanos
1
2
0
3
5
4
variable cualitativa
0.20 0.15 0.10 0.05 0.00
Frecuencias relativas
0.25
0.30
Diagrama de barras estudio
Sin estudios
Estudios Primarios
Estudios Superiores
4. Cada estudiante debe trabajar una variable cuantitativa continua de su carrera, una variable discreta de su carrera y una variable cualitativa de su carrera, tomando desde el programa R el archivo código descriptiva y reemplazando los datos de sus variables generando los vectores de cada una de sus variables y ejecutando el procesamiento.
variables continuas.
2 1 0
Frequency
3
4
Histogram of Alturaplanta
1.10
1.15
1.20 Alturaplanta
1.25
1.30
1.20 1.10
1.15
Años
1.25
1.30
Boxplot Alturaplanta
variable discreta.
1
2
3
4
5
6
2 1 0
Frecuencias absolutas
3
4
Diagrama de barras Numerodehojasplantas
1
2
3
4
5
6
Grafico de tarta de Numerodehojasplantas
2
1
6
3 5 4
variable cualitativa.
2.0 1.5 1.0 0.0
0.5
Frecuencias absolutas
2.5
3.0
Diagrama de barras UTIIDADPLANTA
SOMBRA
MADERABLE
ORNAMNETAL
Referencias
Balzarini, M. (2013). Estadística y biometría: ilustraciones del uso e infostat en problemas de agronomía. Recuperado de http://bibliotecavirtual.unad.edu.co:2460/lib/unadsp/reader. action?docID=3221775&query=bioestadistica Di, R. J. A., Casanoves, F., & Gonzalez, L. A. (2008). Estadística para las ciencias agropecuarias (7a. ed.). Recuperado de:
http://bibliotecavirtual.unad.edu.co:2460/lib/unadsp/reader.acti on?ppg=1&docID=3185731&tm=1519912328994
Balzarini, M. (2013). Estadística y biometría: ilustraciones del uso e infostat en problemas de agronomía, p. 257-292. Recuperado de http://bibliotecavirtual.unad.edu.co:2460/lib/unadsp/reader. action?docID=3221775&query=bioestadistica Matus, R., Hernández, M., & García, E. (2010). Estadística. Recuperado de: http://bibliotecavirtual.unad.edu.co:2460/lib/unadsp/reader.action?ppg =1&docID=3187261&tm=1519661894239