!"
#
$%%&
NOTAS SOBRE EL LENGUAJE R Profesores: Guillermo Marshall – Lorena Correa Ayudante: Ana María Alvarado
1. Introducción R es un entorno de programación que incluye un lenguaje específico orientado a la realización de cálculos estadísticos. Destaca por su flexibilidad en la programación y por la cantidad de procedimientos estadísticos que tiene implementados por defecto. La implementación de nuevos procedimientos es relativamente sencilla, en comparación con lenguajes de propósito general como C ó Pascal. Algunas características del entorno de programación son las siguientes: 1. Las acciones se realizan mediante órdenes en una línea de comandos. Los comandos escritos en el teclado son ejecutados directamente sin necesidad de construir ejecutables. 2. Distingue entre mayúsculas y minúsculas, es decir, no es lo mismo el símbolo X que x. 3. El lenguaje esta basado en funciones, es decir, en general las órdenes serán llamadas a funciones donde se indicara el nombre de la función seguido de los argumentos de dicha orden encerrados entre paréntesis. En caso de que no tenga argumentos, la orden irá seguida de paréntesis vacíos. Por ejemplo, mean(x), demo().
2. Obtención de ayuda sobre los comandos Una vez en la línea de comandos de R, se puede obtener ayuda sobre cualquier comando a través de la función help(nombre del comando) o escribiendo el signo de interrogación previo al nombre del comando de interés. Por ejemplo, para obtener ayuda de la función ”plot”, help(plot) ó ?plot.
3. Lectura de Datos R puede leer datos guardados como archivos de texto (ASCII) con las funciones más usuales son las siguientes: read.table() La función read.table crea un marco de datos (’data frame’) y constituye la manera más usual de leer datos en forma tabular. La opción de esta función “header = TRUE” indica si el archivo contiene el nombre de las variables en la primera fila o línea. scan La función scan es mas flexible que read.table. A diferencia de esta última es posible especificar el modo de las variables. Ejemplo: scan("data.dat", what=list("", 0, 0)), en este ejemplo scan lee tres variables del archivo data.dat; el primero es un carácter y los siguientes dos son numéricos.
4. Operaciones básicas Las entidades básicas en una sesión de trabajo con R son los objetos. Un objeto es cualquier entidad con la que podemos operar, es decir, una variable, un vector, una matriz, etc. Comandos ls() ó objets() rm(objeto)
Lista los objetos que están en la memoria. Elimina el objeto en memoria
Asignar valores a una Variable R al igual que otros lenguajes de programación, tiene variables simbólicas, estos son nombres que pueden ser usados para representar valores. Por ejemplo, para asignar el valor 2 a la variable x se usa la instrucción x<-2. Asigna valor a la variable Asigna valor a la variable “hacia la derecha” Asignación Global (En Funciones)
<-> <
== ¡= < > <= >=
Comparativos Igual a Diferente de Menor que Mayor que Menor o Igual que Mayor o Igual que
Lógico & Y lógico ! NO lógico | O lógico Is.na(x) Ausente?
Funciones Numéricas
sqrt(x) exp(x) log(x) log10(x) length(x) sum(x) prod(x) sin(x) cos(x) tan(x)
Matemáticas Raíz de x Exponencial de x Logaritmo natural de x Logaritmo base 10 Número de elementos en el vector Suma los elementos del vector x Producto de los elementos de x Seno Coseno Tangente
Estadísticas mean(x) Media sd(x) Desviación Estándar var(x) Varianza median(x) Mediana quantile(x,p) Quantiles cor(x,y) Correlación max(x) Retorna el máximo min(x) Retorna el mínimo range(x) Retorna el máximo y mínimo sort(x) Ordena las componentes de x summary Retorna las principales medidas de resumen.
5. Vectores y Matrices El lenguaje R permite manejar de forma sencilla vectores. c(1,2,6,7) matrix(c(1,9,2,5),nrow=2,ncol=2) seq(1,20,0.5) rep(1,10) numeric(25) A%*%B t(A) diag(A)
Creación de un vector Crea una matriz de 2x2 Crea la secuencia : 1, 1.5, 2, 2.5...20 Entrega la repetición: 1 1 1 1 1 1 1 1 1 1 Entrega 25 ceros Multiplicación de las matrices A y B Transpuesta de una matriz Diagonal de la matriz A
6. Tabulación table(f1,…) tapply(x,f,mean) factor(x) cut(x, breaks) dotplot() piechart() stem()
Tabulación cruzada Tabla de medias Convierte un vector a factor Agrupa variables continuas Grafico de puntos Grafico de torta Tallo y hoja
7. Gráficos Creación de Gráficos plot() hist() boxplot() barplot() dotplot() piechart() stem()
Gráfico de Dispersión Histograma Cajón con bigotes Grafico de barras Grafico de puntos Grafico de torta Tallo y hoja
Elementos de Gráficos lines() abline() points() segments() axis() title() tex() mtex() legend()
Linea Linea dada por la intercepción y pendiente Puntos Linea de segmentos Ejes Titulo arriba del gráfico Texto sobre el Gráfico Texto en el margen Lista de simbolos
Parámetros de Gráficos pch mfrow, mfcol Xlim, ylim lty col
Símbolo (carácter del grafico) Varios gráficos en una pantalla Limites del trazo Tipo de linea Color