BREVE MANUAL DE INDUCCION AL SAS USO DE LA PARTE INTERACTIVA: ANALYST El SAS (Statistical Analysis System) es un sistema de software integrado que proporciona un control total sobre acceso, manejo, análisis y presentación de bases de datos. La versión de SAS de la que nos ocuparemos es la 8.0. Al ingresar al programa por medio de un ícono o a través de un item de programas aparece la siguiente ventana:
y luego la ventana:
Como se puede observar, en la parte izquierda aparece una especie de explorador de SAS, donde se puede indagar acerca de librerías, conjuntos de datos previamente creados en SAS o recientemente creados por el usuario, resultados generados con algún procedimiento. En la parte derecha aparecen dos ventanas claramente distinguibles con los nombres Editor y Log. En la parte inferior aparecen los nombres de dichas ventanas a las cuales se puede tener acceso (aparecen tres nombres: Output, Log y Editor) con solo hacer click en el respectivo nombre. Si es de su comodidad y quiere mayor espacio puede cerrar la ventana de explorer. En la ventana del PROGRAM EDITOR se deben digitar todos los comandos correspondientes a un programa en SAS. Permite además la entrada de bases de datos (se recomienda que estas bases sean pequeñas; si son grandes es aconsejable introducirlas al sistema de otra forma. En la ventana del LOG aparece un reporte detallado de la ejecución del programa. Si se cometieron errores estos aparecen reportados en color rojo en esta ventana; además el programa indica el tipo de error que se cometió y la línea donde está. Algunas veces puede aparecer un mensaje en color verde que dice WARNING; esto no debe ser motivo de alarma ya que no interrumpe la correcta ejecución del programa; no obstante, debe ser leído con detenimiento. Se recomienda revisar siempre esta ventana después de ejecutar el programa. En la ventana del OUTPUT aparecen todos los resultados solicitados en el programa. Si se solicitan gráficos, el sistema genera automáticamente una ventana con el nombre Graph1. En la parte superior aparece un menú de opciones, entre las cuales figuran: File, Edit, View, Tools, Run, Solutions, Windows y Help.
Debajo una barra de herramientas. Dicha barra de herramientas permite, entre otras cosas, abrir nuevo documento, guardar, imprimir, abrir archivos, impresión previa de alguna ventana, herramientas de copiar, pegar, cortar, deshacer, crear nueva librería, abrir ventana explorer en SAS, , ejecutar comandos SAS, borrar todo el contenido de una ventana, pausa y ayuda. Para saber que hace cada botón basta situar el mouse en dicho ícono y aparece su respectiva descripción. Por ejemplo:
El primer botón también sirve para borrar las ventanas LOG y Output. Un programa típico en SAS consta básicamente de dos pasos que son: El paso DATA y el paso PROC. El paso DATA se relaciona con aspectos tales como lectura de datos, creación de nuevas variables, operaciones lógicas y aritméticas y ejecución de ciclos. El paso PROC se relaciona con la ejecución de los distintos procedimientos de análisis los cuales están incorporados dentro de cada producto del SAS; por ejemplo, el SAS/GRAPH. Estos procedimientos se invocan al sistema con sus respectivos nombres y cada uno de ellos posee una amplia gama de opciones. NOTAS IMPORTANTES En la elaboración de un programa en SAS se debe ser muy cuidadoso con la sintaxis y se debe guardar periódicamente usando la siguiente convención: Si se quiere guardar el contenido del PROGRAM EDITOR se debe usar la extensión.sas; por ejemplo miprimer.sas. Si se quiere guardar el contenido del OUTPUT se debe usar la extensión.lst; por ejemplo miprimer.lst.
Toda línea de comandos se debe finalizar con punto y coma. La omisión de esta importante regla de sintaxis genera errores muy difíciles de detectar y es uno de los errores más comunes. Los nombres asignados a las variables no deben exceder ocho caracteres. Se recomienda que tales nombres den idea de la variable; por ejemplo, PRESANG puede representar una variable llamada presión sanguínea. Para invocar los distintos procedimientos se pueden usar letras mayúsculas, minúsculas o la combinación de ambas; por ejemplo PROC MEANS=proc means=Proc Means. Se recomienda documentar todos los programas. Esto permite identificar cada programa y da una idea de lo que cada uno de ellos hace. Los comentarios en SAS tienen la siguiente sintaxis /* COMENTARIO */; por ejemplo, Lectura de datos en formatos especiales ( ASCII, separado por comas, punto y comas, tabuladores, Excel) - Ejemplo de un programa en SAS entrando los datos directamente al PROGRAM EDITOR. Suponga que se recopiló información a un grupo de personas. Específicamente se les registró el sexo, la edad, la estatura y el peso. Se quiere obtener un resumen detallado por medio de tablas de este grupo de personas. Este programa se debe digitar en la ventana del PROGRAM EDITOR. Un programa en SAS típico puede ser: /****************************************************************************/ /* Este programa permite obtener tablas de resúmenes estadísticos básicos */ /* */ /* Proc’s Usados: FREQ, MEANS y UNIVARIATE */ /* */ /****************************************************************************/ DATA uno; /* CREACION DATA */ INPUT sexo $ edad estatura peso; /* NOMBRAMIENTO VARIABLES */ CARDS; H 25 1.72 70 M 20 1.64 54 M 19 1.65 52 M 27 1.63 50 M 22 1.65 47 H 16 1.65 62 H 25 1.69 64 H 26 1.73 72 M 25 1.72 71 H 23 1.80 74 H 22 1.70 69 H 25 1.72 71 ; RUN; PROC MEANS DATA=uno; / *ESTADISTICAS BASICAS */ Var estatura peso; Run; PROC FREQ DATA=uno; TABLES sexo; Run;
/*
TABLA DE FRECUENCIAS
*/
PROC UNIVARIATE DATA=uno; Var edad; Run;
/*
MAS ESTADISTICOS BASICOS
*/
Si lo desea puede utilizar solo las ventanas EDITOR, OUTPUT y LOG y cerrar la ventana explorer. Puede organizar las ventanas como desee al estilo Windows. El signo $ es empleado para indicar una variable alfa-numérica. Para ejecutar el programa anterior basta hacer click en el ícono con forma de muñeco caminando. Los resultados de los procedimientos empleados aparecerán en la pantalla OUTPUT y los tiempos empleados y errores en la pantalla LOG.
! . !
$%
%$$&'($''') '-&*******
1 2
*&*+(,),' (&)+%$%()
$&'-***** +)&*******
!
$&,****** )+&*******
"
/
2
#
"
) 0 3 !
0,&-+$&') !
# )
%$!
!
4 5
#
! $% %%&($'''') -&%'*$,%$, ;*&,(--+', '+$( $+&%%'%+(0
9 : !! 1 ==
!
! ! =
5
;
!
4 ;
6 7 8 ! <
!
! !
!
*>*
;;;;;.
%%&($'') %+&***** %0&*****
$% %)0 $*&'%,),)( *&%*($*+$ $$'&($''') *&(+$$--0! ?
;;;;;;
7 2
=
0@
1 2
"
7 7
9
%+&-0**) ' -(
B B> B>
C&***$ *&***0 *&***0
4
! $**D ((D (0D (*D )0D 0*D %0D $ $*D 0D $D *D
7
2
8 ! A!
-&%'*$, $*&'%,)( $$&***** +&*****
%) %) %) %' %0 %+ %$ $( $' $' $'
;;;;5 : ! ;;;;
! ;;;;/ 7
8 ! $' $( %* %% %%
' % $$ 0
! ;;; 8 !
%0 %0 %0 %' %)
) ( $% , +
0,&-$**&**
- Ejemplo de un programa en SAS leyendo los datos de un archivo externo Suponga que la información anterior fue previamente guardada en un archivo de texto, digamos una archivo de nombre datos.txt guardado en un disquete. Al abrir el archivo se observa lo siguiente: Aunque este es un archivo pequeño, la herramienta de lectura de datos desde archivos externos se hace útil cuando se tienen grandes base de datos. Para leer los datos desde SAS se usa el siguiente programa:
/****************************************************************************/ /* Este programa permite leer datos de un archivo externo en formato ASCII */ /* separado por espacios. */ /* */ /* Proc’s Usados: DATA, PRINT */ /* */ /****************************************************************************/ DATA uno; INFILE “ A:\datos.txt”; INPUT sexo $ respu edad ingreso; RUN;
/* /* /*
CREACION DATA LECTURA DE DATOS EXTERNOS NOMBRAMIENTO VARIABLES
*/ */ */
PROC PRINT DATA=uno; Run;
/*
IMPRIME DATOS
*/
Al correr el programa se obtiene
El conjunto de datos Uno se ha creado satisfactoriamente y contiene la información guardada en el archivo: datos.txt . El procedimiento PRINT permite imprimir el contenido de cualquier DATA creado previamente en SAS. Ahora suponga que se quiere crear una nueva variable; en particular suponga que se quiere pasar la variable ingreso a miles de pesos; para esto modifique el anterior programa así:
DATA uno; INFILE “a:\datos.txt”; /* RUTA DONDE ESTAN LOS DATOS */ INPUT sexo$ respu edad ingreso; ingreso1=ingreso*1000; Run; PROC PRINT DATA=uno; Run; Las instrucciones en negrilla son las que se agregaron. El resultado de estas modificaciones se muestra a continuación. Ahora suponga que se quiere recodificar la variable RESPU; en particular se quiere especificar que el 0=No y el 1=Si. Para hacer esto modifique el anterior programa agregando unas dos nuevas líneas al programa. El programa en SAS y los respectivos resultados se muestran en el siguiente gráfico.
DATA uno; INFILE "a:\datos.txt INPUT sexo$ respu edad ingreso; ingreso1=ingreso*1000; IF respu=1 THEN respu1="SI"; ELSE respu1="NO"; RUN; PROC PRINT DATA=uno; Run; Las instrucciones en negrilla corresponden a las agregadas. Similares instrucciones pueden ser usadas para crear más variables o modificar las existentes. Ahora bien, si se quiere saber la distribución de frecuencias de la variable RESPU1 según el SEXO, se debe modificar el programa así, DATA uno; INFILE “A:\datos.txt”; INPUT sexo$ respu edad ingreso; ingreso1=ingreso*1000; IF respu=1 THEN respu1=”SI”; ELSE respu1=”NO”; Run; PROC PRINT DATA=uno; Run; PROC FREQ DATA=uno; Tables respu1*sexo; Run; Las líneas que se agregaron aparecen en negrilla. La ejecución de este programa genera el siguiente resultado,
Si se quiere obtener un GRÁFICO DE FRECUENCIAS por EDAD, modifique el programa así, DATA uno; INFILE “A:\datos.txt”; INPUT sexo$ respu edad ingreso; ingreso1=ingreso*1000; IF respu=1 THEN respu1=”SI”; ELSE respu1=”NO”; Run; PROC PRINT DATA=uno; Run; PROC FREQ DATA=uno; Tables respu1*sexo; Run; PROC GCHART DATA=uno; VBAR edad / DISCRETE; Run; La ejecución de este último conjunto de opciones genera el gráfico: Otra manera de mostrar esta información es colocando estas barras de manera horizontal. Las siguientes instrucciones en SAS permiten hacer esto y adicional ala gráfico aparece adjunta una tabla de frecuencias. DATA uno; INFILE “A:\datos.txt”; INPUT sexo$ respu edad ingreso; ingreso1=ingreso*1000; IF respu=1 THEN respu1=”SI”; ELSE respu1=”NO”; Run; PROC PRINT DATA=uno; Run; PROC FREQ DATA=uno; Tables respu1*sexo; Run; PROC GCHART DATA=uno; HBAR edad / DISCRETE; Run;
- Ejemplo de Lectura de datos desde un archivo externo, con una estructura especial Suponga que se tiene una base de datos con la siguiente apariencia:
Un programa usual para leer estos datos será: DATA dos; INFILE "a:\datos2.txt" FIRSTOBS=2; INPUT nombre $ carnet direcc est resp matri sexo $; Run; La opción FIRSTOBS=2 le indica al programa que la información empieza en la segunda fila. Al ejecutar las instrucciones anteriores resulta:
La razón es porque para el SAS cada espacio en blanco separa un valor para cada una de las variables especificadas en la instrucción INPUT. Para resolver este problema es necesario establecer un formato fijo para cada variable. Por ejemplo, el NOMBRE mas largo va desde la columna 1 hasta la columna 23, el CARNET de la columna 26 a la 34, la DIRECCIÓN mas larga de la columna 38 a la 61 y los valores de las demás variables están separados por espacios. El programa en SAS para leer esta base de datos es: DATA dos; INFILE "a:\datos2.txt" FIRSTOBS=2; INPUT nombre $ 1-23 carnet 26-34 direcc $ 38-61 est resp matri sexo $; Run;
El resultado al correr estas instrucciones es:
Para generar una tabla de frecuencia de SEXO contra RESP, se procede así: DATA dos; INFILE "a:\datos2.txt" FIRSTOBS=2; INPUT nombre $ 1-23 carnet 26-34 direcc $ 38-61 est resp matri sexo $; Run; PROC FREQ DATA=dos; TABLES sexo*est/norow nocol nopercent; Run; = ! !
#
!
! "
#E F E F E F
%E F - E F * E F -
El SAS permite la creación de tridimensionales y gráficos que visualizar el comportamiento de varias simultáneamente. El siguiente programa crea una tabla entrada de las variables sexo y resp
-E F $ E F % E F -
gráficos permiten variables de doble
DATA dos; INFILE "a:\datos2.txt" FIRSTOBS=2; INPUT nombre $ 1-23 carnet 26-34 direcc $ 38-61 est resp matri sexo $; Run; PROC FREQ DATA=dos; TABLES sexo*resp/norow nocol nopercent; Run; PROC GCHART DATA=dos; BLOCK est/DISCRETE GROUP=sexo; Run;
+E F $ E F % E F -
0E F $ E F * E F $
'E F * E F % E F %
' '
%$ Creación de Librerías en SAS Una herramienta muy útil cuando se manejan muchos conjuntos de datos es tener a disposición todos los conjuntos de datos y no tener que de nuevo escribir un programa para leerlos o inclusive volver a digitarlos en la ventana del PROGRAM EDITOR. Una manera de resolver este problema es usando el concepto de Librería. Una librería se asemeja a un archivador el cual contiene en su interior información sobre diferentes conjuntos de datos.
En SAS el manejo de las librerías es muy similar a los archivadores que se manejan en algunas empresas (por ejemplo, un archivador donde las carpetas son información de diferentes clientes, o sobre proveedores de productos o información sobre estudiantes, etc). En SAS se tienen dos tipos de librerías: Temporales y Permanentes. Librerías Temporales. En las librerías temporales los conjuntos de datos allí guardados solo están activos mientras no se termine la sesión de SAS, es decir al salir de SAS los conjuntos de datos desaparecen; son como conjuntos de datos temporales. En SAS, la librería que guarda los conjuntos de datos temporales es la librería WORK. En cualquier caso, sea que los datos se escriban directamente en el programa o se lean de un archivo externo, Al ejecutarse el programa los datos quedan guardados en la librería WORK y el nombre asignado es: WORK.nombre. Por defecto el SAS solo usa el nombre del conjunto de datos sin usar la palabra WORK. Para ilustrar, observe el siguiente ejemplo:
Librerías Permanentes. Para crear una librería permanente que permanezca dentro de SAS aún después de terminar la sesión de SAS e iniciar de nuevo, se puede hacer de dos maneras: Con comandos en SAS o usando el menú explicado antes. Para crear una librería con comandos usamos la instrucción LIBNAME (nombre) ‘ruta’. En nombre asignamos un nombre que no pase de 8 caracteres y el cual determinara la librería. Todos los archivos que se generen en adelante quedarán dentro de la librería previamente creada. Por ejemplo: Libname curso “a:\”; DATA curso.dos; INFILE "a:\datos2.txt" FIRSTOBS=2; INPUT nombre $ 1-23 carnet 26-34 direcc $ 38-61 est resp matri sexo $; Run; Proc print data=curso.dos; Run; El archivo de datos se llama ahora curso.dos. La ejecución de estas instrucciones arroja los siguientes resultados:
Otra manera fácil de crear librearías, no requiere el colocar le nombre de la librería antes del nombre del archivo de datos. Suponga que se leen los siguientes datos: DATA dos; INFILE "a:\datos2.txt" FIRSTOBS=2; INPUT nombre $ 1-23 carnet 26-34 direcc $ 38-61 est resp matri sexo $; Run; Internamente se ha creado el archivo de datos dos dentro de la librería WORK. En el menú principal seleccionamos el ícono correspondiente a una nueva librería: El archivo de datos previamente creado quedan automáticamente guardados en esta nueva librería. Por ejemplo si la librería va a estar físicamente en el drive A y su nombre es Curso, la ruta a escribir o path será: “ A:\ “. La ilustración de este proceso se muestra a continuación:
En la ventana explorer quedan registrados no solo las librerías existentes y recién creadas, sino también los archivos de datos dentro de cada librería. Como su nombre lo indica usted puede realizar todas las tareas que haría un explorador usual: Copiar, Cortar, Mover, borrar, etc. En el drive A, se puede ver el archivo de datos de nombre dos y con formato de archivo de datos en SAS. Un solo clic en el archivo basta para que el programa abra su contenido en una ventana aparte. Lo anterior se muestra en los siguientes dos gráficos:
Lectura de Datos usando la opción Import Data Suponga que se dispone de la información contenida en el archivo datos.txt el cual contiene información acerca de Sexo, Resp, Edad e Ingreso y está físicamente en el drive A.
Al seleccionar la opción indicada y presionar Next aparece una ventana donde se pide la ruta del archivo que se desea leer y luego Next. Después de seleccionar el archivo y presionar Next, aparece otra ventana donde se indica en que librería se desea guardar la información y con que nombre el archivo de datos y luego las opciones Next y Finish. Se ilustran los dos pasos anteriores.
Al presionar Finish aparece la siguiente pantalla:
Seleccionamos cada una de las columnas del archivo haciendo click, nombramos la respectiva columna con un nombre y determinamos el tipo de escala de medición. En el botón Options , aparece entre otras cosas, el tipo de separador entre variables. Por defecto es un espacio en blanco, pero podemos tener bases de datos donde los valores de las variables están separados por comas, por tabuladores o otros símbolos. La opción Add, permite adicionar la columna seleccionada
El resultado de adicionar las variables y sus respectivos nombres es:
al cerrar la ventana aparece y luego salvar los datos aparecen las siguientes ventanas:
Suponga ahora que los datos antes leídos están disponibles en formato Excel. Suponga que dicha información está registrada en el archivo datos.xls: Para leer estos datos usamos la misma opción Import Data. En este caso el formato de los datos ya está previamente establecido
Al presionar Next, aparece una nueva ventana donde se pide la ubicación de los datos. Estos están en el drive A:\datos.xls, al presionar el ícono Options aparece una nueva ventana donde se especifica si los nombres de las variables aparecen en la primera fila, se selecciona la opción y OK, luego presione Next. La ventana que aparece permite especificar la librería y el nombre para el archivo de datos. Seleccionamos librería Curso y archivo de datos Tres. Por último presione Finish. Estos resultados se muestran a continuación:
En la ventana del Log aparece un mensaje diciendo que el archivo fue exitosamente creado. Si desea ver el archivo basta usar el Procedimiento PRINT. Proc Print data=curso.tres; Run; Manejo de Datos Usando SAS Interactivo Para acceder a la parte interactiva del programa SAS, es necesario tener previamente creado en SAS uno o varios archivos de datos a ser utilizados. En SAS tenemos dos modos interactivos de análisis básicos: Interactive Data Análisis y Analyst. El resto de este documento se dedicará a mostrar algunas de las opciones del Analyst.Este módulo interactivo tiene la particularidad de trabajar en forma de proyectos: cada procedimiento realizado, cada gráfica, cada resultado y el código utilizado aparecen registrados y en cualquier momento están disponibles. Permite guardar más ágilmente gráficos y otros resultados. Para ingresar al modo Analyst, se usa el menú Solutions
Al hacer esto aparece la siguiente ventana :
Algunas opciones del menú superior son:
Un menú inferior también contiene algunos procesos resumidos de gráficos, tablas, resúmenes estadísticos, etc.
Abrimos un archivo de datos existente en alguna librería sea de SAS o creada por el usuario. Tenemos la librería CURSO. Usando la Opción File – Open by SAS Name, aparece una ventana donde se especifican las librerías y dentro de ellas los respectivos archivos de datos contenidos en cada una de ellas (basta hacer doble clic en la librería de interés y al lado derecho aparecen los archivos de datos. Seleccionamos la Librería CURSO y el conjunto de datos Tres y luego OK. Aparece el Nombre dado al archivo de Datos y a la izquierda la ventana con las observaciones.
Exploremos los menú Graphs y Statistics Al seleccionar la opción Graphs aparece el siguiente submenú:
Exploremos brevemente cada una de estas opciones sin entrar en mucho detalle. Esta exploración adicional se deja para el usuario. Usaremos los datos correspondientes a una muestra de estudiantes de la Universidad Nacional Medellín. Por medio de una encuesta de cada estudiante se recopiló información acerca de: Estrato, Horas dedicadas a estudiar semanalmente, Edad, Si Trabaja o No ( 1 corresponde a Trabaja y 2 a No-trabaja) y Promedio en el semestre anterior. Los datos aparecen en la Librería CURSO con el nombre ESTUD. Gráficos de Barras (Bar Chart) En el menú seleccionamos Bar Chart y luego barras horizontales o verticales. Si seleccionamos Horizontal, aparece una ventana donde las variables están al lado izquierdo. Se selecciona la o las variables que desea haciendo clic sobre el nombre y haciendo click en Chart y Luego OK. Observe que al lado izquierdo aparece el nombre del procedimiento usado, el nombre del gráfico y el código en SAS usado por el programa. El resultado para la variable Estrato es el siguiente:
El gráfico resultante está mal elaborado, pues las barras no corresponden a valores reales de la variable. La razón es que no se le especificó al SAS que la variable era discreta. Si la variable es continua lo que hace es definir categorías con los valores de esta. Para resolver esto en la ventana Bar Chart hacemos clic en Options. Aparece una ventana donde se tiene la opción de elegir el número de barras que se desee, una barra para cada nivel discreto o un conjunto de valores particulares (para lo cual se debe especificar los puntos medios respectivos) usando la opción Specify. Se ilustra lo antes dicho.
Al seleccionar la opción de barras para cada nivel de la variable estrato, resulta el diagrama:
Si desea barras para estrato discriminado para los que trabajan y los que no trabajan, basta especificar en la opción Group By la variable deseada ( en este caso Trabaja), el resultado es el siguiente
Para las Barras Verticales se procede Igual. Diagramas de Pastel (Pie Chart). Las opciones son similares a Bar Chart Histogramas (Histogram...) Los histogramas son elaborados para variables continuas o variables discretas con muchos valores. Al seleccionar esta opción aparece una ventana similar a las otras consideradas.
Por ejemplo, un histograma de porcentajes para la variable Edad se obtiene al seleccionar Edad y hacer click en Análisis y luego OK. El SAS por defecto maneja ciertos colores y elabora el histograma de porcentajes. Usted puede cambiar estas opciones si así lo desea. También puede elaborar histograma para la variable Edad discriminado por la variable Trabaja. Para esto dicha variable es especificada en Class. Se muestran ambos procedimientos. (Observe que siempre al lado izquierdo se va registrando todo lo que se hace y en cualquier momento basta hacer doble clic para tener acceso a dichos resultados).
Diagrama de Cajas y Bigotes (Box Plot) Las opciones que aparecen al seleccionar esta opción son muy similares a las anteriores. En la opción Display puede controlar el color y los símbolos para datos atípicos. Un Box Plot para la variable Promedio es:
El mismo Box Plot para promedio pero clasificado por estrato Resulta:
Diagrama de Dispersión (Scater Plot) En esta opción hay dos posibilidades Bidimensional y Tridimensional. Explicamos el bidimensional. Al seleccionar la opción de interés se debe especificar la variable en el eje X y la Variable en el eje Y. Si lo desea puede elaborar este gráfico discriminado por cualesquiera de las otras dos variables discretas. Graficamos Horasest contra Promedio. Recuerde que el Display permite modificar colores y símbolo usado para el gráfico. Veamos el gráfico respectivo:
El mismo gráfico pero discriminado por la variable Trabaja:
Un gráfico de dispersión Tridimensional (con el Promedio en el eje Z, Edad en el eje X y Horasest en el eje Y) Las líneas de referencia así como el símbolo utilizado en el gráfico son seleccionadas al hacer clic en la opción Display, al igual que el color de los puntos en el gráfico. Si se desea un gráfico similar pero discriminado por la variable Trabaja, basta seleccionar dicha variable en la opción Variables. Aparecerá un gráfico para cada valor de la variable Trabaja.
Gráfico de Contornos (Contour Plot) Imagínese una montaña que es cortada en rodajas pero paralelas al piso de la montaña, o recorrer la montaña por caminos paralelos a la base de la montaña. Los recorridos o cortes son en esencia Contornos. Los contornos identifican observaciones tridimensionales a una misma altura. LA estructura es muy similar al diagrama de dispersión tridimensional. Puede elegir el número de contornos, el tipo de representación, si los contornos tienen o no etiqueta, etc. Un ejemplo de un gráfico de Contorno con 10 niveles es:
Gráfico de Superficies (Surface Plot) La estructura es muy similar al Gráfico de contornos, se seleccionan las variables en los respectivos ejes y en la opción Display se puede escoger los colores de dicho gráfico (color encima y debajo), numero de divisiones a utilizar en los ejes X, Y y el eje Z, escoger líneas de referencia, ángulo de rotación del gráfico, etc. Para las mismas tres variables se tiene:
En el submenú de íconos podemos seleccionar el correspondiente a Tablas y seleccionar entre diferentes opciones. Una tabla de Estrato vs Trabaja es (1 corresponde a No trabaja y 2 a Trabaja):
Exploremos ahora el menú Statistics.
Veamos el submenú Descriptive. Estadísticas Básicas (Summary Statisitics) Este tipo de análisis tiene sentido para variables continuas o discretas con muchos valores. Produce estadísticos básicos, Histogramas, cajas y bigotes, discriminados o no por otra variable. En los diferentes menús que aparecen usted puede seleccionar la medidas de su interés así como los gráficos. Los siguientes gráficos ilustran lo que s e quiere explicar.
Puede seleccionar uno o los dos. En la opción Class puede especificar una variable discreta si desea análisis discriminados por una tercera variable. Los resultados obtenidos son:
Las mismas estadísticas y gráficos pero discriminados por Trabaja se obtienen al seleccionar la variable Trabaja en la opción Class. Estos resultados son:
En este caso son 134 los que no trabajan con una edad promedio alrededor de los 23 años y los que trabajan tienen una edad promedio entre los 27 y 28 años. Se muestran los histogramas para la variable Edad tanto par los que No trabajan como para los que trabajan. Distribuciones (Distrtibutions). Este submenú permite obtener estadísticas básicas de variables, pero calculando medidas básicas (Momentos), medidas de variabilidad, percentiles, gráficos de Caja y Bigotes, Histogramas, Gráficos de Probabilidad normal y un gráfico Cuantil-Cuantil, además de ajustar curvas de algunas distribuciones al histograma. La opción Plots, permite generar los gráficos antes mencionados, la opción Fit, permite indicar el tipo de distribución que se quiere ajustar al histograma. En el recuadro con la opción Class, se puede especificar alguna variable discriminatoria para realizar análisis comparativos. Seleccionando el gráfico Cuantil-Cuantil se muestran los resultados para la variable Edad.
1 2
2
3 !
4
9 : !! 1 ==
6 7 8 ! <
! $**D ((D (0D (*D )0D 0*D %0D $ $*D 0D $D *D
! !
! !
8 ! +( +% -0 -% %) %+ %$ %* $( $, $)
;;;;5 : ! ;;;;
!
$+) (% $+' ($ $(0
# %+&',%(%+&***** %$&*****
%*0 0*'* %'&*$$)$'( -&*()%-(-( 0-*'&-(*%+ *&-0'%$$%$
! ;;;;/ 7
8 ! $) $) $, $, $(
!
5
! %*0 %+&',%(%', 0&$**$',-% $&+,+'()0+ $-*%*% %*&''%)-)-
!
! ;;
!
8 ! -, +* +% +% +(
-0 %, $0$,+ (+
A! 7 7
9
2
! ! =
5
;
!
7
"
7
4 ;
'(&%(%(0 $*%&0 $*00)&0
0&$**$) %'&*$$)% -%&***** '&*****
*>*
;;;;;. B B> B>
;;;;;; C&***$ C&***$ C&***$
Correlaciones (Correlations...) Esta opción permite calcular medidas de dependencia entre las variables de interés ( variables continuas). En la respectiva ventana se especifican las variables de interés. Dejamos a consideración del usuario explorar las opciones con las que cuenta el submenú. Conteos y Frecuencias (Frequency Counts) Similar a la opción de generación de tablas. Permite además de crear tablas de frecuencias, generar gráficos de barras para las variables implicadas. El usuario puede explorar sin problemas las opciones del submenú.