2009 DataWerehouse
Seminario2 Segundo Semestre Ingeniería en Ciencias y Sistemas
Edwin Nájera. --- 200516280
17/09/2009
DataWerehouse 17 de septiembre de 2009
Descripción de las tablas y campos En este caso voy a tener lo que son 6 dimensiones en donde cada una juega un papel importante para la creación del cubo, que posteriormente nos será útil para poder tomar unadecisión.
Cliente En esta dimensión se tendrá toda la información del cliente. - ID_cliente: Dato con el cual se va a identificar el cliente en todo el sistema - Nombre: Nombre completo de la persona, en donde identificamos a una persona como tal - Email: dirección del correo, en donde le llegara la información - Tipo_id: Número que identifica al tipo de cliente, este puede ser individual o empresa - Tipo: Descripción del tipo de cliente - Acepta_email: Especifica si requiere que le llegue la notificación por email o no - Fecha_modificacion: Fecha en donde se registraron las últimas modificaciones del cliente
Producto En esta dimensión se tendrá toda la información necesaria de los productos que se tiene. - ID: Este campo no es útil para poder identificar el producto de una manera más eficiente - Nombre: Es la identificación del producto de una manera mas clara y más fácil de entender. - Id_subcategoria: Identificador de la subcategoría, en el refleja el numero de dicho campo - Subcategoria: nombre explicito de la subcategoría. - Id_categoria: Identificador de la categoría, el cual refleja el numero de dicho campo - Categoria: nombre explicito de la categoria. - Ranking: En este campo indica la posición de las ventas de dicho producto. Territorio En esta dimensión se tendrá los datos de las localidades y/o territorios. - id_territorio: Identificador general, para poder identificar de una mejor manera al territorio. - Nombre: nos indica de una manera explicita el territorio.
DataWerehouse 17 de septiembre de 2009 -
region_code: Abreviación de dicha región, este es un estándar country: Nombre del lugar a donde pertenece dicho territorio, en otras palabras es el país
Tiempo Dimensión importante en donde se establece la frecuencia de las actividades. - Id: Identificador secuencial con respecto a la fecha, hace una manera más fácil la búsqueda de datos - Anio: como su nombre lo indica, nos representa el año. - Trimestre: Se especifica el trimestre al cual pertenece. - mes: como su nombre lo indica, nos representa el mes. - dia: como su nombre lo indica, nos representa el día. - shipdate: como su nombre lo indica, representa el día de la compra.
Factura Dimensión que posee el número de la factura, de esta forma desglosamos una factura de sus datos primordiales con los datos del detalle de la misma Detalle_factura En esta dimensión contiene la especificación de la factura, como estan los siguientes datos: - Id_detalle: Especifica el identificador global del detalle según la factura - Factura: Número de factura, del cual pertenece dicho detalle - Id_producto: número del producto, el cual es parte del detalle - Cantidad: cantidad de unidades que se tiene en el detalle de la factura - Precio_lista: precio del producto, en la lista del sistema. - Costo_estandar: costo del producto. FACT Esta es la base de todo el modelo, la tabla fact, contiene las métricas más importantes, en este caso: - id_Factura: Número de la factura. - Id_Cliente: Número de identificador del cliente - ID_territorio: Número de identificación del territorio. - Sub_total: sub total de la factura. - Freight: costo del flete. - Taxamt: costo del impuesto - Shipdate: fecha de envio, de la factura. - Totaldue: total de los impuestos aduanero.
DataWerehouse 17 de septiembre de 2009 Empleado En esta tabla se encuentra todos los datos de los empleados, datos que nos ayudan a la toma de una decisión. Los campos que esta tabla posee son los siguientes: - Id_empleado: identificador único en la tabla y corresponde a un empleado. - Nombre: es el indicador por su nombre. - Puesto: el puesto que desempeña dentro de la empresa - Turno: el turno al cual está asignado esta persona. - Salario: el monto de su paga.
Después de tener construido nuestro modelo estrella vamos a llegar las tablas de nuestra estrella por medio del ETL
Proceso de ETL Como primer paso debemos crear el tipo de proyecto especifico para realizar este tipo de proceso. Para ello vamos a dar clic sobre Inicio y luego en todos los programas y luego en SQL Server Business Intelligence Development Studio
DataWerehouse 17 de septiembre de 2009
Luego creamos un nuevo proyecto de Integration Services
DataWerehouse 17 de septiembre de 2009 Ya que tenemos nuestro proyecto en limpio empezamos a poner los diferentes componentes.
Una vez que tenemos listo nuestro proyecto y ponemos un componente de flujo de datos, y posteriormente ponemos un OLE DB Source y un OLE DB Destination una vez que tenemos eso nos queda de este modo.
DataWerehouse 17 de septiembre de 2009
En el OLE DB Source ponemos nuestro Query el cual nos va a servir para extraer la información.
DataWerehouse 17 de septiembre de 2009
Después debemos de establecer cuál es la tabla destino.
DataWerehouse 17 de septiembre de 2009
Después de repetir este proceso en todas las tablas nos queda de esta forma.
Una vez que la carga de datos esta exitosa nos muestra la siguiente forma.
DataWerehouse 17 de septiembre de 2009
Generación del cubo.
DataWerehouse 17 de septiembre de 2009
DataWerehouse 17 de septiembre de 2009
DataWerehouse 17 de septiembre de 2009
DataWerehouse 17 de septiembre de 2009
DataWerehouse 17 de septiembre de 2009
DataWerehouse 17 de septiembre de 2009
DataWerehouse 17 de septiembre de 2009
DataWerehouse 17 de septiembre de 2009
DataWerehouse 17 de septiembre de 2009
DataWerehouse 17 de septiembre de 2009
DataWerehouse 17 de septiembre de 2009
DataWerehouse 17 de septiembre de 2009
DataWerehouse 17 de septiembre de 2009
DataWerehouse 17 de septiembre de 2009
DataWerehouse 17 de septiembre de 2009
DataWerehouse 17 de septiembre de 2009