FUNDAMENTOS DE BASE DE DATOS
Ing. Jackeline Vera Avalos
Introducción Un archivo es un elemento de información conformado por un
conjunto de registros. Estos registros a su vez están compuestos por una serie de caracteres o bytes. Los archivos, alojados en dispositivos de almacenamiento, pueden almacenarse de dos formas diferentes: archivos convencionales o bases de datos. Los archivos convencionales, pueden organizarse como archivos secuenciales o archivos directos. Sin embargo, el almacenamiento de información a través de archivos convencionales presenta una serie de limitaciones que restringen de manera importante la versatilidad de los programas de aplicación que se desarrollan.
El uso de sistemas de información por parte de las
organizaciones requiere el almacenamiento de grandes cantidades de información, ya sea para el uso mismo del sistema, para generar resultados o para compartir dicha información con otros sistemas. Las formas en las cuales pueden organizarse son archivos secuenciales o archivos directos. En los archivos secuenciales los registros están almacenados en una secuencia que depende de algún criterio definido. Por ejemplo, pueden almacenarse los registros de los empleados de la empresa de manera secuencial de acuerdo al departamento al que pertenecen o de acuerdo a su antigüedad. Si se desea consultar o modificar información, también es necesario buscar uno por uno en los registros hasta encontrarla. Los archivos directos permiten accesar directamente un registro de información sin tener que buscar uno a uno por todos los registros del archivo, utilizando una llave de acceso dentro del archivo.
Definición de Base de Datos Relacional Es una serie de datos organizados y relacionados entre sí, los
cuales son recolectados y explotados por los sistemas de información de una empresa o negocio en particular. Las bases de datos proporcionan la infraestructura requerida para los sistemas de apoyo a la toma de decisiones y para los sistemas de información estratégicos, ya que estos sistemas explotan la información contenida en las bases de datos de la organización para apoyar el proceso de toma de decisiones o para lograr ventajas competitivas. Por este motivo es importante conocer la forma en que están estructuradas las bases de datos y su manejo. Desventajas: Requieren conocimientos especializados y su operación requiere personal calificado (lo cual es caro). Su precio como producto también es caro.
Componentes Principales Datos. Son la Base de Datos propiamente dicha. Hardware. Se refiere a los dispositivos de almacenamiento en
donde reside la base de datos, así como a los dispositivos periféricos (unidad de control, canales de comunicación, etc.) necesarios para su uso. Software. Está constituido por un conjunto de programas que se conoce como Sistema Manejador de Base de Datos (DMBS: Data Base Management System). Este sistema maneja todas las solicitudes formuladas por los usuarios a la base de datos. Usuarios. Existen tres clases de usuarios relacionados con una Base de Datos: El programador de aplicaciones, quien crea programas de aplicación que utilizan la base de datos. El usuario final, quien accesa la Base de Datos por medio de un lenguaje de consulta o de programas de aplicación. El administrador de la Base de Datos (DBA: Data Base Administrator), quien se encarga del control general del Sistema de Base de Datos.
Ventajas de las Bases de Datos Relacionales Globalización de la información. Permite a los diferentes
usuarios considerar la información como un recurso corporativo que carece de dueños específicos. Eliminación de información redundante. Eliminación de información inconsistente. Permite compartir información. Varios sistemas o usuarios pueden utilizar una misma entidad. Permite mantener la integridad en la información. Solo se almacena la información correcta. Independencia de datos. Implica un divorcio entre programas y datos; es decir, se pueden hacer cambios a la información que contiene la base de datos o tener acceso a la base de datos de diferente manera, sin hacer cambios en las aplicaciones o en los programas.
Tipos de modelos de Datos Existen fundamentalmente tres alternativas disponibles para diseñar las bases de datos: El modelo jerárquico: La forma de esquematizar la información se realiza a través de representaciones jerárquicas o relaciones de padre/hijo, de manera similar a la estructura de un árbol. Así, el modelo jerárquico puede representar dos tipos de relaciones entre los datos: relaciones de uno a uno y relaciones de uno a muchos. En el primer tipo se dice que existe una relación de uno a uno si el padre de la estructura de información tiene un solo hijo y viceversa, si el hijo tiene solamente un padre. En el segundo tipo se dice que la relación es de uno a muchos si el padre tiene más de un hijo, aunque cada hijo tenga un solo padre. Inconveniente: Relación maestroalumno, donde un maestro tiene varios alumnos, pero un alumno también tiene varios maestros, uno para cada clase. En este caso, si la información estuviera representada en forma jerárquica donde el padre es el maestro y el alumno es el hijo, la información del alumno tendrá que duplicarse para cada uno de los maestros. Otra dificultad del modelo jerárquico de representación de datos es respecto a las bajas. Si se desea dar de baja a un padre, esto necesariamente implicará dar de baja a todos y cada uno de los hijos que dependen de este padre.
El modelo de red: Este modelo evita esta redundancia en la información, a través de la incorporación de un tipo de registro denominado el conector, que en este caso pueden ser las calificaciones que obtuvieron los alumnos de cada profesor. La dificultad surge al manejar las conexiones o ligas entre los registros y sus correspondientes registros conectores. El modelo relacional: Se está empleando con más frecuencia en la práctica, debido el rápido entendimiento por parte de los usuarios que no tienen conocimientos profundos sobre Sistemas de Bases de Datos y a las ventajas que ofrece sobre los dos modelos anteriores. En este modelo toda la información se representa a través de arreglos bidimensionales o tablas. Estas operaciones básicas son: Seleccionar renglones de alguna tabla (SELECT) Seleccionar columnas de alguna tabla (PROJECT) Unir o juntar información de varias tablas (JOIN) Es importante mencionar que la mayoría de los paquetes que manejan bases de datos disponibles en el mercado poseen las instrucciones SELECT, PROJECT Y JOIN con diferentes nombres y modalidades.
Arquitectura de una Base de Datos Las bases de datos respetan la arquitectura de tres niveles definida (por el grupo ANSI/SPARC):
Nivel interno (Físico): Es el nivel más bajo de abstracción, y define cómo se almacenan los datos, ya sea en registros, en el soporte físico, así como los métodos de acceso. Este nivel es usado por muy pocas personas que deben estar cualificadas para ello. Nivel conceptual: Es el nivel medio de abstracción. Se trata de la representación de los datos realizada por la organización, que recoge las vistas parciales de los requerimientos de los diferentes usuarios y las aplicaciones posibles. Se configura como visión organizativa total, e incluye la definición de datos y las relaciones entre ellos. Se trata con la entidad u objeto representado, sin importar como está representado o almacenado. Nivel externo (Visión): Es el nivel de mayor abstracción. A este nivel corresponden las diferentes vistas parciales que tienen de la base de datos los diferentes usuarios. En cierto modo, es la parte del modelo conceptual a la que tienen acceso. Por ejemplo el caso del empleado que no tiene porqué tener acceso al sueldo de sus compañeros o de sus superiores.
Niveles de la arquitectura de bases de datos:
Tendencias Futuras La explotación efectiva de la información dará ventaja
competitiva a las organizaciones. Las bases de datos orientadas a objetos empleadas para diseño y manufactura asistida por computadora CAD/CAM serán utilizados a un mismo nivel que las Bases se Datos relacionales de la actualidad. Los lenguajes de consulta (SQL) permitirán el uso del lenguaje natural para solicitar información de la Base de Datos, haciendo más rápido y fácil su manejo. XML (eXtensible Markup Language) convierta a Internet en un sistema de bases de datos, haciendo posible especificar consultas en el estilo de los manejadores de bases de datos tradicionales lo cual da muchos mejores resultados que las actuales máquinas de búsqueda.
Algunas Bases de Datos
SQL Server ORACLE dBASE IV FOXPRO FOXBASE PARADOX ACCESS APPROACH INFORMIX DB2 PROGRESS SYBASE
Herramienta CASE: Erwin/ER 4.1