EL MODELO RELACIONAL DE BASE DE DATOS Codd propuso que los sistemas de base de datos deberían presentarse a los usuarios con una visión de los datos organizados en estructuras llamadas relaciones, definidas como conjunto de tuplas o filas y no como series o secuencia de objetos, con lo que el orden no es importante. El usuario de un sistema relacional solo debía preocuparse por el que consultar y no él cómo de las estructuras de almacenamiento. Las ideas de Codd fueron rechazadas por IBM, por lo tanto decidió ir a IMS. Se obtuvo un sistema llamado el Ingres, que fue creado por un grupo de la Universidad de Berkeley en California, dirigido por Michael Stonebreaker en 1974, y fue el primer manejador relacional de base de daros funcional, debido a esto IBM se vio amenazado lo cual creo un sistema relacional, System R, el SEQUEL que luego paso a llamarse SQL. Para entonces Larry Ellison, tomo ventajas sobre los escritos de Codd, para crear un nuevo producto, Oracle. En 1985 publico sus famosas 12 reglas sobre el modelo relacional de BD. Codd también participo en el modelo multidimensional de análisis de datos conocido como OLAP, que luego sus amigos hicieron las “12 reglas para OLAP”. Recibió incontables reconocimientos entre ellos el “Premio Turing” en 1981 por la ACM, por ser el mejor en informática. LA ESENCIA DEL MODELO La estructura del modelo relacional es la relación, es decir una tabla bidimensional constituida por filas (tuplas) y columnas (atributos). Las relaciones representan las entidades. Cada instancia de la entidad encontrará sitio en una tupla relación, mientras que los atributos de la relación representan las propiedades de la entidad. Las tuplas en una relación son un conjunto en el sentido matemático del término, es decir una colección no ordenada de elementos diferentes. Para distinguir una tupla de otra, se recurre al concepto de "llave primaria", o sea un atributo o conjunto de atributos que permiten identificar unívocamente una tupla en una relación. En una relación puede haber más combinaciones de atributos que permitan identificar unívocamente una tupla ("llaves candidatas"), pero entre éstas se elegirá una sola para utilizar como llave primaria. Los atributos de la llave primaria no pueden asumir el valor nulo.
Cada atributo de una relación se caracteriza por un nombre y por un dominio. El dominio indica qué valores pueden ser asumidos por una columna de la relación, se define a través de la declaración de un tipo para el atributo. El motor de datos se ocupará de controlar que en los atributos de las relaciones se incluyan sólo los valores permitidos por sus dominios. Característica fundamental de los dominios de una base de datos relacional es que sean "atómicos", se dice que no es posible tener atributos con valores múltiples (multivaluados). La normalización, o sea la razón y uso de las formas normales, es evitar la repetición innecesaria de datos (redundancia). El Dr. Codd también propuso el álgebra relacional, un lenguaje formal con una serie de operadores que trabajan sobre una o varias relaciones para obtener otra relación resultado, sin que cambien las relaciones originales. Codd originalmente propuso ocho operandos pero sólo cinco son fundamentales: restricción, proyección, producto cartesiano, unión y diferencia, que permiten realizar la mayoría de las operaciones de obtención de datos. Los operadores no fundamentales son la concatenación (join), la intersección y la división. La restricción y la proyección son operaciones unarias porque operan sobre una sola relación. El resto de las operaciones son binarias porque trabajan sobre pares de relaciones. Desarrolló el primer lenguaje relacional llamado ALPHA el cual formó el fundamento para el desarrollo subsecuente de lenguaje SQL (original SEQUEL). El comité ANSI/SPARC de 1975 definió la separación en tres niveles de los sistemas manejadores de bases de datos: externo, conceptual e interno que vinieron a redundar en lo que ahora se conoce como subesquema externo, esquema lógico y esquema físico. En otras palabras: los modelos conceptual, lógico y físico. Sin embargo, fue el Dr. Codd quien estableció los fundamentos para esta separación con conceptos tales como la independencia lógica y física de los datos (reglas 8 y 9), de independencia, integridad y distribución (reglas 10 y 11). A partir del modelo relacional el usuario no tendría por qué preocuparse de los aspectos técnicos de la base de datos. EL DEBATE ENTIDAD-RELACIÓN VS. ESQUEMA EN ESTRELLA En la década de 1990 hubo un fuerte impulso en pro de la tecnología del data warehousing. Hubo un debate acerca de cómo implementar un data warehouse, donde resaltaron el modelado Entidad-Relación (E-R), donde las entidades representan relaciones normalizadas (por lo general, en tercera forma normal); y segundo el esquema en estrella (E-E), donde las entidades se modelan en tablas con hechos y dimensiones.
En una base de datos completamente normalizada, es suficiente para el diseñador declarar restricciones al manejador sustentadas en la llave, lo cual garantiza la integridad y consistencia de la base de datos. Modelo Entidad relación; es solo y exclusivamente un método del que disponemos para diseñar estos esquemas que posteriormente debemos de implementar en un gestor de BBDD (bases de datos). Este modelo se representa a través de diagramas y está formado por varios elementos. Este modelo habitualmente, además de disponer de un diagrama que ayuda a entender los datos y como se relacionan entre ellos, debe de ser completado con un pequeño resumen con la lista de los atributos y las relaciones de cada elemento. Modelo Esquema estrella; en las bases de datos usadas para data warehousing, un esquema en estrella es un modelo de datos que tiene una tabla de hechos que contiene los datos para el análisis, rodeada de las tablas de dimensiones. Este aspecto, de tabla de hechos (o central) más grande rodeada de radios o tablas más pequeñas es lo que asemeja a una estrella, dándole nombre a este tipo de construcciones. Las tablas de dimensiones tendrán siempre una clave primaria simple, mientras que en la tabla de hechos, la clave principal estará compuesta por las claves principales de las tablas dimensionales. EL FUTURO DEL MODELO RELACIONAL Ya desde principios de 1990 se hablaba del “fin del modelo relacional” y su sustitución por las bases de datos orientadas a objetos. Pero el caso es que en el año 2001 de 8 mil 884 millones de dólares pagados por licencias de bases de datos, 7 mil 107 correspondieron al modelo relacional. Más significativo es el hecho de que en el año 2000 las ventas para bases de datos relacionales tuvieron un incremento del 15% en tanto, para bases de datos orientadas a objetos y de otro tipo tuvieron un incremento negativo. La adición de nuevas características al modelo relacional es asunto de intenso debate así como la modernización y adecuación del lenguaje SQL a las exigencias siempre cambiantes de un entorno
de gran competencia. En resumen, el modelo relacional de bases de datos es un estándar de la industria consolidado, una tecnología confiable y eficiente que estará entre nosotros aún por muchos años antes de que sea desplazada por una nueva y mejor.