Información y Datos El Concepto de Datos. Datos son los hechos que describen sucesos y entidades."Datos" es una palabra en plural que se refiere a más de un hecho. A un hecho simple se le denomina "data-ítem" o elemento de dato. Los datos son comunicados por varios tipos de símbolos tales como las letras del alfabeto, números, movimientos de labios, puntos y rayas, señales con la mano, dibujos, etc. Estos símbolos se pueden ordenar y reordenar de forma utilizable y se les denomina información. Los datos son símbolos que describen condiciones, hechos, situaciones o valores. Los datos se caracterizan por no contener ninguna información. Un dato puede significar un número, una letra, un signo ortográfico o cualquier símbolo que represente una cantidad, una medida, una palabra o una descripción. La importancia de los datos está en su capacidad de asociarse dentro de un contexto para convertirse en información. Por si mismos los datos no tienen capacidad de comunicar un significado y por tanto no pueden afectar el comportamiento de quien los recibe. Para ser útiles, los datos deben convertirse en información para ofrecer un significado, conocimiento, ideas o conclusiones. El Concepto de Información. La información no es un dato conjunto cualquiera de ellos. Es más bien una colección de hechos significativos y pertinentes, para el organismo u organización que los percibe. La definición de información es la siguiente: Información es un conjunto de datos significativos y pertinentes que describan sucesos o entidades. DATOS SIGNIFICATIVOS. Para ser significativos, los datos deben constar de símbolos reconocibles, estar completos y expresar una idea no ambigua. Los símbolos de los datos son reconocibles cuando pueden ser correctamente interpretados. Muchos tipos diferentes de símbolos comprensibles se usan para transmitir datos. La integridad significa que todos los datos requeridos para responder a una pregunta específica están disponibles. Por ejemplo, un marcador de béisbol debe incluir el tanteo de ambos equipos. Si se oye el tanteo "New York 6" y no oyes el del oponente, el anuncio será incompleto y sin sentido. Los datos son inequívocos cuando el contexto es claro. Por ejemplo, el grupo de signos 2-x puede parecer "la cantidad 2 menos la cantidad desconocida llamada x" para un estudiante de álgebra, pero puede significar "2 barra x" a un vaquero que marca ganado. Tenemos que conocer el contexto de estos símbolos antes de poder conocer su significado. Otro ejemplo de la necesidad del contexto es el uso de términos especiales en diferentes campos especializados, tales como la contabilidad. Los contables utilizan muchos términos de forma diferente al público en general, y una parte de un aprendizaje de contabilidad es aprender el lenguaje de contabilidad. Así
los términos Debe y Haber pueden significar para un contable no más que "derecha" e "izquierda" en una contabilidad en T, pero pueden sugerir muchos tipos de ideas diferentes a los no contables. DATOS PERTINENTES. Decimos que tenemos datos pertinentes (relevantes) cuando pueden ser utilizados para responder a preguntas propuestas. Disponemos de un considerable número de hechos en nuestro entorno. Solo los hechos relacionados con las necesidades de información son pertinentes. Así la organización selecciona hechos entre sucesos y entidades particulares para satisfacer sus necesidades de información. Diferencia entre Datos e información. 1. Los Datos a diferencia de la información son utilizados como diversos métodos para comprimir la información a fin de permitir una transmisión o almacenamiento más eficaces. 2. Aunque para el procesador de la computadora hace una distinción vital entre la información entre los programas y los datos, la memoria y muchas otras partes de la computadora no lo hace. Ambos son registradas temporalmente según la instrucción que se le de. Es como un pedazo de papel no sabe ni le importa lo que se le escriba: un poema de amor, las cuentas del banco o instrucciones para un amigo. Es lo mismo que lamemoria de la computadora. Sólo el procesador reconoce la diferencia entre datos e información de cualquier programa. Para la memoria de la computadora, y también para los dispositivos de entrada y salida (E/S) y almacenamiento en disco, un programa es solamente más datos, más información que debe ser almacenada, movida o manipulada. 3. La cantidad de información de un mensaje puede ser entendida como el número de símbolos posibles que representan el mensaje."los símbolos que representan el mensaje no son más que datos significativos. 4. En su concepto más elemental, la información es un mensaje con un contenido determinado emitido por una persona hacia otra y, como tal, representa un papel primordial en el proceso de la comunicación, a la vez que posee una evidente función social. A diferencia de los datos, la información tiene significado para quien la recibe, por eso, los seres humanos siempre han tenido la necesidad de cambiar entre sí información que luego transforman en acciones. "La información es, entonces, conocimientos basados en los datos a los cuales, mediante un procesamiento, se les ha dado significado, propósito y utilidad"
El Concepto de Procesamiento de Datos. Hasta el momento hemos supuesto que los datos que maneja una aplicación no son tan voluminosos y por lo tanto caben en memoria. Cuando recurrimos a archivos se debe a la necesidad de conservar datos después de que termina un programa, por ejemplo para apagar el computador. Sin embargo, existen problemas en donde el volumen de datos es tan grande que es imposible mantenerlos en memoria. Entonces, los datos se almacenan en un conjunto de archivos, los que forman una base de datos. Una base de datos es por lo tanto un conjunto de archivos que almacenan, por ejemplo, datos con respecto al negocio de una empresa. Cada archivo se forma en base a un conjunto de líneas y cada línea esta formada
por campos de información. Todas las líneas de un mismo archivo tienen la misma estructura, es decir los mismos campos de información. Diferentes archivos poseen estructuras distintas, i.e. campos de información. Por ejemplo, el archivo de postulantes post.dat, visto en capítulos anteriores, tiene la siguiente información: • •
carnet de identidad de la persona. Nombre de la persona.
En lo que sigue de datos: Las unidades de disco de la computadora y otros medios de almacenamiento externo permiten almacenar los datos a más largo plazo, manteniéndolos disponibles pero separados del circuito principal hasta que el microprocesador los necesita. Una computadora dispone también de otros tipos de almacenamiento. La memoria de sólo lectura (ROM) es un medio permanente de almacenamiento de información básicasupondremos que ambos archivos son lo suficientemente grandes como para que no quepan en la memoria del computador. A continuación resolveremos eficientemente el problema de generar un archivo con los tres campos de información, sin colocar previamente el contenido de un archivo en un arreglo. Algunas definiciones Recolección de datos: Provee un vínculo para obtener la información interoperacionables racional y las parametrizaciones. Almacenamiento, como las instrucciones de inicio y los procedimientos de entrada/salida. Asimismo, una computadora utiliza varios buffers (áreas reservadas de la memoria) como zonas de almacenamiento temporal de información específica, como por ejemplo los caracteres a enviar a la impresora o los caracteres leídos desde el teclado. Procesamiento de datos: a. El objetivo es graficar el Procesamiento de Datos, elaborando un Diagrama que permita identificar las Entradas, Archivos, Programas y Salidas de cada uno de los Procesos. b. Su antecedente es el Diagrama de Flujo. c. Los elementos claves son los Programas. d. Se confecciona el Diagrama de Procesamiento de Datos e. Este Diagrama no se podrá elaborar por completo desde un primer momento ya que depende del Flujo de Información. f. En este primer paso sólo se identifican las Salidas y Programas. Los elementos restantes se identifican en forma genérica. Validación de datos: Consiste en asegurar la veracidad e integridad de los datos que ingresan a un archivo. Existen numerosas técnicas de validación tales como: Digito verificador, chequeo de tipo, chequeo de rango. Concepto de Procesamiento Distribuido y Centralizado
Procesamiento Centralizado: En la década de los años 50’s las computadoras eran máquinas del tamaño de todo un cuarto con las siguientes características: • Un CPU • Pequeña cantidad de RAM • Dispositivos DC almacenamiento secundario (cintas) • Dispositivos d salida (perforadoras de tarjetas) • Dispositivos de entrada (lectores de tarjeta perforada) Con el paso del tiempo, las computadoras fueron reduciendo su tamaño y creciendo en sofisticación, • Aunque la industria continuaba siendo dominada por las computadoras grandes "mainframes". A medida que la computación evolucionaba, las computadoras, fueron capaces de manejar aplicaciones múltiples simultáneamente, convirtiéndose en procesadores centrales "hosts" a los que se les Conectaban muchos periféricos y terminales tontas que consistían solamente de dispositivos de entrada/salida (monitor y teclado) y quizá poco espacio de almacenamiento, pero que no podían procesar por sí mismas. Las terminales locales se conectaban con el procesador central a través de interfaces seriales ordinarias de baja velocidad, mientras que las terminales remotas se enlazaban con • El "host" usando módems y líneas telefónicas conmutadas. En este ambiente, se ofrecían velocidades de transmisión de 1200, 2400, o 9600 bps. Un ambiente como el descrito es lo que se conoce como procesamiento centralizado en su forma más pura "host/terminal". Aplicaciones características de este tipo de ambiente son: • Administración de grandes tuses de datos integradas • Algoritmos científicos de alta velocidad • Control de inventarios centralizado Al continuar la evolución de los "mainframes", estos se comenzaron a conectar a enlaces de alta velocidad donde algunas tareas relacionadas con las comunicaciones se delegaban a otros dispositivos llamados procesadores comunicaciones "Front End Procesos" (I7EP’s) y controladores de grupo"Cluster Controllers" (CC’s). Procesamiento Distribuido: El procesamiento centralizado tenía varios inconvenientes, entre los que podemos mencionar que un número limitado de personas controlaba el acceso a la información y a los reportes, se requería un grupo muy caro de desarrolladores de sistemas para crear las aplicaciones, y los costos de mantenimiento y soporte eran extremadamente altos. La evolución natural de la computación fue en el sentido del procesamiento distribuido, así las minicomputadoras (a pesar de su nombre siguen siendo máquinas potentes) empezaron a tomar parte del procesamiento que tenían los "mainframes". Ventajas Existen cuatro ventajas del procesamiento de bases de datos distribuidas. La primera, puede dar como resultado un mejor rendimiento que el que se obtiene por un procesamiento centralizado. Los datos pueden colocarse cerca del punto de su utilización, de forma que el tiempo de comunicación sea mas corto. Varias computadoras operando en forma simultánea pueden entregar más volumen de
procesamiento que una sola computadora. Segundo, los datos duplicados aumentan su confiabilidad. Cuando falla una computadora, se pueden obtener los datos extraídos de otras computadoras. Los usuarios no dependen de la disponibilidad de una sola fuente para sus datos .Una tercera ventaja, es que los sistemas distribuidospueden variar su tamaño de un modo más sencillo. Se pueden agregar computadoras adicionales a la red conforme aumentan el número de usuarios y su carga de procesamiento. A menudo es más fácil y más barato agregar una nueva computadora más pequeña que actualizar una computadora única y centralizada. Después, si la carga de trabajo se reduce, el tamaño de la red también puede reducirse. Por último, los sistemas distribuidos se pueden adecuar de una manera más sencilla a las estructuras de la organización de los usuarios. Estructura de Datos utilizados en el proceso electrónico de datos Arreglos Son una agrupación de datos homogéneos, es decir, con un mismo tipo de dato básico asociado. Se almacenan en forma contigua en la memoria y son referenciados con un nombre común y una posición relativa. Ejemplos: Arreglo Lineal (1 dimensión ó vector) Vista gráfica [1] [2] [3] [4] [5] Definición de tipo Type Linea: Array [1..5] of TipoBasico; Var MiArreglo:Linea; Arreglo Bidimensional (matriz) Vista gráfica [1,1] [1,2] [1,3]
Definición de tipo
[1,4]
Type TipoTabla:Array[1..3,1..4] of TipoBasico; Var MiTabla: TipoTabla;
[2,1] [2,2] [2,3] [2,4] [3,1] [3,2]
[3,3] [3,4] Pilas o colas Lifo: Imagina un montón de platos "apilados" o bien fichas de dominó formando una torre e intenta eliminar una desde el centro, ¿qué ocurre?, naturalmente esta operación no está permitida si queremos mantener intactos a los platos o a la torre construida. Por esta razón, una pila se asocia a una estructura de datos LIFO (LAST IN FIRST OUT). En base a lo anterior, construye la definición de una PILA y discútela con el profesor. En general, podemos definir para cada una de las estructuras de datos una representación estática y otra dinámica según el método de asignación de memoria utilizado. Clasificación a.)Pila estática: Sin duda tendremos que utilizar arreglos o registros que como ya sabemos son la base para estructuras de datos más complejas. Considerando la siguiente figura: Vista gráfica
Suponiendo que Dato pertenece a un mismo tipo de datos y Cuenta Dato corresponde a un entero que se incrementa a medida que un nuevo elemento se incorpora a la pila. Intenta construir la definición de tipo para la estructura Pila. TYPE ______________________________ ______________________________ ______________________________ END; b.)Pila Dinámica: Sin duda tendremos que utilizar nodos con punteros. Considera la siguiente figura:
Suponiendo que los punteros que aparecen en la figura son capaces de apuntar a un nodo y que Dato pertenece a cualquiera de los tipos básicos o estructurados, la definición de tipo sería:
TYPE Puntero=^NodoPila; NodoPila=Record Info:AlgunTipo; sgte:Puntero; End; Var tope:Puntero; Un concepto por introducir es el de encapsulamiento, que significa que una vez definida la estructura e implementadas las operaciones básicas, uno se remite a utilizarlas sin importar su codificación interna, es decir, las llamadas a PUSH(pila, x) o POP(pila, y) empilarán a x o desempilarán en y sin importar cómo lo hagan. c.)Listas Enlazadas: Corresponde a una estructura lineal compuesta por una colección de datos homogéneos con alguna relación entre ellos. Dicha estructura se crea a través del método dinámico de memoria. En una lista enlazada el orden de los elementos está determinado por un campo enlace (puntero) explícito en cada elemento, por ejemplo: pilas y filas dinámicas. La representación de lista enlazada es la más óptima debido a que cualquier proceso de actualización (modificación inserción o eliminación) se realiza en base a reasignación de punteros. En este capítulo trataremos sólo con las listas enlazadas ya que las listas secuénciales ya son bien conocidas por ustedes. Tipos de Listas Enlazadas • • • •
Listas lineales simplemente enlazadas Listas Circulares Listas doblemente enlazadas Listas múltiplemente enlazadas
Árboles Es una estructura de datos no lineal que posee raíz, ramas y hojas, técnicamente constituye un grafo finito y sin ciclos. Un árbol define ciertos niveles jerárquicos precedidos por la raíz (1er. nivel), en donde las hojas constituyen el nivel más bajo. Componentes Raíz: Nodo que constituye la única entrada a la estructura (por ello es necesario tener un puntero sobre él). Ramas o Arcos: Conexión entre dos nodos del árbol que representa una relación de jerarquía. Hojas: Nodo sin hijos. Características Nivel o profundidad de un nodo: Longitud del camino para ir desde la raíz al nodo. Por definición la raíz está en el nivel 0. Por ejemplo: profundidad(Y)=2, profundidad(raíz)=0, profundidad(árbol)= profundidad(hoja más profunda). Altura de un nodo: Longitud del camino más largo desde el nodo a una hoja. Por ejemplo: Altura(X)=1, Altura(Y)=0, Altura(arbol)=Altura(raíz)=profundidad(árbol)
Grado de nodo: Cantidad de hijos de un nodo cualquiera. Grado de árbol: Cantidad máxima de hijos posibles de asociar a un nodo del árbol Clasificación a.)Según Número de Hijos: b.)Según Estructura de Niveles: Arbol completo: Es un árbol binario en el cual cada nodo es una hoja o posee exactamente 2 hijos. Arbol lleno: Es un árbol binario con hojas en a lo más dos niveles adyacentes l-1 y l, en las cuales los nodos terminales se encuentran ubicados en las posiciones de más a la izquierda del árbol. Si un árbol binario es completo, necesariamente es lleno c.)Según Funcionalidad: Árbol binario de búsqueda (ABB) Árbol binario de expresión Archivos: Es una es estructura de datos que reside en memoria secundaria o almacenamiento permanente (cinta magnética, disco magnético, disco óptico, disco láser, etc.). La forma de clasificación más básica se realiza de acuerdo al formato en que residen estos archivos, de esta forma hablamos de archivos ASCII (de texto) y archivos binarios. En este capítulo nos centraremos en estos últimos. Definición archivo binario: Estructura de datos permanente compuesto por registros (filas) y éstos a su vez por campos (columnas). Se caracteriza por tener un tipo de dato asociado, el cual define su estructura interna. Definición archivo texto: Estructura de datos permanente no estructurado formado por una secuencia de caracteres ASCII. Tipos de Acceso a los Archivos Secuencial: Se accesan uno a uno los registros desde el primero hasta el último o hasta aquel que cumpla con cierta condición de búsqueda. Se permite sobre archivos de Organización secuencial y Secuencial Indexada. Random: Se accesan en primera instancia la tabla de índices de manera de recuperar la dirección de inicio de bloque en donde se encuentra el registro buscado. (dentro del rea primaria o de overflow). Se permite para archivos con Organización Sec.Indexada. Dinámico: Se accesan en primera instancia la tabla de índices de manera de recuperar la dirección de inicio de bloque en donde se encuentra el registro buscado. (dentro del rea primaria o de overflow ). Se permite para archivos con Organización Sec.Indexada.
Directo: Es aquel que utiliza la función de Hashing para recuperar los registros. Sólo se permite para archivos con Organización Relativa. Constantes Las constantes son similares a una variable pero tienen un valor determinado que se mantiene igual en toda la ejecución del programa. El contenido de una variable puede cambiar tantas veces sea necesario. ¿Porque usar una constante si no puede cambiar de valor?. Hacemos esto cuando deseamos usar un mismo número o una palabra (string) varias veces. Variables Magnitud que puede tomar diferentes valores y se representa con una letra o letras. La variable real es el conjunto de los números reales, y se puede representar por cualquier letra o conjunto de letras y nos sirve para poder utilizar dicha letra para calculos o para obtener resultados. Sistema de Información Almacenamiento de información: El almacenamiento es una de las actividades o capacidades más importantes que tiene una computadora, ya que a través de esta propiedad el sistema puede recordar la información guardada en la sección o proceso anterior. Esta información suele ser almacenada en estructuras de información denominadas archivos. La unidad típica de almacenamiento son los discos magnéticos o discos duros, los discos flexibles o diskettes y los discos compactos (CD-ROM). Procesamiento de Información: Es la capacidad del Sistema de Información para efectuar cálculos de acuerdo con una secuencia de operacionespreestablecida. Estos cálculos pueden efectuarse con datos introducidos recientemente en el sistema o bien con datos que están almacenados. Estacaracterística de los sistemas permite la transformación de datos fuente en información que puede ser utilizada para la toma de decisiones, lo que hace posible, entre otras cosas, que un tomador de decisiones genere una proyección financiera a partir de los datos que contiene un estado de resultados o un balance general de un año base. Salida de Información: La salida es la capacidad de un Sistema de Información para sacar la información procesada o bien datos de entrada al exterior. Las unidades típicas de salida son las impresoras, terminales, diskettes, cintas magnéticas, la voz, los graficadores y los plotters, entre otros. Es importante aclarar que la salida de un Sistema de Información puede constituir la entrada a otro Sistema de Información o módulo. En este caso, también existe una inter fase automática de salida. Por ejemplo, el Sistema de Control de Clientes tiene una interface automática de salida con el Sistema de Contabilidad, ya que genera las pólizas contables de los movimientos procesales de los clientes. A continuación se muestran las diferentes actividades que puede realizar un Sistema de Información de Control de Clientes: Actividades que realiza un Sistema de Información: Entradas:
• • • •
Datos generales del cliente: nombre, dirección, tipo de cliente, etc. Políticas de créditos: límite de crédito, plazo de pago, etc. Facturas (interfase automático). Pagos, depuraciones, etc. Proceso:
• • •
Cálculo de antigüedad de saldos. Cálculo de intereses moratorios. Cálculo del saldo de un cliente. Almacenamiento:
• • •
Movimientos del mes (pagos, depuraciones). Catálogo de clientes. Facturas. Salidas:
• • • •
Reporte de pagos. Estados de cuenta. Pólizas contables (interfase automática) Consultas de saldos en pantalla de una terminal.
Las diferentes actividades que realiza un Sistema de Información se pueden observar en el diseño conceptual ilustrado en la en la figura 1.2. Tipos y Usos de los Sistemas de Información Durante los próximos años, los Sistemas de Información cumplirán tres objetivos básicos dentro de las organizaciones: 1. Automatización de procesos operativos. 2. Proporcionar información que sirva de apoyo al proceso de toma de decisiones.
Lograr ventajas competitivas a través de su implantación y uso. Los Sistemas de Información que logran la automatización de procesos operativos dentro de una organización, son llamados frecuentemente Sistemas Transaccionales, ya que
su función primordial consiste en procesar transacciones tales como pagos, cobros, pólizas, entradas, salidas, etc. Por otra parte, los Sistemas de Información que apoyan el proceso de toma de decisiones son los Sistemas de Soporte a la Toma de Decisiones, Sistemas para la Toma de Decisión de Grupo, Sistemas Expertos de Soporte a la Toma de Decisiones y Sistema de Información para Ejecutivos. El tercer tipo de sistema, de acuerdo con su uso u objetivos que cumplen, es el de los Sistemas Estratégicos, los cuales se desarrollan en las organizaciones con el fin de lograr ventajas competitivas, a través del uso de la tecnología de información. Los tipos y usos de los Sistemas de Información se muestran en la figura 1.3.
A continuación se mencionan las principales características de estos tipos de Sistemas de Información. Sistemas Transaccionales. Sus principales características son: •
A través de éstos suelen lograrse ahorros significativos de mano de obra, debido a que automatizan tareas operativas de la organización.
•
Con frecuencia son el primer tipo de Sistemas de Información que se implanta en las organizaciones. Se empieza apoyando las tareas a nivel operativo de la organización.
•
Son intensivos en entrada y salid de información; sus cálculos y procesos suelen ser simples y poco sofisticados.
•
Tienen la propiedad de ser recolectores de información, es decir, a través de estos sistemas se cargan las grandes bases de información para su explotación posterior.
•
Son fáciles de justificar ante la dirección general, ya que sus beneficios son visibles y palpables.
Sistemas de Apoyo de las Decisiones. Las principales características de estos son:
•
•
Suelen introducirse después de haber implantado los Sistemas Transaccionales más relevantes de la empresa, ya que estos últimos constituyen su plataforma de información. La información que generan sirve de apoyo a los mandos intermedios y a la alta administración en el proceso de toma de decisiones.
•
Suelen ser intensivos en cálculos y escasos en entradas y salidas de información. Así, por ejemplo, un modelo de planeación financiera requiere poca información de entrada, genera poca información como resultado, pero puede realizar muchos cálculos durante su proceso.
•
No suelen ahorrar mano de obra. Debido a ello, la justificación económica para el desarrollo de estos sistemas es difícil, ya que no se conocen losingresos del proyecto de inversión.
•
Suelen ser Sistemas de Información interactivos y amigables, con altos estándares de diseño gráfico y visual, ya que están dirigidos al usuario final.
•
Apoyan la toma de decisiones que, por su misma naturaleza son repetitivos y de decisiones no estructuradas que no suelen repetirse. Por ejemplo, un Sistema de Compra de Materiales que indique cuándo debe hacerse un pedido al proveedor o un Sistema de Simulación de Negociosque apoye la decisión de introducir un nuevo producto al mercado.
•
Estos sistemas pueden ser desarrollados directamente por el usuario final sin la participación operativa de los analistas y programadores del área de informática.
Este tipo de sistemas puede incluir la programación de la producción, compra de materiales, flujo de fondos, proyecciones financieras, modelos desimulación de negocios, modelos de inventarios, etc. Sistemas Estratégicos. Sus principales características son: •
Su función primordial no es apoyar la automatización de procesos operativos ni proporcionar información para apoyar la toma de decisiones.
•
Suelen desarrollarse in house, es decir, dentro de la organización, por lo tanto no pueden adaptarse fácilmente a paquetes disponibles en elmercado.
•
Típicamente su forma de desarrollo es a base de incrementos y a través de su evolución dentro de la organización. Se inicia con un proceso o función en particular y a partir de ahí se van agregando nuevas funciones o procesos.
•
Su función es lograr ventajas que los competidores no posean, tales como ventajas en costos y servicios diferenciados con clientes y proveedores. En este contexto, los Sistema Estratégicos son creadores de barreras de entrada al negocio. Por ejemplo, el uso de cajeros automáticos en los bancos en un Sistema Estratégico, ya que brinda ventaja sobre un banco que no posee tal servicio. Si un banco nuevo decide abrir sus puerta al público, tendrá que dar este servicio para tener un nivel similar al de sus competidores.
•
Apoyan el proceso de innovación de productos y proceso dentro de la empresa debido a que buscan ventajas respecto a los competidores y una forma de hacerlo en innovando o creando productos y procesos.
Un ejemplo de estos Sistemas de Información dentro de la empresa puede ser un sistema MRP (Manufacturing Resoure Planning) enfocado a reducir sustancialmente el desperdicio en el proceso productivo, o bien, un Centro de Información que proporcione todo tipo de información; como situación de créditos, embarques, tiempos de entrega, etc. En este contexto los ejemplos anteriores constituyen un Sistema de Información Estratégico si y sólo sí, apoyan o dan forma a la estructura competitiva de la empresa. Por último, es importante aclarar que algunos autores consideran un cuarto tipo de sistemas de información denominado Sistemas Personales de Información, el cual está enfocado a incrementar la productividad de sus usuarios. Evolución de los Sistemas de Información De la sección anterior se desprende la evolución que tienen los Sistemas de Información en las organizaciones. Con frecuencia se implantan en forma inicial los Sistemas Transaccionales y, posteriormente, se introducen los Sistemas de Apoyo a las Decisiones. Por último, se desarrollan los Sistemas Estratégicos que dan forma a la estructura competitiva de la empresa. En la década de los setenta, Richard Nolan, un conocido autor y profesor de la Escuela de Negocios de Harvard, desarrolló una teoría que impactó el proceso de planeación de los recursos y las actividades de la informática. Según Nolan, la función de la Informática en las organizaciones evoluciona a través de ciertas etapas de crecimiento, las cuales se explican a continuación: • • • •
•
•
•
Comienza con la adquisición de la primera computadora y normalmente se justifica por el ahorro de mano de obra y el exceso de papeles. Las aplicaciones típicas que se implantan son los Sistemas Transaccionales tales como nóminas o contabilidad. El pequeño Departamento de Sistemas depende en la mayoría de los casos del área de contabilidad. El tipo de administración empleada es escaso y la función de los sistemas suele ser manejada por un administrador que no posee una preparación formal en el área de computación. El personal que labora en este pequeño departamento consta a lo sumo de un operador y/o un programador. Este último podrá estar bajo el régimen de honorarios, o bien, puede recibirse el soporte de algún fabricante local de programas de aplicación. En esta etapa es importante estar consciente de la resistencia al cambio del personal y usuario (ciberfobia) que están involucrados en los primeros sistemas que se desarrollan, ya que estos sistemas son importantes en el ahorro de mano de obra. Esta etapa termina con la implantación exitosa del primer Sistema de Información. Cabe recalcar que algunas organizaciones pueden vivir varias etapas de inicio en las que la resistencia al cambio por parte de los primeros usuarios involucrados aborta el intento de introducir la computadora la empresa.
Etapa de contagio o expansión. Los aspectos sobresalientes que permiten diagnosticar rápido que una empresa se encuentra en esta etapa son: •
Se inicia con la implantación exitosa del primer Sistema de Información en la organización. Como consecuencia de lo anterior, el primer ejecutivo usuario se transforma en el paradigma o persona que se habrá que imitar.
•
Las aplicaciones que con frecuencia se implantan en esta etapa son el resto de los Sistemas Transaccionales no desarrollados en la etapa de inicio, tales como facturación, inventarios, control de pedidos de clientes y proveedores, cheques, etc.
•
El pequeño departamento es promovido a una categoría superior, donde depende de la Gerencia Administrativa o Contraloría.
•
El tipo de administración empleado está orientado hacia la venta de aplicaciones a todos los usuarios de la organización; en este punto suele contratarse a un especialista de la función con preparación académica en el área de sistemas.
•
Se inicia la contratación de personal especializado y nacen puestos tales como analista de sistemas, analista-programador, programador de sistemas, jefe de desarrollo, jefe de soporte técnico, etc.
•
Las aplicaciones desarrolladas carecen de interfases automáticas entre ellas, de tal forma que las salidas que produce un sistema se tienen que alimentar en forma manual a otro sistema, con la consecuente irritación de los usuarios.
•
Los gastos por concepto de sistemas empiezan a crecer en forma importante, lo que marca la pauta para iniciar la racionalización en el uso de losrecursos computacionales dentro de la empresa. Este problema y el inicio de su solución marcan el paso a la siguiente etapa.
Etapa de control o formalización. Para identificar a una empresa que transita por esta etapa es necesario considerar los siguientes elementos: •
Esta etapa de evolución de la Informática dentro de las empresas se inicia con la necesidad de controlar el uso de los recursos computacionales a través de las técnicas de presupuestación base cero (partiendo de que no se tienen nada) y la implantación de sistemas de cargos a usuarios (por el servicio que se presta).
•
Las aplicaciones están orientadas a facilitar el control de las operaciones del negocio para hacerlas más eficaces, tales como sistemas para control de flujo de fondos, control de órdenes de compra a proveedores, control de inventarios, control y manejo de proyectos, etc.
•
El departamento de sistemas de la empresa suele ubicarse en una posición gerencial, dependiendo del organigrama de la Dirección de Administración o Finanzas.
•
El tipo de administración empleado dentro del área de Informática se orienta al control administrativo y a la justificación económica de las aplicaciones a desarrollar. Nace la necesidad de establecer criterios para las prioridades en el desarrollo de nuevas aplicaciones. La cartera de aplicaciones pendientes por desarrollar empieza a crecer.
•
En esta etapa se inician el desarrollo y la implantación de estándares de trabajo dentro del departamento, tales como: estándares de documentación, control de proyectos, desarrollo y diseño de sistemas, auditoría de sistemas y programación.
•
Se integra a la organización del departamento de sistemas, personal con habilidades administrativas y preparado técnicamente.
•
Se inicia el desarrollo de interfases automáticas entre los diferentes sistemas.
Dato. Es un pequeño trozo de información que no tiene significado para los humanos. Información. Es la comunicación del conocimiento. Información es un proceso, una actividad. Informar es impartir conocimiento a alguien. DATOS E INFORMACIÓN, Los datos se refieren generalmente a situaciones reales, y se representan por medio de símbolos. Al ser interpretados, adquieren un significado, y a éste se lo puede llamar información. No es posible obtener información del conjunto de datos disponibles sin conocer el contexto en el cual éstos adquieren un significado: es el contexto el que le confiere significado a los datos. Podemos decir que, para transmitir una información, se emplea una secuencia de símbolos junto con las reglas propias para su interpretación; ya que éstas posibilitan que se les dé un sentido a esos datos. Por ejemplo, la secuencia numérica 5413336060, por sí sola, carece de significado. En 5413336060, el símbolo que precede al número le confiere una dimensión al dato inicial. Ahora podemos interpretar que éste corresponde a un número telefónico. Si conocemos las reglas del discado para realizar comunicaciones internacionales en forma directa DDI, podemos interpretar, además, el significado de esa serie numérica: el 54 corresponde el código del país; en este caso, la República Argentina, el 1 es el código de la ciudad; en este caso, Capital Federal y el 3336060 corresponde al
número del abonado. De esta manera, al ser interpretados, los datos se transforman en información útil. En nuestra vida cotidiana nos encontramos habitualmente con gran cantidad de símbolos, los cuales brindan información. A modo de ejemplo podemos citar: Número de CUIL (Código Único de Identificación Laboral) 27-18444666-1; el 27 brinda información sobre el sexo, en este caso femenino, ya que para el masculino se usa el 20, el 18444666 es el número del Documento Nacional de Identidad (DNI) del trabajador y la última cifra es un código de verificación. Los colores del semáforo tiene dos estados básicos: el rojo y el verde (el amarillo es una señal del cambio de estado que va a producirse). En color verde informa sobre la posibilidad de avanzar y el rojo indica detenerse. Dato distinto a Información Los datos pueden considerarse como la materia prima de la información. Su procesamiento consta, básicamente, de tres fases: 1) el ingreso en el sistema (datos de entrada), 2) su manipulación y 3) la producción de un resultado (información de salida). La información es, por lo tanto, el resultado de un proceso de transformación de datos que es interpretado por el ser humano. Sin embargo, en el lenguaje cotidiano no se hace esta distinción y suelen usarse como sinónimos. Aplicado a la teoría de comunicación, el término información se refiere a todo lo que es comunicable, pueda interpretarse o no.
Historia de la Informática
El computador Z3, creado por Konrad Zuse, fue la primera máquina programable y completamente automática, características usadas para definir a uncomputador. Estaba construido con 2200 relés (electroimanes), pesaba 1000Kg, se demoraba haciendo una adición 0,7 segundos y una multiplicación o división de 3 segundos. Tenía una
frecuencia de reloj de ~5 Hz, y una longitud de palabra de 22 bits. Los cálculos eran realizados con aritmética encoma flotante puramente binaria. La máquina fue completada en 1941 (el 12 de mayo de ese mismo año fue presentada a una audiencia de científicos en Berlín). El Z3 original fue destruido en 1944 durante un bombardeo aliado a Berlín. Una réplica completamente funcional fue construida durante losaños 60 por la compañía del creador Zuse KG y está en exposición permanente en el Deutsches Museum. En 1998 se demostró que el Z3 es Turing completo.
DEFINICIÓN DE INFORMÁTICA Es la ciencia de la información automatizada, todo aquello que tiene relación con el procesamiento de datos, utilizando las computadoras y/o los equipos de procesos automáticos de información. Es la ciencia que se encarga de la automatización del manejo de la información.
La informática La informática ha sido una de las áreas del conocimiento que mayor desarrollo ha adquirido en los últimos tiempos. Casi la totalidad de las disciplinas científicas requieren de ella. La vida moderna, sin la informática, es muy difícil de imaginar. La informática es una disciplina formada por un conjunto de técnicas y conocimientos, que hacen posible el tratamiento automático de la información por medio de computadoras. Con ellas podemos manejar y procesar datos e información.
La informática combina aspectos teóricos y prácticos de la ingeniería, electrónica, matemáticas y lógica. Además cubre desde la programación hasta la inteligencia artificial y la robótica. El lenguaje universal que utiliza para estandarizar la transferencia de información, es el código binario, que se basas en la representación de cualquier número, palabra o símbolo o dato mediante una serie, con la adecuada combinación de 0 y 1. La computadora procesa la información a gran velocidad, traduciendo cada dato a una secuencia de 0 y1. El 1 corresponde a impulsos electrónicos producidos por la activación de un circuito lógico, que equivale al encendido de una ampolleta cuando apretamos el interruptor y los 0 equivalen a la interrupción del circuito o apagado de la ampolleta La informática es ante todo, la disciplina que estudia el tratamiento automático de la información utilizando dispositivos electrónicos y sistemas computacionales. También es definida como el procesamiento de la información en forma automática. Para esto los sistemas informáticos deben realizar las siguientes tres tareas básicas: • • •
Entrada: Captación de la información digital. Proceso: Tratamiento de la información. Salida: Transmisión de resultados binarios.
El vocablo Informática es proveniente del francés informatique, acuñado por el ingeniero Philippe Dreyfus en 1962, es acrónimo de las palabras information yautomatique. En lo que hoy conocemos como informática confluyen muchas de las técnicas y de las máquinas que el hombre ha desarrollado a lo largo de la historia para apoyar y potenciar sus capacidades de memoria, de pensamiento y de comunicación. La informática se aplica a numerosas y variadas áreas, como por ejemplo: gestión de negocios, almacenamiento y consulta de información, monitorización y control de procesos, robots industriales, comunicaciones, control de transportes, investigación, desarrollo de juegos, diseño computarizado, aplicaciones/herramientas multimedia, etc. En la informática convergen los fundamentos de las ciencias de la computación, la programación y las metodologías para el desarrollo de software, la arquitectura de computadores, las redes de datos como Internet, la inteligencia artificial, así como determinados temas de electrónica. Se puede entender por informática a la unión sinérgica de todo este conjunto de disciplinas.
El concepto de informática viene dado de la conjunción de dos palabras:Información y automática. En tanto que en inglés se habla de conceptos tales como Computer Science, Electronic Data Processing, etc.. Según la el Diccionario de la Real Academia Española RAE es el: "Conjunto de conocimientos científicos y técnicas que hacen posible el tratamiento automático de la información por medio de ordenadores". Podemos entender el concepto de informática como aquella disciplina encargada del estudio de métodos, procesos, técnicas, desarrollos y su utilización en ordenadores (computadores) con el fin de almacenar, procesar y transmitir información y datos en formato digital. Entre las funciones principales de la informática se cuentan las siguientes: • • • •
Creación de nuevas especificaciones de trabajo. Desarrollo e implementación de sistemas informáticos. Sistematización de procesos. Optimización de los métodos y sistemas informáticos existentes.
La informática es aplicada en numerosos y diversos sectores de la actividad humana. Sólo algunos de ellos son: medicina, biología, física, química, meteorología, ingeniería, industria, investigación científica, comunicaciones, arte, nivel empresarial (gestión), etc. En los inicios del procesado de información, con la informática sólo se facilitaba los trabajos repetitivos y monótonos del área administrativa, gracias a la automatización de esos procesos, ello trajo como consecuencia directa una disminución de los costes y un incremento en la producción. Actualmente es difícil concebir un área que no use, de alguna forma, el apoyo de la informática; en un enorme abanico que cubre desde las más simples cuestiones hogareñas hasta los más complejos cálculos científicos. Una de la utilidades más importantes de la informática es facilitar información en forma oportuna y veraz, lo cual, por ejemplo, puede tanto facilitar la toma de decisiones a nivel gerencial como permitir el control de procesos críticos. Concepto de informática
Como definición de informática se suele aceptar "ciencia que estudia el tratamiento automático de la información". El término procede del francés "informatique" formado a su vez por la conjunción de las palabras "information" y "automatique". No obstante en sudamérica, se suele utilizar más la palabra "computación", más cercano a la expresión anglosajona de "Computer Sciences" (CS) o ciencias de la computación. Esta acepción es muy general y tiende a la confusión entre ella y sus aplicaciones. Así manejar un procesador de textos tipo Word u OpenOffice es ofimática, no informática. Diseñar un sistema informático para el procesado de textos, sí podemos englobarlo dentro de las tareas de la informática. Así la informática estudia lo que los programas pueden o no hacer (teoría de la computabilidad) , de la eficiencia de los algoritmos que emplean (complejidad algorítmica, como han de organizar y almacenar los datos (estructuras/tipos de datos) y de la comunicación entre programas y humanos (interfaces de usuario y lenguajes de programación). Antonio Ortiz Medina. "Conjunto de conocimientos científicos y técnicas que hacen posible el tratamiento automático de la información por medio de ordenadores" - Concepto de informática según el diccionario académico de la lengua española. Podemos entender el concepto de informática como aquella ciencia encargada de estudiar los ordenadores y su capacidad para procesar y almacenar información y datos. Las funciones principales de la informática son las siguientes: Creación de nuevas computadoras. Creación de nuevas especificaciones de trabajo. Desarrollo e implementación de sistemas informáticos. Optimización de los métodos y sistemas informáticos existentes.
La informática es aplicada en diversos sectores de la actividad diaria. Esos sectores son abarcados por medicina, ingeniería, industria, en la investigación científica, el arte y a nivel empresarial. En sus inicios, la informática facilitó los trabajos repetitivos y monótonos del área administrativa, gracias a la automatización de esos procesos, lo que a su vez trajo como ventaja una disminución de los costes. Dentro del concepto de informática, su principal función es facilitar información oportuna y veraz, lo cual facilita la toma de decisiones a nivel empresarial.
La informatica podemos definirla como una ciencia que estudia y maneja los datos en forma racional y automatica, con el fin de convertirlos en información util y aplicada, lo cual permita en determinadas circunstancias una toma de desicion adecuada. la informatica tambien se entiende como una rama que se encarga del estudio y creacion de computadoras u ordenadores, que sirven para transmitir la información una vez procesada, bajo procedimientos idoneos y/o adecuados. Entre los objetivos de la informatica, se encuentra, el diseño e implementación de maquinas, como computadoras u ordenadores, diseño e implementación de nuevas funciones o metodos de trabajo a seguir, el diseño e implementación de aplicaciones o sistemas de informatica y /o el mantenimiento de sistemas informaticos en funcionamiento. Hoy en dia la informatica es aplicada en el entorno de las actividades de cada personas, tales como: Medicina, contruccion, industria, controles de proceso, investigaciones cientifica, gestión empresarial,etc. La informatica se aplica para aumentar la productividad en cada area de las anteriormente señaladas, ya que permite un procesamiento de datos rapido y eficaz, por lo que tambien representa como ventaja una reduccion de costes.
Clasificación general de los datos
Como su nombre lo indica, los datos compartibles son aquellos cuya naturaleza los hace susceptibles de ser `compartidos` con mas de un host, un ejemplo de este tipo de datos son los `home` de los usuarios. En todo sistema existen datos que solo tienen relación con el `host` que los alberga, fuera de este, pierden toda utilidad (o por lo menos pierden su utilidad oficial :-), un ejemplo de este tipo de datos son los descriptores de dispositivos o los `lock files` que crean algunos programas en ejecución. Son datos que varían sin necesitar de la intervención del administrador de sistemas (root), los documentos, como este, son ejemplos de este tipo de datos. Son datos que solo pueden variar bajo la intervención del administrador de sistemas, por ejemplo, las librerías, los programas instalados, etc.
Modelado de Datos Estructurados Definición. Son aquellos datos fuertemente tipados. Poseen una estructura o estilo rígido Por lo general se asocian a una base de datos (relacional u orientada a objetos). Administración de bases de datos. Roles. La información es el centro de todas las aplicaciones de hoy en día. La administración de la información es una tarea que tiene demasiada responsabilidad ya que el éxito o fracaso depende directamente de ella. Hablar de la administración de información es hablar de roles, algunas organizaciones (dependiendo de los recursos humanos) los dividen en: • •
Data Administrador (DA): quienes son las personas encargadas de lidiar con los aspectos comerciales o profesionales de los datos. Data base Administrador (DBA): encargado de los aspectos técnicos.
otros roles que no están directamente relacionados con la información pero que interactúan directamente con las personas mencionadas son:
• • • •
System Administrator (SA): quien se encarga de toda la infraestructura de servidores, discos, firewalls, etc. Programmers/Developers: el dolor de cabeza de los DBAs. Managers: a quien rendirle cuentas. Customers/End users: gente sin ningún conocimiento técnico.
•
DBA vs DA
•
DBA vs DA vs SA
Habilidades requeridas para ser un "buen" DBA: •
•
Técnicas: o Conocimiento de bases de datos o Conocimiento de desarrollo de aplicaciones o Conocimiento de administración de sistemas/servidores Comerciales: o Entender procesos de una organización o Seguir tendencias de la industria
Sociales o o o o
Comunicación Administración Resolución de problemas Educación continua
Aspectos a con siderar una oferta de trabajo de DBA: • • • • • •
La compañía ofrece capacitación regular ? Se permite contactar regularmente a grupos de usuarios locales ? Existen DBA de respaldo o solamente uno de 24/7 ? Existen DBAs y SAs o se espera realizar ambas actividades ? Cómo es la relación con las personas de desarrollo ? El DBA es tomado en cuenta para cuestiones de revisiones, presupuestos, etc. ?
Modelado de Datos Definición • • • •
Es el proceso de analizar los aspectos de interés para una organización y la relación que tienen unos con otros. Resulta en el descubrimiento y documentación de los recursos de datos del negocio. El modelado hace la pregunta " Qué ? " en lugar de " Cómo ? ", esta última orientada al procesamiento de los datos. Es una tarea difícil, bastante difícil, pero es una actividad necesaria cuya habilidad solo se adquiere con la experiencia. Metas y beneficios
• •
•
Registrar los requerimientos de datos de un proceso de negocio. Dicho proceso puede ser demasiado complejo y se tendrá que crear un "enterprise data model", el cual deberá estar constituído de líneas individuales. Permite observar: o Patrones de datos
o
Usos potenciales de los datos
Tipos de modelos de datos Basicamente son 3: • • •
Conceptual: muy general y abstracto, visión general del negocio/institución. Lógico: versión completa que incluye todos los detalles acerca de los datos. Físico: esquema que se implementara en un manejador de bases de datos (DBMS).
Modelado de Datos Conceptual y Lógico Algunos aspectos a considerar al momento de realizar el modelado/análisis • • •
No pensar físicamente, pensar conceptualmente No pensar en procesos, pensar en estructura No pensar en navegación, pensar en términos de relaciones
Modelo Entidad Relación Generalmente todo modelo tiene una representación gráfica, para el caso de datos el modelo mas popular es el modelo entidad-relación o digrama E/R. Se denomina asi debido a que precisamente permite representar relaciones entre entidades (objetivo del modelado de datos). La figura 2.1 muestra distintos ejemplos de notaciones, en realidad todas muy similares.
Figura 2.1 Notación E/R (1) Ross, (2) Bachmann, (3) Martin, (4) Chen, (5) Rumbaugh
También debido al aumento de popularidad y uso de UML también se puede emplear dicha notación (figura 2.3). Notación UML Lo importante es que en toda organización se debe establecer un estándar que deben seguir todos los modelos de la misma. El modelo debe estar compuesto por: • •
• • • • •
Entidades: todo lo que existe y es capaz de ser descrito (sustantivo). Atributos: es una característica (adjetivo) de una entidad que puede hacer 1 de tres cosas: o Identificar o Relacionar o Describir Relaciones: la conexión que existe entre 2 entidades (verbo). Cardinalidad: número de ocurrencias que pueden existir entre un par de entidades. Super llave: conjunto de uno o más atributos que "juntos" identifican de manera única a una entidad Llave candidata: es una super llave mínima Llave primaria: la seleccionada para identificar a los elementos de un conjunto de entidades.
Componentes simbólicos
Atributos: Nombre, Edad, Semestre, Id.
Entidades: Alumno, Salón, Profesor.
Entidades Débiles: No tienen llaves primarias.
Generalización: Agrupa propiedades en común a diferentes objetos.
Relación Cardinalidad
Componentes simbólicos Guías de nombramiento Es importante mantener guías o reglas para poder tener una documentación uniforme y consistente de todos los datos. • •
•
Entidades: una sola palabra (en singular) y con mayúsculas Atributos: o FirstName o first_name o de relacion: VendorID, ProductName Valores: definir que valores son válidos (NULL no es un valor)
Relaciones de Cardinalidad
(Muchos a Muchos)
(Uno a Muchos)
(Uno a Uno)
Relaciones Modelo E/R
Modelo E-R
Ejemplo Modelo E/R
Modelo E/R en E/R
Generalización
Generalización Conversión a tablas (esquema de datos) El modelo es una representación visual que gráficamente nos da una perspectiva de como se encuentran los datos involucrados en un proyecto u organización.
Pero el modelo no nos presenta propiamente una instancia de los datos, un ejemplo que muestre con claridad algunas datos de muestra y como se relacionan en realidad. Por eso es conveniente crear un "esquema", el cual consiste de tablas las cuales en sus renglones (tuplas) contienen instancias de los datos. Las tablas 2.1 y 2.3 muestran las reglas que se deben seguir para poder crear dicho esquema.
modelo e-r conversión a tablas • • •
una tabla por cada conjunto de entidades o nombre de tabla = nombre de conjunto de entidades una tabla por cada conjunto de relaciones m-m o nombre de tabla = nombre de conjunto de relaciones definición de columnas para cada tabla o conjuntos fuertes de entidades columnas = nombre de atributos o conjuntos débiles de entidades columnas = llave_primaria (dominante) U atributos(subordinado) o conjunto de relaciones R (m-m) entre A, B columnas (R) = llave_primaria (A) U llave_primaria (B) U atributos(R) o conjunto de relaciones R (1-1) entre A y B columnas (A) = atribs(A) U llave primaria(B) U atributos(R) o conjunto de relaciones R (1-m) entre A y B columnas (B) = atribs(B) U llave primaria(A) U atributos(R)
Normalización Una vez creadas las tablas hay que verificar si aún se puede reducir u optimizar de alguna manera. Dependencias funcionales Es identificar aquellos atributos que dependen de otros y que generalizan el concepto de super-llave Ejemplo: ID ---> Nombre
ID --> Puesto --> Sueldo
Primera forma normal Una tabla se encuentra en 1a NF, si todos sus atributos son atómicos (indivisibles) El ejemplo clásico: Nombre
dirección
teléfono
En 1a. NF nombre apellido_paterno apellido_materno dirección teléfono
Segunda forma normal Una tabla se encuentra en 2a NF, si está en 1a NF y cada atributo que NO es llave es "completamente" dependiente de la llave. Si tenemos la tabla: calificaciones_cursos id_estudiante depto clave_curso descripción calificación
NO se encuentra en 2a NF { id,clave,depto} --> descripción {clave,depto} --> descripción Normalizando quedaría Curso
depto
clave_curso
descripción
estud_curso id depto
clave_curso
calificación