Introducción
A continuación se dará a conocer algunos conceptos relacionados con Sistemas de Información que en su conjunto, son elementos que interactúan entre sí con el fin de apoyar las actividades de una empresa o negocio.
Posteriormente se describirán las etapas del diseño de un DW , dando a conocer dos modelos : Star Schema y el Snowflake Schema.
Además se desarrollará un DW escogiendo un área de negocios de una empresa en el cual sea interesante aplicar BI, para este caso se analizará el Conglomerado de CENCOSUD.
CONCEPTOS
Business Intelligence :
Se conoce como el conjunto de estrategias y herramientas enfocadas a la administración y creación de conocimiento mediante el análisis de datos existentes en una organización o empresa. Este conjunto de herramientas tienen en común las siguientes características.
- Accesibilidad a la información.
- Apoyo a la toma de decisiones.
- Orientación al usuario final.
De acuerdo al nivel de complejidad se pueden clasificar las soluciones de Business Intelligence en:
- Consultas e informes simples.
- Cubos OLAP
- Data mining.
Para que una empresa sea competitiva, las personas que toman las decisiones necesitan acceder rápida y fácilmente a la información de la empresa y esto se realiza por medio del Business Intelligence.
ERP (ENTERPRISE RESOURCE PLANNING):
Sistema o software administrativo que integra todas las áreas de una empresa (contabilidad, compras o inventarios), mediante procesos transparentes y en el tiempo real en bases de datos relacionales y centralizados. Los sistemas ERP está diseñados para modelar y automatizar muchos de los procesos básicos con el objetivo de integrar información a través de la empresa, eliminando complejas conexiones entre sistemas de distintos proveedores.
Su función principal es organizar y estandarizar procesos y datos internos de la empresa, transformándolos en información útil para ser analizados para la toma de decisiones.
La gama de funciones que cubren los ERP son: contabilidad, finanzas, administración de órdenes de venta, logística, producción y recursos humanos.
Ramesh (1998) citado por Alejandra Recio (1998) define un ERP como una "solución de software que trata las necesidades de la empresa tomando el punto de vista de proceso de la organización para alcanzar sus objetivos integrando todas las funciones de la misma". Recio menciona además que un sistema ERP facilita la integración de los sistemas de información de la empresa, ya que cubre todas las áreas funcionales. Los sistemas que integra son bases de datos, aplicaciones, interfaces, herramientas y el Business Process Redesign (BPR).
Los objetivos principales de los sistemas ERP son:
• Optimización de los procesos empresariales.
• Acceso a información confiable, precisa y oportuna.
• La posibilidad de compartir información entre todos los componentes de la organización.
• Eliminación de datos y operaciones innecesarias.
• Reducción de tiempos y de los costes de los procesos.
El propósito fundamental de un ERP es otorgar apoyo a los clientes del negocio, tiempos rápidos de respuesta a sus problemas así como un eficiente manejo de información que permita la toma oportuna de decisiones y disminución de los costos totales de operación.
ETL (EXTRACT-TRANSFORM-LOAD)
Este término viene de ingles de las siglas Extract-Transform-Load que significan Extraer, Transformar y Cargar y se refiere a los datos en una empresa. ETL es el proceso que organiza el flujo de los datos entre diferentes sistemas en una organización y aporta los métodos y herramientas necesarias para mover datos desde múltiples fuentes a un almacén de datos, reformatearlos, limpiarlos y cargarlos en otra base de datos, data mart ó bodega de datos. ETL forma parte de la Inteligencia Empresarial (Business Intelligence), también llamado “Gestión de los Datos”(DataManagement).
La idea es que una aplicación ETL lea los datos primarios de unas bases de datos de sistemas principales, realice transformación, validación, el proceso cualitativo, filtración y al final escriba datos en el almacén y en este momento los datos son disponibles para analizar por los usuarios.
INTERFASE WEB
Se define el término interfaz como una conexión física y funcional entre dos aparatos o sistemas independientes.
Las interfaces web, son interfaces gráficas de usuario con unos elementos comunes de presentación y navegación. Este tipo de interfaces deben servir de intermediarias entre unos usuarios genéricos, no acostumbrados generalmente al uso de aplicaciones informáticas, y unos sistemas de información y procesos transaccionales que corren por debajo, debiendo posibilitar la localización de la información deseada, el entendimiento claro de las funcionalidades ofrecidas, la realización práctica de tareas específicas por parte de los usuarios y la navegación intuitiva por las diferentes páginas que forman el sitio web.
Buscando una homogeneidad entre los millones de páginas web que existen actualmente en Internet, el diseño de las mismas ha evolucionado con el tiempo hacia un esquema general perfectamente definido, ofreciendo unas interfaces bien definidas, con un conjunto de componentes gráficos y funcionales similares que hacen posible que sea cual sea el usuario que accede a un sitio web cualquiera la comunicación entre ellos sea posible y efectiva.
CLIENTE/SERVIDOR
Arquitectura de sistemas de información en la que los procesos de una aplicación se dividen en componentes que se pueden ejecutar en máquinas diferentes. Modo de funcionamiento de una aplicación en la que se diferencian dos tipos de procesos y su soporte se asigna a plataformas diferentes.
La modalidad o arquitectura Cliente/Servidor es aquella en la que confluyen una serie de aplicaciones basadas en dos categorías que cumplen funciones diferentes (una requiere servicios y la otra los brinda) pero que a la vez, pueden realizar tanto actividades en forma conjunta como independientemente. Esas dos categorías son justamente cliente y servidor.
En el caso del cliente, es aquel que requiere un servicio del servidor. En esta categoría se realizan funciones de software basándose en el hardware pero en caso de no tener la capacidad de procesar los datos necesarios, recurre al servidor y espera a que este le brinde los servicios solicitados. El cliente es una estación de trabajo o computadora que está conectada a una red a través de la cual puede acceder al servidor.
Por el contrario, el servidor es la máquina desde la que se suministran servicios y que está a la espera del requerimiento del cliente. Una vez hecho, busca la información solicitada y le envía la respuesta al cliente; incluso puede enviar varios servicios a la vez, lo que es posible porque entre ellos están conectados mediante redes LAN o WAN.
ENTIDAD-RELACIÓN
Modelo Conceptual muy usado propuesto por Chen en 1976.
Existe una gran variedad de “dialectos” y variantes del Modelo ER.
Los modelos OO se inspiran y toman ideas de él, por lo que presentan similaridades.
Sus conceptos básicos:
• Entidad: elemento de la realidad. Por ejemplo: Estudiantes, Cursos, Docentes.
• Relación: asociación entre elementos. Por ejemplo: Cursa, Dicta
• Atributo: Característica que nos interesa de un determinado elemento de la realidad. Ej.: Nombre de un funcionario
UML
El Lenguaje Unificado de Modelado preescribe un conjunto de notaciones y diagramas estándar para modelar sistemas orientados a objetos, y describe la semántica esencial de lo que estos diagramas y símbolos significan. Mientras que ha habido muchas notaciones y métodos usados para el diseño orientado a objetos, ahora los modeladores sólo tienen que aprender una única notación.
UML se puede usar para modelar distintos tipos de sistemas: sistemas de software, sistemas de hardware, y organizaciones del mundo real. UML ofrece nueve diagramas en los cuales modelar sistemas.
• Diagramas de Casos de Uso para modelar los procesos ’business’.
• Diagramas de Secuencia para modelar el paso de mensajes entre objetos.
• Diagramas de Colaboración para modelar interacciones entre objetos.
• Diagramas de Estado para modelar el comportamiento de los objetos en el sistema.
• Diagramas de Actividad para modelar el comportamiento de los Casos de Uso, objetos u operaciones.
• Diagramas de Clases para modelar la estructura estática de las clases en el sistema.
• Diagramas de Objetos para modelar la estructura estática de los objetos en el sistema.
• Diagramas de Componentes para modelar componentes.
• Diagramas de Implementación para modelar la distribución del sistema.
ORIENTADO A OBJETOS
El desarrollo del paradigma orientado a objetos aporta un gran cambio en el modo en que vemos los datos y los procedimientos que actúan sobre ellos. Tradicionalmente, los datos y los procedimientos se han almacenado separadamente: los datos y sus relaciones en la base de datos y los procedimientos en los programas de aplicación. La orientación a objetos, sin embargo, combina los procedimientos de una entidad con sus datos.
El modelo orientado a objetos también soporta relaciones de muchos a muchos, siendo el primer modelo que lo permite. Aún así se debe ser muy cuidadoso cuando se diseñan estas relaciones para evitar pérdidas de información.
Orientado a objetos
Método que permite resolver un problema alrededor de abstracciones representadas por objetos. Los objetos se comportan como agentes
Conceptos básicos.
Abstracción.
Caracterización de un objeto de acuerdo a las propiedades que nos interesen en un instante de tiempo.
Las características escogidas son relativas a la perspectiva del observador.
Encapsulación.
Manera de ocultar los detalles de la representación interna de un objeto presentando solo la interfase para el usuario
DISEÑO DE DW
Dentro del diseño de un DW el punto más importante dentro de su diseño es la optimización del tipo de consultas que se desean realizar.
Es así como resulta la estructura de la estrella, en su centro se ubica la tabla fact, el cual refleja el factor principal donde se analizan los datos. A los lados de esta aparecen las tablas de dimensiones que representan las relaciones que intervienen en el diseño.
Teniendo en cuenta lo anterior el diseño se desarrolla a través de:
1. Origen (Source): Define los orígenes de datos del Almacén de Datos, como los sistemas de Procesamiento de Transacciones en Línea (On-LineTransactionProcessing, OLTP), las fuentes de datos externas (datos sindicados, datos censales), etc.
2. Integración (Integration): Define el mapeo entre los orígenes de datos y el propio Almacén de Datos.
3. Almacén de Datos (Data Warehouse): Define la estructura del Almacén de Datos.
4. Adaptación (Customization): Define el mapeo entre el Almacén de Datos y las estructuras empleadas por el cliente.
5. Cliente (Client): Define las estructuras concretas que son empleadas por los clientes para acceder al Almacén de Datos, como Data Martso aplicaciones OLAP
Una vez identificados estos datos se procede a la siguiente etapa, la cual consiste en analizar los niveles por etapas del DW.
1. Conceptual: Define el Almacén de Datos desde un punto de vista conceptual, es decir, desde el mayor nivel de abstracción y contiene únicamente los objetos y relaciones más importantes.
2. Lógico: Abarca aspectos lógicos del diseño del Almacén de Datos, como la definición de las tablas y claves, la definición de los procesos ETL, etc.
3. Físico: Define los aspectos físicos del Almacén de Datos, como el almacenamiento de las estructuras lógicas en diferentes discos o la configuración de los servidores de bases de datos que mantienen el almacén de datos.
No hay comentarios:
Publicar un comentario