Datawarehousing (CB95072 ) |
Instituto Tecnológico y de Estudios Superiores de Monterrey
Escuela de Ingeniería
Departamento de Tecnologías de la Información y Electrónica
Horario: Lunes y Jueves 11:30-13
Salón de clase: 1-509 |
Profesor: Mtro. Carlos Proal Aguilar
Dirección electrónica: cproal@itesm.mx , carlos.proal@gmail.com
Asesoría: LuMaJuVi 8:30, y/o previa cita (email)
|
Descripción del curso
Objetivo del curso
Los almacenes de datos son un punto fundamental y crucial en toda organización que desea saber más de los datos que se generan diariamente. Son la base para aplicaciones de toma de decisiones donde a través de un análisis de minería de datos se pueden descubrir cosas como: qué productos se venden más con otros ? que tipo de clientes consumen más ciertos productos ? como llegar a ciertos mercados ?. Para lograr esto es muy importante tener los datos necesarios y organizados de manera adecuada para poder sacarles el mejor provecho. Este curso pretende dar un panorama general de los aspectos más importantes en la construcción de estos almacenes de datos.
Objetivo principal
"Aprender"
Objetivos generales
Los objetivos generales del curso son:
- Familiarizar al / a la estudiante con la noción datawarehouse .
- Familiarizar al / a la estudiante con herramientas ETL.
Objetivos específicos
Los objetivos específicos del curso son:
- Conocer los conceptos básicos en la creación de un datawarehouse
- Conocer las herramienta empleadas para desarrollar y mantener un datawarehouse
- Entender las posibles aplicaciones de un datawarehouse, así como los beneficios obtenidos
CONTENIDO DEL CURSO
- Evolution of Decision Support Systems
- Overview of Business Intelligence
- The Evolution
- Problems with the Naturally Evolving Architecture
- The Development Life Cycle
- Patterns of Hardware Utilization
- Setting the Stage for Re-engineering
- What Is a Data Warehouse?
- Monitoring the Data Warehouse Environment
|
- External Data and the Data Warehouse
- External Data in the Data Warehouse
- Metadata and External Data
- Storing External Data
- Different Components of External Data
- Modeling and External Data
- Secondary Reports
- Archiving External Data
- Comparing Internal Data to External Data
|
- Developing the Model
- Methodology
- Step 1: Select the Data of Interest
- Step 2: Add Time to the Key
- Step 3: Add Derived Data
- Step 4: Determine Granularity Level
- Step 5: Summarize Data
- Step 6: Merge Entities
- Step 7: Create Arrays
- Step 8: Segregate Data
|
- Unstructured Data and the Data Warehouse
- Integrating the Two Worlds
- A Themed Match
- A Two-Tiered Data Warehouse
- A Self-Organizing Map (SOM)
- The Unstructured Data Warehouse
- Volumes of Data and the Unstructured Data Warehouse
|
- The Data Warehouse and Technology
- Managing Large Amounts of Data
- Managing Multiple Media
- Indexing and Monitoring Data
- Parallel Storage and Management of Data
- Efficient Loading of Data
- Compaction of Data
- Compound Keys
- Variable-Length Data
- DBMS Types and the Data Warehouse
- Changing DBMS Technology
- Multidimensional DBMS and the Data Warehouse
- Data Warehousing across Multiple Storage Media
- Testing
|
- The Data Warehouse and the ODS
- Complementary Structures
- Different Classes of ODS
- Database Design—A Hybrid Approach
- Drawn to Proportion
- Transaction Integrity in the ODS
- Time Slicing the ODS Day
- Multiple ODS
- ODS and the Web Environment
|
- The Distributed Data Warehouse
- Types of Distributed Data Warehouses
- Local and Global Data Warehouses
- The Nature of the Development Efforts
- Completely Unrelated Warehouses
- Distributed Data Warehouse Development
- Building the Warehouse on Multiple Levels
- Multiple Groups Building the Current Level of Detail
- Multiple Platforms for Common Detail Data
|
- Cost-Justification and Return on Investment for a Data Warehouse
- Copying the Competition
- The Macro Level of Cost-Justification
- A Micro Level Cost-Justification
- Information from the Legacy Environment
- The Time Value of Data
- The Speed of Information
- Integrated Information
- The Value of Historical Data
- Historical Data and CRM
|
|
|
Métodos de enseñanza
El profesor expondrá los temas y su aplicación.
Los
alumnos realizarán tareas, prácticas y proyectos que refuercen lo visto en el
salón de clase.
Los alumnos efectuarán lecturas de artículos relacionados
con los temas vistos en clase.
Los alumnos realizarán investigaciones de
información que apoyen los conocimientos expuestos en clase.
Bibliografía
- William H. Inmon Building the Data Warehouse, 4th Edition
Wiley, Paperback, 4th edition, Published September 2005, 500 pages, ISBN 0764599445
- Claudia Imhoff, Nicholas Galemmo, Jonathan G. Geiger Mastering Data Warehouse Design
Wiley, Paperback, Published July 2003, 438 pages, ISBN 0471324213
- Ralph Kimball, Joe Caserta The Data Warehouse ETL Toolkit
Wiley, Paperback, Published September 2004, 491 pages, ISBN 0764567578
Secuencia
Cursos Antecedentes: Bases de datos
Cursos subsecuentes: Data Mining
Estructura del curso
Horas de clase: 3
Horas de laboratorio: 0
Total de unidades: 8 unidades
EVALUACION
Tareas, investigaciones |
15 |
Evaluaciones Parciales |
(15,20,20) |
Examen Final |
10 |
Proyecto(s) |
20 |
Total |
100 |
Políticas de clase
- Asistencia
- Dispositivos electrónicos
- Comida
Políticas de Tareas
Tareas y Programas
- Las tareas deberán entregarse el día especificado más tardar a la hora de clase.
- Las tareas que se entreguen después de esa hora recibirán una penalización de 1 punto por día, de manera que si se entrega la tarea ese mismo día pero después de la hora la máxima calificación que se podrá alcanzar será de 9, al día siguiente será de 8 y así sucesivamente.
- Para el caso de programas será necesario solicitar por email la revisión extemporánea de los mismos.
Tareas Opcionales
- Las tareas y/o participaciones opcionales son tareas que el estudiante puede hacer de manera voluntaria.
- Se indicará explícitamente cuando una tarea es de este tipo y cuando es obligatoria.
- El no entregarlas no repercute negativamente en la calificación final.
- La solución correcta tendrá un valor sobre la calificación final a indicarse para cada tarea (1 o 2 décimas de la calificación final).
|