Bases de datos avanzadas (CB-00862)

Instituto Tecnológico y de Estudios Superiores de Monterrey  
Escuela de Ingeniería 
Departamento de Tecnologías de la Información y Electrónica
Horario: Lunes y Jueves 8:30-10
Salón de clase: 1-205

Profesor: Mtro. Carlos Proal Aguilar
Dirección electrónica: cproal@itesm.mx , carlos.proal@gmail.com
Asesoría: LuJu 11:30, MaVi 8:30 y/o previa cita (email)

Descripción del curso

Los sistemas de información a gran escala con petabytes de datos y miles de usuarios son una realidad. Estos sistemas acceden fuentes de datos estructurados o no estructurados representados en diferentes formatos (digitalizados, multimedia). Datos de diferentes tamaños son almacenados en bases de datos, en archivos o en otros dispositivos (relojes, radios, teléfonos celulares, televisiones, etc.). Los sistemas de búsqueda de información actuales, por ejemplo los motores de búsqueda en el WEB, han tenido que enfrentar el reto que les impone el crecimiento del volumen y diversidad de la información en línea, la alta frecuencia de modificaciones en el número, contenido y localización de las fuentes de datos. Diferentes soluciones más o menos adecuadas han sido propuestas. Una característica importante que distingue a los motores de búsqueda es la simplicidad de formulación de consultas, especificadas con unas cuantas palabras clave. Sin embargo, el precio de la simplicidad es la calidad de las respuestas.

En este curso se abordarán los principales problemas asociados con la administración de datos masivos : modelado, recuperación, edición, interrogación y visualización. Se estudiará y experimentará el uso algunas herramientas orientadas al acceso de información masiva y a la administración de la información.

Así mismo se cubren aspectos fundamentales de bases de datos distribuidas, bases de datos orientadas a objetos, y aspectos de interoperabilidad en bases de datos en el WEB. Otras nuevas tecnologías en bases de datos serán brevemente introducidas.

Objetivo del curso

Objetivo principal
"Aprender"

Objetivos generales

Los objetivos generales del curso son:

  • Familiarizar al / a la estudiante con la noción de información masiva.
  • Familiarizar al / a la estudiante con herramientas disponibles en WEB.
  • Presentar los principios y técnicas de búsqueda de información.
  • Sensibilizar al / a la estudiante con respecto a los problemas a considerar cuando se administran grandes volúmenes de información.

 

Objetivos específicos

Los objetivos específicos del curso son:

  • Hacer comprender la noción de información, dato y contenido.
  • Introducir la noción de búsqueda de información.
  • Presentar el principio búsqueda de información en el WEB.
  • Experimentar el uso de motores de búsqueda disponibles en el WEB a través de consultas expresadas con palabras clave.
  • Hacer comprender la problemática de administración de información masiva en el WEB y presentar soluciones asociadas.

 

CONTENIDO DEL CURSO

  • 1. Introducción
    • Información y su rol en los sistemas
    • Datos vs información
    • Tipos de datos respecto a su estructura
      • Datos estructurados
      • Datos semiestructurados
      • Datos no estructurados
  • 6. Bases de Datos Orientadas a Objetos y
    Base de Datos Objeto-Relacional.
    • Definición
    • Estructura
    • Implementación
  • 2. Modelado de datos estructurados
    • Modelado
    • Tablas
  • 7. Programación datos estructurados
    • DAO pattern
    • DTO pattern
    • JPA (java persistence api)
  • 3. Administración de bases de datos
    • Manejadores de bases de datos
    • Administración de DBMS

 

  • 8. Datos semiestructurados
    • Modelado en XML
    • Lenguajes de Interrogación (XPath, XQuery, XUpdate)
    • Bases de datos XML
  • 4. Alta disponibilidad y alto desempeño
    • Disponiibilidad
    • Desempeño
    • Clustering
    • Load balancing
  • 9. Datos no estructurados
    • Modelos de recuperación
      • Booleano,
      • Vectorial
  • 5. Bases de datos distribuídas
    • Fundamentos
    • Fragmentación
    • Consultas
  • 10. Combinación de modelos
    • Arquitectura
    • Beneficios
    • Aplicaciones
   
 

Métodos de enseñanza

El o la profesor(a) hará exposiciones orales de los temas del programa. Se organizarán sesiones de ejercicios teóricos y prácticos orientados a reafirmar los conceptos aprendidos. Los estudiantes harán experimentos en computadora y los resultados serán analizados y discutidos en clase.

 

Bibliografía

Ozsu, Valduriez. Principles of Distributed Dtavase Systems, Prentice-Hall
Garcia-Molina. Database Systems The complete book. Prentice Hall
Mullins. Database Administration. Addison Wesley
Wessler. Oracle DBA on Unix and Linux. Sams publishing.
Harold. XML in a nutshell. Oreilly
Graves. Designing XML databases. Prentice Hall
Chaudhri. XML Data Management. Addison Wesley
Baeza R. Modern Information Retrieval. Addison Wesley
Grossman D. Information Retrieval. Kluwer Academic Publishers.
Daconta. The semantic web. Wiley

Secuencia

Cursos Antecedentes: Fundamentos de bases de datos
Cursos subsecuentes: ninguno

Estructura del curso
Horas de clase: 3
Horas de laboratorio: 0
Total de unidades: 8 unidades

Evaluación
 
Tareas 15
Evaluaciones Parciales 40 (10,15,15)
Examen Final  10
Proyecto(s) 35
Total 100

Políticas de clase

  • Asistencia
  • Dispositivos electrónicos
  • Comida

Políticas de Tareas

Tareas y Programas

  • Las tareas deberán entregarse el día especificado más tardar a la hora de clase.
  • Las tareas que se entreguen después de esa hora recibirán una penalización de 1 punto por día, de manera que si se entrega la tarea ese mismo día pero después de la hora la máxima calificación que se podrá alcanzar será de 9, al día siguiente será de 8 y así sucesivamente.
  • Para el caso de programas será necesario solicitar por email la revisión extemporánea de los mismos.


Tareas Opcionales

  • Las tareas y/o participaciones opcionales son tareas que el estudiante puede hacer de manera voluntaria.
  • Se indicará explícitamente cuando una tarea es de este tipo y cuando es obligatoria.
  • El no entregarlas no repercute negativamente en la calificación final.
  • La solución correcta tendrá un valor sobre la calificación final a indicarse para cada tarea (1 o 2 décimas de la calificación final).