Universidad de las Américas-Puebla 
Escuela de Ingeniería 
Departamento de Ingeniería en Sistemas Computacionales 
Información de Materia:
Administración de la Información (IS 346) 
Profesor: Mtro. Carlos Proal
Dirección electrónica: carlos@mail.udlap.mx 
URL: http://ict.udlap.mx/people/carlos
Oficina: BI-310 (3er piso de biblioteca) 
Asesoría: previa cita (email)

Descripción del curso

Los sistemas de información a gran escala con petabytes de datos y miles de usuarios son una realidad. Estos sistemas acceden fuentes de datos estructurados o no estructurados representados en diferentes formatos (digitalizados, multimedia). Datos de diferentes tamaños son almacenados en bases de datos, en archivos o en otros dispositivos (relojes, radios, teléfonos celulares, televisiones, etc.). Los sistemas de búsqueda de información actuales, por ejemplo los motores de búsqueda en el WEB, han tenido que enfrentar el reto que les impone el crecimiento del volumen y diversidad de la información en línea, la alta frecuencia de modificaciones en el número, contenido y localización de las fuentes de datos. Diferentes soluciones más o menos adecuadas han sido propuestas. Una característica importante que distingue a los motores de búsqueda es la simplicidad de formulación de consultas, especificadas con unas cuantas palabras clave. Sin embargo, el precio de la simplicidad es la calidad de las respuestas.

En este curso se abordarán los principales problemas asociados con la administración de datos masivos accesibles en el WEB: modelado, recuperación, edición, interrogación y visualización. Se estudiará y experimentará el uso algunas herramientas orientadas al acceso de información masiva y a la administración de la información en el WEB.

Objetivo del curso

Objetivo principal
"Aprender"

Objetivos generales

Los objetivos generales del curso son:

  • Familiarizar al / a la estudiante con la noción de información masiva.
  • Familiarizar al / a la estudiante con herramientas disponibles en WEB.
  • Presentar los principios y técnicas de búsqueda de información.
  • Sensibilizar al / a la estudiante con respecto a los problemas a considerar cuando se administran grandes volúmenes de información.

 

Objetivos específicos

Los objetivos específicos del curso son:

  • Hacer comprender la noción de información, dato y contenido.
  • Introducir la noción de búsqueda de información.
  • Presentar el principio búsqueda de información en el WEB.
  • Experimentar el uso de motores de búsqueda disponibles en el WEB a través de consultas expresadas con palabras clave.
  • Hacer comprender la problemática de administración de información masiva en el WEB y presentar soluciones asociadas.

 

CONTENIDO DEL CURSO

  • 1. Introducción
    • Información y su rol en los sistemas
    • Datos vs información
    • Tipos de datos respecto a su estructura
      • Datos estructurados
      • Datos semiestructurados
      • Datos no estructurados
  • 6. Análisis de Información
    • Data warehouses
    • OLAP
    • Data Mining
  • 2. Modelado de datos estructurados
    • Modelado
    • Manejadores de bases de datos
    • Administración de bases de datos
    • Desarrollo de aplicaciones usando datos estructurados (LDAP, Hibernate, EJB)
  • 7. Datos semiestructurados
    • Modelado en XML
    • Lenguajes de Interrogación (XPath, XQuery, XUpdate)
    • Bases de datos XML
    • Administración de datos XML (XSL, XFO)
  • 3. Administración de BD
    • Arquitectura
    • OLTP
    • DSS
    • DBMS real
  • 8. Datos no estructurados
    • Modelos de recuperación
      • Booleano, Vectorial, LSI, SVD
    • Motores y meta-motores de búsqueda
      • Arquitectura general
      • Búsqueda de información moderna: catálogos, clasificaciones, búsqueda automática
  • 4. Alta disponibilidad y alto desempeño
    • Disponiibilidad
    • Desempeño
    • Clustering
    • Load balancing
  • 9. Combinación de modelos
    • Arquitectura
    • Beneficios
    • Aplicaciones
  • 5. Prog. Datos Estructurados
    • Hibernate
    • EJB
    • LDAP
  • 10. Interoperabilidad
    • Protocolos
    • Agentes
    • Web services
    • WAP
 
  • 11. Web semántico
    • Definición
    • Resource Description Framework (RDF)
    • Taxonomías
    • Ontologías
    • Interoperabilidad
 

Métodos de enseñanza

El o la profesor(a) hará exposiciones orales de los temas del programa. Se organizarán sesiones de ejercicios teóricos y prácticos orientados a reafirmar los conceptos aprendidos. Los estudiantes harán experimentos en computadora y los resultados serán analizados y discutidos en clase.

Auxiliares didácticos
Lectura de artículos.
• Material audiovisual
• Equipo de cómputo.

Secuencia

Cursos Antecedentes: Almacenamiento y Recuperación de Información, is215
Cursos subsecuentes: ninguno

Estructura del curso
Horas de clase: 3
Horas de laboratorio: 0
Total de unidades: 6 unidades

EVALUACION
 
Tareas 15
Exámenes Parciales 30
Examen Final  20
Proyectos 35
Total 100

Políticas de Tareas

Tareas y Programas

  • Las tareas deberán entregarse el día especificado más tardar a la hora de clase.
  • Las tareas que se entreguen después de esa hora recibirán una penalización de 1 punto por día, de manera que si se entrega la tarea ese mismo día pero después de la hora la máxima calificación que se podrá alcanzar será de 9, al día siguiente será de 8 y así sucesivamente.
  • Para el caso de programas será necesario solicitar por email la revisión extemporánea de los mismos.


Tareas Opcionales

  • Las tareas y/o participaciones opcionales son tareas que el estudiante puede hacer de manera voluntaria.
  • Se indicará explícitamente cuando una tarea es de este tipo y cuando es obligatoria.
  • El no entregarlas no repercute negativamente en la calificación final.
  • La solución correcta tendrá un valor sobre la calificación final a indicarse para cada tarea (1 o 2 décimas de la calificación final).

Bibliografía


Garcia-Molina. Database Systems The complete book. Prentice Hall
Mullins. Database Administration. Addison Wesley
Wessler. Oracle DBA on Unix and Linux. Sams publishing.
Harold. XML in a nutshell. Oreilly
Graves. Designing XML databases. Prentice Hall
Chaudhri. XML Data Management. Addison Wesley
Baeza R. Modern Information Retrieval. Addison Wesley
Grossman D. Information Retrieval. Kluwer Academic Publishers.
Daconta. The semantic web. Wiley