Universidad de las Américas-Puebla 
Escuela de Ingeniería 
Departamento de Ingeniería en Sistemas Computacionales 
Información de Materia:
Almacenamiento y Recuperación de Información (IS 215) 
Profesor: Mtro. Carlos Proal
Dirección electrónica: carlos@mail.udlap.mx 
URL: http://ict.udlap.mx/people/carlos
Oficina: BI-104 (1er piso de biblioteca) 
Asesoría: previa cita (email)

DESCRIPCION DEL CURSO
Se describen y analizan los métodos para almacenar información en dispositivos magnéticos, así como para consultarla y modificarla de acuerdo a las necesidades de los usuarios y sus aplicaciones.

OBJETIVOS DEL CURSO

OBJETIVO PRINCIPAL
"Aprender"

OBJETIVO GENERAL
Al terminar el curso el estudiante deberá ser capaz de manipular archivos con distintas herramientas y dispositivos, además deberá poder analizar los métodos de almacenamiento y recuperación de información que sean los más apropiados para distintas operaciones, como son el almacenar, modificar, consultar y ordenar.
 

OBJETIVOS ESPECIFICOS

Que el alumno sea capaz de:

1) Revisar y evaluar los diferentes medios físicos para el almacenamiento de datos
2) Estudiar las técnicas básicas para el diseño de archivos
3) Analizar, aplicar y evaluar la organización de archivos
4) Analizar las técnicas para ordenamientos y búsquedas externas
CONTENIDO SINTETICO
Introducción
Dispositivos de Almacenamiento
Manejo de Archivos
Operaciones Fundamentales de Procesamiento de Archivos
Acceso y Organización de Archivos
Indexamiento
Hashing
Compresión
XML
Recuperación de Información Actual


CONTENIDO DEL CURSO
  • 1. Introducción
    • Presentación
    • Historia
  • 7. Indexamiento Multinivel y B-Trees
    • Multinivel
    • B-Trees
    • B*Trees
  • 2. Dispositivos de Almacenamiento
    • Discos, Cintas, CD-ROM, Discos Opticos
    • RAID
    • NAS/SAN
  • 8. Acceso secuencial indexado y B+Trees
    • ISAM
    • B+Trees
    • Prefix B+Trees
  • 3. Manipulación de Archivos
    • Paticionamiento de discos
    • Sistemas Manejadores: ext2, ext3, ntfs, ufs
    • Sistema de Archivos de Red: nfs, cifs
    • Manipulación a través del Sistema Operativo
    • Respaldos
  • 9. Indexamiento Hashing
    • Definición
    • Funciones de Hash
    • Resolución de Colisiones
    • Hash Extendido
  • 4. Operaciones Fundamentales de Procesamiento de Archivos
    • read, write, permisos
    • Archivos físicos y lógicos
    • Archivos de texto y binarios
    • Streams
  • 10. Compresión
    • Definición
    • Reversible
    • Irreversible
    • tar, zip, gzip, bzip2, rar, arj
  • 5. Acceso y Organización de Archivos
    • Archivos de Registros de longitud variable
    • Archivos de Registros de longitud fija
    • Acceso secuencial
    • Acceso directo
  • 11. XML
    • Introducción
    • Syntáxis
    • Definiciones de Tipo de Documento (DTD)
    • SAX, DOM
    • Ligado y Consulta
  • 6. Indexamiento
    • Definición
    • Archivos Indexados
    • Acceso por múltiples llaves
    • Archivos Invertidos
  • 12. Recuperación de Información Actual
    • Definición
    • Modelos de Recuperación de Información
    • Operaciones en Texto
    • Multimedios
 

Calendario de Temas

 

METODO DE ENSEÑANZA
Exposición de los conceptos, discusión de ejemplos y resolución de ejercicios, implementando los diseños en un lenguaje de programación. Formulación de proyectos globales para implementar un programa de razonable complejidad. Exposición de temas por parte de los alumnos.
 

AUXILIARES DIDACTICOS
- Pizarrón y manuales del lenguaje que se use
- Equipo de cómputo

SECUENCIA

Cursos Antecedentes : Estructuras de Datos (IS-211)
Cursos Consecuentes : Ingeniería de Software (IS-323), Bases de Datos (IS-341)

ESTRUCTURA DEL CURSO:
Horas de Clase : 3
Horas de Laboratorio : 0
Total de Unidades : 6

EVALUACION
 
Tareas 15
Exámenes Parciales 30
Examen Final  25
Proyectos 30
Total 100

Políticas de Tareas

Tareas y Programas

  • Las tareas deberán entregarse el día especificado más tardar a la hora de clase.
  • Las tareas que se entreguen después de esa hora recibirán una penalización de 1 punto por día, de manera que si se entrega la tarea ese mismo día pero después de la hora la máxima calificación que se podrá alcanzar será de 9, al día siguiente será de 8 y así sucesivamente.
  • Para el caso de programas será necesario solicitar por email la revisión extemporánea de los mismos.


Tareas Opcionales

  • Las tareas y/o participaciones opcionales son tareas que el estudiante puede hacer de manera voluntaria.
  • Se indicará explícitamente cuando una tarea es de este tipo y cuando es obligatoria.
  • El no entregarlas no repercute negativamente en la calificación final.
  • La solución correcta tendrá un valor sobre la calificación final a indicarse para cada tarea (1 o 2 décimas de la calificación final).


BIBLIOGRAFIA SUGERIDA

  • Baeza R. Modern Information Retrieval. Addison Wesley
  • Folk M. File Structures. Addison Wesley
  • Grossman D. Information Retrieval. Kluwer Academic Publishers.
  • Harold & Means. XML in a Nutshell. Oreilly
  • Horowitz & Sahni Fundamentals of data structures. Computer Science Press
  • Korth H. F. y Siberschartz A. Fundamentos de Bases de Datos. McGraw-Hill
  • Salton G. Automatic Text Processing. Addison Wesley
  • Wirth N. Algorithms+data structures=programs .Prentice-Hall