10. Interoperabilidad

 

10.1 Introducción

Interoperabilidad
- Meta: Compartir recursos homogeneos y heterogéneos (distintos formatos, plataformas de hardware y software)
- Mecanismo básico: protocolo compartido

LISI (Levels of Information Systems Interoperability), es una disciplina y un proceso para definir, determinar y certificar el grado de interoperatividad requerido o logrado entre organizaciones o sistemas, tratando a la interoperatividad como simples conexiones entre sistemas. El usar LISI identifica el nivel de interoperatividad requerido por la vista operacional de nodo a nodo.

El modelo de Madurez de Interoperabilidad clasifica 5 niveles de "la naturaleza general de la interoperabilidad", como Aislado, Conectado, Funcional, Dominio y Empresa, cada uno con características representativas.

Nivel

Intercambio de Información

4: Universal

Manipulación interactiva

Datos compartidos y aplicaciones


  • Información de dominios diferentes y colaboración compartida

  • Colaboración avanzada

3: Integrado

Datos compartidos

Aplicaciones separadas

  • Bases de datos compartidas

  • Colaboración sofisticada

2: Distribuido

Funciones comunes mínimas

Aplicaciones y datos separados

  • Intercambio heterogéneo de productos

  • Colaboración Básica

1: Conectado

Conexiones electrónicas, aplicaciones y datos

Aplicaciones y datos separados

  • Intercambio homogéneo de productos

0: Aislado No conectado

  • Enlace Manual

Modelo de Madurez LISI

 

Las vistas del sistema responden identificando y determinando características en términos de cuatro atributos: Procedimientos, Aplicaciones, Infraestructura y Datos (PAID) los cuales representan las capacidades del sistema. Esto integra un Modelo de Referencia que toma los 5 niveles de interoperatividad describiéndolos con los atributos ya mencionados

El Modelo de Referencia LISI

10.2 Interoperabilidad de datos

Hoy día el intercambiar datos es algo trivial y común en todas las organizaciones

Para intercambiar datos hay que definir un mecanismo de intercambio y un lenguaje o schema que entiendan los distintos puntos del enlace.

XML es el estándar por default en la mayoría de las aplicaciones modernas

Existen aplicaciones y protocolos ya bien establecidos

Castor

http://www.castor.org/index.html

XStream

http://xstream.codehaus.org/

Web Services

Parte del proceso para alcanzar verdaderamente una web semántica es aprovechar las tecnologías para buscar, encontrar y emplear servicios o información remota.

Actualmente los web services han proliferado enormemente y son cada vez más comunes en toda aplicación

El paso interesante será cuando esos servicios contengan semántica y sean capaces de interactuar unos con otros de un manera más "inteligente".

 

Creación de web services con JBuilder

 
 
 
 
 
 
 
 
 
 
 
 
 

 

10.3 Interoperabilidad de información

 

La idea de intercambiar datos (por ejemplo con XML) es un esquema que suena muy atractivo pero desgraciadamente no es posible en muchos casos.

Supongamos el caso de intercambio de documentos, sería imposible pensar en tener todos los esquemas que nos indiquen la forma o estructura de todos los tipos disponibles en un repositorio, si eso lo extrapolamos a muchos repositorios tendríamos cientos o quizás miles de esquemas que traducir, lo cual resulta imposible de manejar.

Metadatos

Por lo tanto hay que pensar en una manera simple de poder manejar este tipo de problemas y la solución mas viable es emplear metadatos.

  • Metadatos: Datos (estructurados) acerca de los datos (ejemplos: tipos de datos, formatos, estilos,?)
  • A nivel documento u objeto de información, los metadatos indican estructura, organización y facilitan la interpretación
  • A nivel colección, pueden facilitar la interoperabilidad
    • Colecciones estructuradas: metadatos abundantes, patrones rígidos
    • Colecciones no estructuradas: metadatos escasos
    • Colecciones semi-estructuradas: metadatos flexibles, en algunos casos abundantes

Un argumento en contra de los metadatos sería: la información únicamente se está describiendo con los metadatos, de manera que si algo no está incluído en éstos, simplemente no se encontrará al momento de realizar una búsqueda.


Estándares de Metadatos

  • Existen cientos, o miles? por tanto podría cuestionarse si son estándares
  • Ejemplos: DTDs para dominios específicos como química, matemáticas, GIS, derecho, música, etc.
  • Promovidos por organizaciones como OASIS (Organization for the Advancement of Structured Information Standards-http://www.oasisopen.org), WWW Consortium (www.w3c.org), ANSI (American National Standards Institute),ISO, etc.

Dublin Core (DC)

  • Propuesta de estándar "general" para facilitar la localización de recursos en Internet
  • Promovido por DCMI, Dublin Core Metadata Initiative (http://dublincore.org), integrada por organizaciones en bibliotecas digitales y tradicionales, museos, gobiernos
  • Algunos miembros: NSF, CNRI, NCSA, OAI, OCLC, bibliotecas nacionales de EEUU, Canada, Australia,
    Finlandia, etc
  • Meta: un "lenguaje" simple de intercambio
  • DCMI provee plantillas, esquemas, software para creación y validación de metadatos en DC
  • Conjunto de 15 descriptores de recursos

 

El Esquema Dublin Core

Ejemplo de una fotografía

title

una corta descripción de la foto. Ejemplo: María subida en "el elefante"
subject
una serie de palabras clave para describir la foto. Ver abajo el esquema de contenido con la lista de palabras clave. Ejemplo: retrato, paisaje
description
una descripción extensa de la foto. Ejemplo: María intenta trepar la roca de granito llamada "el elefante"
creator ("author/creator")
el fotógrafo, en forma de URL que puede además describirse con otros esquemas. Ejemplo: http://www.example.org/People/Bos
Publisher
la persona o institución que publica la foto, a menudo es la misma que el creador. Ejemplo: http://www.example.org/People/Bos
contributor
una persona que ha contribuido de alguna manera, por ejemplo, la persona que ha digitalizado la foto; puede ser una URL o un nombre.
date
la fecha y hora en que la foto fue tomada, de acuerdo con el formato ISO. El año es obligatorio, todo lo demás puede omitirse: yyyy[-mm[-dd[Thh:mm[:ss[.sTZD]]]]]. La zona horaria por defecto es UTC. Ejemplo: 1999-10-01
type
siempre "image"
format
siempre "image/jpeg"
identifier ("number")
un número para la foto que tiene sentido para el editor. No es la URL de la foto y no tiene que ser globalmente único. Ejemplo: 312
source
no usado.
language
no usado.
relation
identifica una serie: el evento o tema de una serie de fotografías. Puede ser una URL o un texto. Ejemplo: María en Le Sidobre.
coverage ("location")
la localización que se muestra en la foto. (Note que nosotros usamos sólo la "cobertura espacial" no la "cobertura temporal", ya que asumimos que una foto es una instantánea y por tanto el campo de fecha es suficiente.). Ejemplo: Le Sidobre (Laguna)
rights
declaración de derechos de autor, o la URL para ella. Ejemplo: http://www.example.org/People/Lafon/Copyright?1998

METS

  • Metadata Encoding and Transmission Standard
  • Enfocado a describir objetos en bibliotecas digitales usando XML
  • Promovido por DLF (Federación de Bibliotecas Digitales) desde 2003
  • Describe documentos integrados por 7 secciones:
    • Encabezado, metadatos descriptivos, administrativos, archivos de contenido, mapa estructural (jerarquía de archivos), ligas (entre nodos), comportamiento

 


Interoperabilidad OAI-PMH

  • OAI: Iniciativa de Archivos Abiertos, organización enfocada a la diseminación de contenidos digitales
  • Surge como una evolución del sistema Universal Preprint Service, una biblioteca digital de archivos cruzados que provee servicios sobre una colección de metadatos extraídos de múltiples archivos
  • PMH: Protocolo para recolección de metadatos
  • Participantes:
    • Proveedores de datos-ofrecen colecciones vía OAI-PMH
    • Proveedores de servicios - construyen servicios (ej. IR) usando metadatos

 

 

 

Características

  • Requiere como mínimo el uso de Dublin Core
  • Un servidor debe atender 6 peticiones o verbos:
    • Identify - identifica la colección
    • ListMetadataFormats - obtiene formatos de metadatos disponibles en la colección
    • ListIdentifiers - obtiene encabezados de objetos (id, fecha,conjunto)
    • ListSets - Obtiene la organización de conjuntos de la colección
    • GetRecord - obtiene metadatos de un objeto
    • ListRecords - obtiene metadatos de objetos filtrando por conjunto o fecha

 

 

 

 

 

 

Qué significa OAI-PMH para los autores de documentos ?

  • A primera vista, nada!
  • Una buena implementación de OAI debe ser absolutamente invisible a las operaciones normales de cualquier usuario.
  • Indirectamente, se ven beneficiados de la masa enorme de desarrollos elaborados por los data providers y service providers.

 

Qué significa OAI-PMH para los editores ?

  • Todo!
  • La manera de intercambio de información cambia dramáticamente
  • Es un componente importante en el enorme esfuerzo de la comunicación escolar
    La integración de recursos y servicios será el foco de journals, sociedades profesionales, universidades, etc.
  • Será una tecnología base para la publicación científica como http & XML
  • Ejemplo Google Scholar

 

OpenURL

 

 

Otras tecnologías fundamentales

  • URNs
  • Persistent URLs (PURLs)
    • http://purl.org/
  • Handles
    • http://www.handle.net/
  • Digital Object Identifiers
    • http://www.doi.org/
  • ARK
    • http://www.cdlib.org/inside/diglib/ark/