10. Interoperabilidad
10.1 Introducción
Interoperabilidad
- Meta: Compartir recursos homogeneos y heterogéneos (distintos
formatos, plataformas de hardware y software)
- Mecanismo básico: protocolo compartido
LISI (Levels of Information Systems Interoperability), es una disciplina
y un proceso para definir, determinar y certificar el grado de interoperatividad
requerido o logrado entre organizaciones o sistemas, tratando a la interoperatividad
como simples conexiones entre sistemas. El usar LISI identifica el nivel
de interoperatividad requerido por la vista operacional de nodo a nodo.
El modelo de Madurez de Interoperabilidad clasifica 5 niveles de "la
naturaleza general de la interoperabilidad", como Aislado, Conectado,
Funcional, Dominio y Empresa, cada uno con características representativas.
Nivel |
Intercambio de Información |
4: Universal
Manipulación
interactiva
Datos compartidos y
aplicaciones
|
|
3: Integrado
Datos compartidos
Aplicaciones separadas |
|
2: Distribuido
Funciones comunes mínimas
Aplicaciones y datos separados |
|
1: Conectado
Conexiones
electrónicas, aplicaciones y datos
Aplicaciones y datos separados |
|
0: Aislado No
conectado |
|
Modelo de Madurez LISI
Las vistas del sistema responden identificando y determinando
características en términos de cuatro atributos: Procedimientos,
Aplicaciones, Infraestructura y Datos (PAID) los cuales representan las
capacidades del sistema. Esto integra un Modelo de Referencia que
toma los 5 niveles de interoperatividad describiéndolos con los
atributos ya mencionados
El Modelo de Referencia LISI
10.2 Interoperabilidad de datos
Hoy día el intercambiar datos es algo trivial y común en
todas las organizaciones
Para intercambiar datos hay que definir un mecanismo de intercambio y
un lenguaje o schema que entiendan los distintos puntos del enlace.
XML es el estándar por default en la mayoría de las aplicaciones
modernas
Existen aplicaciones y protocolos ya bien establecidos
Castor
http://www.castor.org/index.html
XStream
http://xstream.codehaus.org/
Web Services
Parte del proceso para alcanzar verdaderamente una web semántica
es aprovechar las tecnologías para buscar, encontrar y emplear
servicios o información remota.
Actualmente los web services han proliferado enormemente y son cada vez
más comunes en toda aplicación
El paso interesante será cuando esos servicios contengan semántica
y sean capaces de interactuar unos con otros de un manera más "inteligente".
Creación de web services con JBuilder
10.3 Interoperabilidad de información
La idea de intercambiar datos (por ejemplo con XML) es un esquema que
suena muy atractivo pero desgraciadamente no es posible en muchos casos.
Supongamos el caso de intercambio de documentos, sería imposible
pensar en tener todos los esquemas que nos indiquen la forma o estructura
de todos los tipos disponibles en un repositorio, si eso lo extrapolamos
a muchos repositorios tendríamos cientos o quizás miles
de esquemas que traducir, lo cual resulta imposible de manejar.
Metadatos
Por lo tanto hay que pensar en una manera simple de poder manejar este
tipo de problemas y la solución mas viable es emplear metadatos.
- Metadatos: Datos (estructurados) acerca de los datos (ejemplos: tipos
de datos, formatos, estilos,?)
- A nivel documento u objeto de información, los metadatos indican
estructura, organización y facilitan la interpretación
- A nivel colección, pueden facilitar la interoperabilidad
- Colecciones estructuradas: metadatos abundantes, patrones rígidos
- Colecciones no estructuradas: metadatos escasos
- Colecciones semi-estructuradas: metadatos flexibles, en algunos
casos abundantes
Un argumento en contra de los metadatos sería: la información
únicamente se está describiendo con los metadatos, de
manera que si algo no está incluído en éstos, simplemente
no se encontrará al momento de realizar una búsqueda.
Estándares de Metadatos
- Existen cientos, o miles? por tanto podría cuestionarse si
son estándares
- Ejemplos: DTDs para dominios específicos como química,
matemáticas, GIS, derecho, música, etc.
- Promovidos por organizaciones como OASIS (Organization for the Advancement
of Structured Information Standards-http://www.oasisopen.org), WWW Consortium
(www.w3c.org), ANSI (American National Standards Institute),ISO, etc.
Dublin Core (DC)
- Propuesta de estándar "general" para facilitar la
localización de recursos en Internet
- Promovido por DCMI, Dublin Core Metadata Initiative (http://dublincore.org),
integrada por organizaciones en bibliotecas digitales y tradicionales,
museos, gobiernos
- Algunos miembros: NSF, CNRI, NCSA, OAI, OCLC, bibliotecas nacionales
de EEUU, Canada, Australia,
Finlandia, etc
- Meta: un "lenguaje" simple de intercambio
- DCMI provee plantillas, esquemas, software para creación y
validación de metadatos en DC
- Conjunto de 15 descriptores de recursos
El Esquema Dublin Core
Ejemplo de una fotografía
title
- una corta descripción de la foto. Ejemplo: María
subida en "el elefante"
- subject
- una serie de palabras clave para describir la foto. Ver abajo el
esquema de contenido con la lista de palabras clave. Ejemplo: retrato,
paisaje
- description
- una descripción extensa de la foto. Ejemplo: María
intenta trepar la roca de granito llamada "el elefante"
- creator ("author/creator")
- el fotógrafo, en forma de URL que puede además describirse
con otros esquemas. Ejemplo: http://www.example.org/People/Bos
- Publisher
- la persona o institución que publica la foto, a menudo es
la misma que el creador. Ejemplo: http://www.example.org/People/Bos
- contributor
- una persona que ha contribuido de alguna manera, por ejemplo, la
persona que ha digitalizado la foto; puede ser una URL o un nombre.
- date
- la fecha y hora en que la foto fue tomada, de acuerdo con el formato
ISO. El año es obligatorio, todo lo demás puede omitirse:
yyyy[-mm[-dd[Thh:mm[:ss[.sTZD]]]]]. La zona horaria por defecto es
UTC. Ejemplo:
1999-10-01
- type
- siempre "image"
- format
- siempre "image/jpeg"
- identifier ("number")
- un número para la foto que tiene sentido para el editor.
No es la URL de la foto y no tiene que ser globalmente único.
Ejemplo: 312
- source
- no usado.
- language
- no usado.
- relation
- identifica una serie: el evento o tema de una serie de fotografías.
Puede ser una URL o un texto. Ejemplo: María en Le
Sidobre.
- coverage ("location")
- la localización que se muestra en la foto. (Note que nosotros
usamos sólo la "cobertura espacial" no la "cobertura temporal",
ya que asumimos que una foto es una instantánea y por tanto
el campo de fecha es suficiente.). Ejemplo: Le Sidobre
(Laguna)
- rights
- declaración de derechos de autor, o la URL para ella. Ejemplo:
http://www.example.org/People/Lafon/Copyright?1998
METS
- Metadata Encoding and Transmission Standard
- Enfocado a describir objetos en bibliotecas digitales usando XML
- Promovido por DLF (Federación de Bibliotecas Digitales) desde
2003
- Describe documentos integrados por 7 secciones:
- Encabezado, metadatos descriptivos, administrativos, archivos
de contenido, mapa estructural (jerarquía de archivos), ligas
(entre nodos), comportamiento
Interoperabilidad OAI-PMH
- OAI: Iniciativa de Archivos Abiertos, organización enfocada
a la diseminación de contenidos digitales
- Surge como una evolución del sistema Universal Preprint Service,
una biblioteca digital de archivos cruzados que provee servicios sobre
una colección de metadatos extraídos de múltiples
archivos
- PMH: Protocolo para recolección de metadatos
- Participantes:
- Proveedores de datos-ofrecen colecciones vía OAI-PMH
- Proveedores de servicios - construyen servicios (ej. IR) usando
metadatos
Características
- Requiere como mínimo el uso de Dublin Core
- Un servidor debe atender 6 peticiones o verbos:
- Identify - identifica la colección
- ListMetadataFormats - obtiene formatos de metadatos disponibles
en la colección
- ListIdentifiers - obtiene encabezados de objetos (id, fecha,conjunto)
- ListSets - Obtiene la organización de conjuntos de la
colección
- GetRecord - obtiene metadatos de un objeto
- ListRecords - obtiene metadatos de objetos filtrando por conjunto
o fecha
Qué significa OAI-PMH para los autores de documentos ?
- A primera vista, nada!
- Una buena implementación de OAI debe ser absolutamente invisible
a las operaciones normales de cualquier usuario.
- Indirectamente, se ven beneficiados de la masa enorme de desarrollos
elaborados por los data providers y service providers.
Qué significa OAI-PMH para los editores ?
- Todo!
- La manera de intercambio de información cambia dramáticamente
- Es un componente importante en el enorme esfuerzo de la comunicación
escolar
La integración de recursos y servicios será el foco de
journals, sociedades profesionales, universidades, etc.
- Será una tecnología base para la publicación
científica como http & XML
- Ejemplo Google Scholar
OpenURL
Otras tecnologías fundamentales
- URNs
- Persistent URLs (PURLs)
- Handles
- Digital Object Identifiers
- ARK
- http://www.cdlib.org/inside/diglib/ark/
|