11. Web semántico

11.1 Introducción

11.1.1 Definición

Tim Berners-Lee, Director del World Wide Web Consortium (W3C):

  • Es el futuro de la web buscando 2 cosas:

    • Hacer la web un medio más colaborativo

    • Hacer la web un medio más entendible

  • Es colocar datos en la web de una manera tal que las máquinas puedan enternderlos de una manera natural o convertirlos o esa forma.

  • Una red de datos que pueden ser procesados directa o indirectamente por máquinas.

 

11.1.2 Pros y contras

Por qué es necesaria la web semántica ?

    • Sobrecarga de información
    • Sistemas cerrados
    • Agregación de contenidos deficiente

 

Para qué sirve ?

  • Toma de decisiones
  • Desarrollo de negocios
  • Compartición de información y descubrimiento de conocimiento
  • Administración y automatización

 

Qué dicen los escépticos ?

  • Mal precedente de IA
  • Costo, complejidad
  • Es una distracción del progreso lineal de la tecnología

 

11.2 Estapas

11.2.1 El camino a seguir

  • Texto y bases de datos: datos propietarios, la inteligencia radica en la aplicación y no en los datos
  • Documentos XML para un solo dominio: datos suficientemente inteligentes para moverse entre aplicaciones del mismo dominio o contexto.
  • Taxonomías y documentos con vocabulario mixto: en esta etapa los datos pueden ser compuestos por múltiples dominios y clasificados en una taxonomía jerárquica, la cual puede ser utilizada para descubrir más datos (relaciones y combinaciones). De manera que los datos son lo suficientemente inteligentes como para ser encontrados y combinados con otros.
  • Ontologías y reglas: en esta etapa nuevos datos pueden ser inferidos a partir de otros datos siguiendo reglas lógicas.

 

11.2.2 Niveles de semántica:

  1. Cosas --> XML
  2. Conocimiento acerca de las cosas --> RDF y Taxonomías
  3. Mundos --> Ontologías

11.2.3 Web Services

Parte del proceso para alcanzar verdaderamente una web semántica es aprovechar las tecnologías para buscar, encontrar y emplear servicios o información remota.

Actualmente los web services han proliferado enormemente y son cada vez más comunes en toda aplicación

El paso interesante será cuando esos servicios contengan semántica y sean capaces de interactuar unos con otros de un manera más "inteligente".

 

11.3 XML

Esta etapa está más que consolidada:

  • Un lenguaje nacido para el intercambio de información
  • Aislando siempre semántica de formato
  • Con lenguajes de consulta como XPath y XQuery
  • Inclusive con bases de datos

 

11.4 Resource Description Framework (RDF)

 

  • Es un lenguaje basado en XML para describir recursos
  • Un recurso puede verse como un documento electrónico disponible en la web

<?xml version=”1.0” encoding=”UTF-8” standalone=”yes”?>

<rdf:RDF xmlns:rdf= http://www.w3.org/1999/02/22-rdf-syntax-ns#

xmlns:dc=”http://purl.org/dc/elements/1.1:>

 

<rdf:Description about=”urn:isbn:0596002920”>

<dc:Title>XML in a Nutshell</dc:Title>

<dc:Creator>W. Scout Means</dc:Creator>

<dc:Subject>XML (Document Markup Language)</dc:Subject>

<dc:Description>A brief tutorial on XML an related technologies</dc:Description>

<dc:Publisher>O&apos;Reilly &amp; Associates</dc:Publisher>

<dc:Contributor>Laurie Petrycki</dc:Contributor>

<dc:Contributor>Susan Hart</dc:Contributor>

<dc:Date>2002-04-23</dc:Date>

<dc:Type>Text</dc:Type>

<dc:Format>6” x 9”</dc:Format>

<dc:Indentifier>0596002920</dc:Identifier>

<dc:Language>en-US</dc:Language>

<dc:Relation>http://www.oreilly.com/catalog/xmlnut/</dc:Relation>

<dc:Coverage>US UK ZA CA AU NZ</dc:Coverage>

<dc:Rights>Copyright 2002 O&apos;Reilly &amp; Associates</dc:Rights>

</rdf:Description>

</rdf:RDF>

 

El Esquema Dublin Core

title

una corta descripción de la foto. Ejemplo: María subida en "el elefante"
subject
una serie de palabras clave para describir la foto. Ver abajo el esquema de contenido con la lista de palabras clave. Ejemplo: retrato, paisaje
description
una descripción extensa de la foto. Ejemplo: María intenta trepar la roca de granito llamada "el elefante"
creator ("author/creator")
el fotógrafo, en forma de URL que puede además describirse con otros esquemas. Ejemplo: http://www.example.org/People/Bos
Publisher
la persona o institución que publica la foto, a menudo es la misma que el creador. Ejemplo: http://www.example.org/People/Bos
contributor
una persona que ha contribuido de alguna manera, por ejemplo, la persona que ha digitalizado la foto; puede ser una URL o un nombre.
date
la fecha y hora en que la foto fue tomada, de acuerdo con el formato ISO. El año es obligatorio, todo lo demás puede omitirse: yyyy[-mm[-dd[Thh:mm[:ss[.sTZD]]]]]. La zona horaria por defecto es UTC. Ejemplo: 1999-10-01
type
siempre "image"
format
siempre "image/jpeg"
identifier ("number")
un número para la foto que tiene sentido para el editor. No es la URL de la foto y no tiene que ser globalmente único. Ejemplo: 312
source
no usado.
language
no usado.
relation
identifica una serie: el evento o tema de una serie de fotografías. Puede ser una URL o un texto. Ejemplo: María en Le Sidobre.
coverage ("location")
la localización que se muestra en la foto. (Note que nosotros usamos sólo la "cobertura espacial" no la "cobertura temporal", ya que asumimos que una foto es una instantánea y por tanto el campo de fecha es suficiente.). Ejemplo: Le Sidobre (Laguna)
rights
declaración de derechos de autor, o la URL para ella. Ejemplo: http://www.example.org/People/Lafon/Copyright?1998

El Esquema Técnico

camera

la marca y modelo de la cámara, o una URL de la cámara. En caso de usar ésta última, la URL identifica una cámara determinada, no todas las cámaras de ese modelo. Ejemplo: http://www.example.org/People/Lafon/FooCamera8000i
film
la marca y tipo de la película. En contraste con las propiedades de la cámara, aquí no se trata de un rollo de película determinado, sino que identifica todos los rollos de película de un mismo tipo. (Asumimos que todos los rollos de un mismo tipo son suficientemente similares, excepto por errores de fabricación, son intercambiables). El valor puede ser un texto o una URL que se describe en alguna otra parte. Como convención, una cámara digital puede considerarse como una película "digital". Ejemplo: Ilfoo HP5
lens
una definición de las lentes usadas, puede ser una URI que las describe, una URI que apunta a la cámara para las cámaras compactas, o sólo una descripción en texto. Ejemplo: FooLens AF:70-210
devel-date
fecha en la que la película fue revelada. La fecha debe tener la misma forma que para la propiedad fecha. Ejemplo: 1998-08-04

El esquema de contenido

Portrait

La foto contiene un retrato de una persona.
Group-portrait
La foto contiene un retrato de un grupo de personas.
Landscape
La foto contiene un paisaje
Baby
La foto contiene un bebé.
Architecture
La foto contiene edificios interesantes.
Wedding
La foto contiene escenas de una boda.
Macro
La foto contiene una toma macro, un primer plano muy cercano que hace que algo parezca mayor de como se ve a simple vista.
Graphic
La foto contiene un patrón, textura o dibujo, que es interesante por sus cualidades gráficas abstractas.
Panorama
La foto contiene una panorámica de un paisaje.
Animal
La foto contiene un animal.
 

 

<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns="http://www.w3.org/1999/09/28-Photo-ns#"
xmlns:DC="http://purl.oclc.org/dc/documents/rec-dces-199809.htm#"
xmlns:Technical="http://www.w3.org/2000/PhotoRDF/technical-1-0#">
<rdf:Description about="">
<DC:Description>A nice, colorful bird near Mt Tambourine, Australia. It has a nice blue tail,
read and blue wings and head, it's looking at you!</DC:Description>
<DC:Type>image/jpeg</DC:Type>
<DC:Subject>Landscape</DC:Subject>
<DC:Source>35mm slide</DC:Source>
<DC:Rights>http://www.w3.org/People/Lafon/Copyright?1998</DC:Rights>
<DC:Title>Bird near Mt Tambourine</DC:Title>
<DC:Date>1998-04-20</DC:Date>
<DC:Coverage>Brisbane - Australia</DC:Coverage>
<DC:Creator>http://www.w3.org/People/Lafon/</DC:Creator>
<Technical:devel-date>2000-05-01</Technical:devel-date>
<Technical:lens>Minolta AF70-210</Technical:lens>
<Technical:camera>http://www.w3.org/People/Lafon/Minolta800i</Technical:camera>
<Technical:film>Fuji</Technical:film>
</rdf:Description>
</rdf:RDF>

 

 

11.5 Taxonomías

11.5.1 Definición

Una taxonomía es una jerarquía semántica en la cual entidades de información son relacionadas ya sea por subclasificaciones o subclases

11.5.2 Empleo

Por qué usar taxonomías ?

  • Es importante tener presencia, si algo no se encuentra no tiene valor para el que lo busca.
  • Encontrar productos y servicios
  • Para navegar por la información

Actualmente existen muchas formas de generar taxonomías, un ejemplo son los XML TopicMaps (http://www.topicmaps.org/xtm) que proveen un modelo y gramática para representar la estructura de recursos de información usados para definir tópicos y las asociaciones (relaciones) entre ellos.

 

  <topic id="hamlet">
    <instanceOf><topicRef xlink:href="#play"/></instanceOf>
    <baseName>
      <baseNameString>Hamlet, Prince of Denmark</baseNameString>
    </baseName>
    <occurrence>
      <instanceOf><topicRef xlink:href="#plain-text-format"/></instanceOf>
      <resourceRef
        xlink:href="ftp://www.gutenberg.org/pub/gutenberg/etext97/1ws2610.txt"/>
    </occurrence>
  </topic>

  <topic id="tempest">
    <instanceOf><topicRef xlink:href="#play"/></instanceOf>
    <baseName>
      <baseNameString>The Tempest</baseNameString>
    </baseName>
    <occurrence>
      <instanceOf><topicRef xlink:href="#plain-text-format"/></instanceOf>
      <resourceRef
        xlink:href="ftp://www.gutenberg.org/pub/gutenberg/etext97/1ws4110.txt"/>
    </occurrence>
  </topic>

Ejemplo de XTM para definir tópicos

 <association>
    <instanceOf><topicRef xlink:href="#written-by"/></instanceOf>
    <member>
      <roleSpec><topicRef xlink:href="#author"/></roleSpec>
      <topicRef xlink:href="#shakespeare"/>
    </member>
    <member>
      <roleSpec><topicRef xlink:href="#work"/></roleSpec>
      <topicRef xlink:href="#hamlet"/>
    </member>
  </association>

Ejemplo de XTM para definir asociaciones

 

 

11.6 Ontologías

11.6.1 Definición

  • Hablar de ontologías es hablar de vocabularios y su significado posiblemente interpretable por máquinas.
  • Se trata del descubrimiento de categorías y objetos que se adaptan a dichas categorías de formas que tienen sentido
  • Son una extensión de las taxonomías

Ejemplo: cuando hacemos una lista de las cosas que tenemos que hacer o comprar, priorizando algunos de ellos y categorizándolos estamos elaborando una ontología.

 

11.6.2 Componentes

 

  • Clases: cosas en general
  • Instancias: cosas en particular
  • Relaciones: entre cosas
  • Propiedades: de las cosas
  • Funciones: y procesos inmersos en las cosas
  • Restricciones: y reglas que circundan las cosas

11.6.3 Herramientas

http://www-protege.stanford.edu/

http://iweb.etri.re.kr/ezowl/

 

    Ejemplo de ontología en OWL