Servicios web Semanticos para la gestion de trabajos de grado

83
DISEÑO E IMPLEMENTACIÓN DE SERVICIOS WEB SEMÁNTICOS PARA LA GESTIÓN DE LA INFORMACIÓN DE TRABAJOS DE GRADO EN LA UNIVERSIDAD DE CÓRDOBA. STEPHANY GREY SUAREZ GALVAN ANTONIO CARLOS VARGAS ORTIZ Trabajo presentado al departamento de ingenieria de sistemas y telecomunicaciones, en cumplimiento parcial de los requisitos para obtener el grado de ingeniero de sistemas. Universidad de Córdoba Facultad de Ingenierías

Transcript of Servicios web Semanticos para la gestion de trabajos de grado

DISEÑO E IMPLEMENTACIÓN DE SERVICIOS WEB SEMÁNTICOS PARA LAGESTIÓN DE LA INFORMACIÓN DE TRABAJOS DE GRADO EN LA

UNIVERSIDAD DE CÓRDOBA.

STEPHANY GREY SUAREZ GALVANANTONIO CARLOS VARGAS ORTIZ

Trabajo presentado al departamento de ingenieria de sistemasy telecomunicaciones, en cumplimiento parcial de los

requisitos para obtener el grado de ingeniero de sistemas.

Universidad de Córdoba

Facultad de Ingenierías

Departamento de Ingeniería de Sistemas y Telecomunicaciones

2012

2

DISEÑO E IMPLEMENTACIÓN DE SERVICIOS WEB SEMÁNTICOS PARA LAGESTIÓN DE LA INFORMACIÓN DE TRABAJOS DE GRADO EN LA

UNIVERSIDAD DE CÓRDOBA

ELABORADO POR:

STEPHANY GREY SUAREZ GALVANEstudiante Ing. Sistemas

ANTONIO CARLOS VARGAS ORTIZEstudiante Ing. Sistemas

Director:

MSc. Milton Hernández Zakzuk

Universidad de Córdoba

Facultad de Ingenierías

Departamento de Ingeniería de Sistemas y Telecomunicaciones3

2012

Nota de Aceptación

____________________________

__________________________________

____________________________

____________________________

Jurado 1

____________________________

Jurado 2

4

Fecha

DEDICATORIA

Dios a ti te doy las gracias y por permitirme cumplir con este logro tan importante. A mimamá, A mi papá se los dedico de todo corazón por llevarme al punto en el que me

encuentro y siempre creer en que yo podía, por darme ese ánimo que necesite tanto, A mishermanos, mi familia, mis amigos y demás que me apoyaron en el largo camino que me

ha tocado recorrer hasta el momento. Gracias a ti Antonio por aguantarme y aun asíseguir ahí, le dedico este logro a todos los que creyeron en mí… Muchas gracias a Todos

STEPHANY GREY SUAREZ GALVAN

5

‘La educación es la mejor herencia que podemos recibir’, a mi papa por enseñarme estaspalabras, a mi mami por apoyarme y no dejarme caer, a ambos por acompañarme mi

entras pudieron, a mis hermanos por ser mis papás cuando pudieron, a mis amigos porser mis hermanos cuando los

necesite, a mi compañera por ser mi compañera, mi amiga y consejera, a Dios por darmefuerzas de más cuando las necesite, espíritu de lucha cuando flaqueaba y voluntad

cuando caía. Papá, mamá, este logro es por Uds. y para Uds., por acompañarme auncuando no estuvieron presentes.

Gracias a todos, este es el primero de muchos…

ANTONIO CARLOS VARGAS ORTIZ

AGRADECIMIENTOS

Ante todo le damos las gracias a DIOS por habernos permitido llegar hasta aquí y habercumplido con satisfacciones este proyecto, al Ingeniero Milton Hernández, nuestro

director, que nos sirvió de guía en esta empresa, al Ingeniero Daniel Salas, quedesinteresadamente nos

tendió la mano cuando lo necesitamos, al cuerpo docente del departamento de Ingenieríade sistemas y al de la Universidad de Córdoba en general, por brindarnos los

6

conocimientos y herramientas para lograr nuestro objetivo, a nuestros compañeros quenos

acompañaron y ayudaron a crecer a lo largo de este proceso de aprendizaje, gracias atodos ellos, por creer en nosotros y ayudarnos a alcanzar este gran logro.

TAB LADE CONTENIDOSTABLA DE ILUSTRACIONES..................................................8

LISTA DE TABLAS.........................................................9

RESUMEN DEL PROYECTO.................................................11ABSTRACT.............................................................11PALABRAS CLAVES......................................................12KEY WORKS............................................................12OBJETIVOS............................................................12INTRODUCCIÓN.........................................................13

CAPITULO I.............................................................15

FUNDAMENTOS TEORICOS Y TECNOLOGICOS DE LOS SERVICIOS WEB SEMÁNTICOS....15

1.1 MARCO CONCEPTUAL...................................................15

1.2 SERVICIOS WEB:.....................................................157

1.2.1 ARQUITECTURA DE LOS SERVICIOS WEB...................................16

1.3 WEB SEMÁNTICA......................................................18

1.3.1 ARQUITECTURA DE LA WEB SEMÁNTICA....................................191.3.2 METADATOS.....................................................201.3.3 ONTOLOGÍAS.....................................................22

1.3.3.1 Componentes de una Ontología..........................................................................................221.3.3.2 RDF (RESOURCE DESCRIPTION FRAMEWORK) Y RDF Schema...........................................231.3.3.3 OWL (Web OntologyLanguage)............................................................................................231.3.3.4 XOL (XML-BASED ONTOLOGY EXCHANGE LANGUAGE)........................................................241.3.3.5 XML, DTD y XML Schema.......................................................................................................24

Estándares de ontologías para web semántica............................24

1.4 SERVICIOS WEB......................................................25

1.4.1 ARQUITECTURA DE LOS SERVIVCIOS WEB.............................26

CAPITULO II............................................................29

MARCO DE ANÁLISIS DEL MANEJO DE LA INFORMACIÓN DE LOS TRABAJOS DE GRADO EN LA UNIVERSIDAD DE CÓRDOBA...........................................29

CAPITULO III...........................................................36

PROPUESTA METODOLÓGICA PARA EL DISEÑO E IMPLEMENTACIÓN DE SERVICIOS WEB SEMÁNTICOS DE INFORMACIÓN DE TRABAJOS DE GRADO, BASADO EN MODELOS DE DATOS SEMÁNTICOS, APLICADOS A SERVICIOS WEB, YA EXISTENTES.............36

2.1 METODOLOGIA........................................................36

2.2 APLICACIÓN DE LA METODOLOGÍA EN LA UNIVERSIDAD DE CÓRDOBA..........38

Fase I...................................................................38Fase II..................................................................39Fase III.................................................................40Fase IV..................................................................44

CAPITULO IV............................................................46

MODELADO SEMANTICO ONTOLOGIA TEWEB.....................................46

INTRODUCCIÓN...........................................................463.1 ABORDAR LA PROBLEMÁTICA DESDE UN PLANO ONTOLÓGICO.........................47CONSIDERACIONES.........................................................483.2ARQUITECTURA DE LA ONTOLOGÍA...........................................493.3 PRUEBAS Y HERRAMIENTAS AUXILIARES PARA DESARROLLO Y CONSTRUCCIÓN DE LA ONTOLOGÍA.....................................................................52

8

METODOLOGÌA..........................................................55DISCUSIÓNES..........................................................56CONCLUSIONES.........................................................57RECOMENDACIONES......................................................58

BIBLIOGRAFIA...........................................................59

TABLA DE

9

Ilustración 1: Ejemplo de Servicios Web.........................13

Ilustración 2: Arquitectura Orientada a Servicios...............14

Ilustración 3: Arquitectura de Capas en Servicios Web...........14

Ilustración 4: Web actual vs Web Semántica......................15

Ilustración 5: Arquitectura de la Web Semántica.................16

Ilustración 6: Tecnologías Involucradas en el Desarrollo de los Servicios Web...................................................23

Ilustración 7: Metodología para la creación de Servicios Web Semánticos......................................................42

10

LISTA DE TABLASTABLA 1 ATRIBUTOS DE DUBLINCORE........................................22

TABLA 2 PROCESOS DE GESTIÓN DE TRABAJOS DE GRADO.......................36

TABLA 3: SERVICIOS DE LOGUEO...........................................42

TABLA 4: SERVICIO DE GESTIÓN DE USUARIOS...............................43

TABLA 5: SERVICIO DE GESTIÓN DE DOCUMENTO..............................44

TABLA 6: SERVICIO DE BÚSQUEDA DE DOCUMENTOS............................45

TABLA 7: SERVICIO DE PRÉSTAMO..........................................46

11

LISTA DE ANEXOS

ANEXO AREQUISITOS FUNCIONALES DEL SISTEMA

ANEXO BMANUAL DEL USUARIO

12

RESUMEN DEL PROYECTO

En este trabajo de grado se busca un reconocimiento hacia lasnuevas tecnologías, lo que se podría decir que es la siguienterevolución de la web, en este caso se trabaja con lo que son losservicios web y la web semántica.

Entendiéndose por servicios web aquel sistema software que escapaz de permitir que dos o más máquinas puedan interactuar entresí a través de una red, esto permitiendo que exista unacomunicación entre aplicaciones por medio de la web.

La web semántica se puede definir como la web del mañana, cuyoobjetivo principal es llevar la web hasta el punto de que sea unsistema manejado por software, es decir las tareas de los humanossean realizadas por software o aplicaciones. Con la web semánticase busca hacer un mejor uso de la web y que agentes software, nosfaciliten las búsquedas en la web, ya que contaremos conespecificaciones más claras de lo que queremos.

13

En este trabajo se proponen servicios web semánticos que seancapaces de manejar la información contenida en los trabajos degrado de la Universidad de Córdoba. El principal motivo de estetrabajo es mejorar el acceso y búsqueda que se tiene a lainformación de los trabajos de grado a través de la web, haciendomenos compleja las búsquedas de información de éstas y más fácilel manejo de la información contenida.

Para esta propuesta se plantea inicialmente un estudio sobre elmanejo de esta información en la institución, de acuerdo a losresultados obtenidos, se evidencia la necesidad de acudir a unsistema que nos facilite esta información, y finalmente seutilizaran los servicios web semánticos para hacer menos complejoel manejo de esta información.

ABSTRACT

This paper seeks recognition to new technologies, which could besaid to be the next revolution of the web, in this case we willwork with what are Web services and the semantic web.

Provided by web services software system that is capable ofallowing two or more machines to interact with each other througha network, this enabling a communication between applications viathe web.

The Semantic Web can be defined as the web of tomorrow, whose mainobjective is to bring the web to the point that it is a softwaredriven system, ie human tasks are performed by software orapplications. With the Semantic Web seeks to make better use ofweb and software agents, we facilitate web searches, as we willhave clear specifications of what we want.

This paper proposes semantic web services that are capable ofhandling the information contained in the work of a degree fromthe University of Córdoba. The main aim of this study is toimprove access and search that information has to grade the work

14

through the web, making it less complex searches for informationon these and easier handling of the information.

For this proposal raises an initial study on the management ofthis information in the institution, according to the resultsobtained show the need to resort to a system that you provide thisinformation, we used semantic web services to less complex themanagement of this information

PALABRAS CLAVES

Servicios web, web semántica, servicios web semánticos,DublinCore, ontología, Trabajos de grado.

KEY WORKS

Web services, semantic web, semantic web services,Dublin Core,Ontology, Grade Papers.

OBJETIVOS

General:

Diseñar e implementar Servicios Web Semánticos basados en ontologías y metadatos para el manejo de la información de los trabajos de investigación, en particular Trabajos de Grado, en la Universidad de Córdoba.

Específicos:

Definir una propuesta metodológica para el diseño eimplementación de Servicios Web Semánticos de información detrabajos de grado, basado en modelos de datos semánticos,aplicados a Servicios Web, ya existentes.

15

Realizar un marco de análisis que evidencie los principalesproblemas, que puedan ser abordados desde el enfoque de losServicios Web Semánticos, de la gestión de información detrabajos de grado en la Universidad de Córdoba.

Diseñar e implementar Servicios Web Semánticos basados enOWL-S encargados de los procesos de búsqueda (por tema,subtemas, autores, títulos, etc.), de acceso a objetos(obtención de documentos, obtención de autores, obtención debibliografía, obtención de citas, etc.), de administración yregistro (registrar, loguear, ingresar nuevos documentos,actualizar, etc.), empleando una arquitectura orientada aservicios SOA, como solución a los problemas de la gestión dela información de los Trabajos de Grado en la Universidad deCórdoba.

INTRODUCCIÓN

Actualmente en la Universidad de Córdoba, el manejo de lainformación de los trabajos de grado, se realiza de forma manual,solo desde el 2003 estás son exigidas por los departamentos enformato digital, quedando este material únicamente en losdepartamentos y en la biblioteca MISAEL DIAZ URZOLA, sin ningunaconexión a la red o medio de acceso a través de la web, lo cualgenera una descentralización de la información, y dificulta laobtención de resultados óptimos a la hora de realizar una consultasobre un tema específico.

El material impreso es alojado en el edificio de la biblioteca, enel segundo piso, y son organizados por los siguientes criterios:programas y año de publicación, sin tomar en cuenta temasespecíficos como población, autores, resultados y línea deinvestigación. Esto genera que la organización y consultasmanuales sean engorrosas y demoradas.

Un panorama de la problemática que esto representa se muestra acontinuación:

16

La Universidad de Córdoba hoy por hoy cuenta con un sistema debúsqueda manual para la consulta de trabajos de grado. Empleandosolo la revisión manual, la lectura detallada, entre otrosmétodos, notándose así, que el proceso para la consulta deinformación puede ser demorada y poco eficiente, incluso ineficaz.Dicho motivo puede ocasionar que los estudiantes se abstengan deacudir a búsquedas de este tipo de información y prefieran métodosmás agiles como las consultas a través de la web. En laUniversidad de Córdoba sólo se realizan un promedio de 53.2consultas por mes (este dato se toma de un bitácora interna que semaneja en la universidad), mientras que el número de consultasrealizados a la web es por mucho superior a esta cifra (según unaencuesta realizada a estudiantes de la universidad y personalallegado).

El desconocimiento de la ubicación física por parte de más del 30%de los estudiantes de la Universidad y muchas personas novinculadas a ella, genera que dichos trabajos de investigación seconviertan en una opción poco viable para la realización deconsultas.

Con el fin de idear una solución a la problemática planteada serealizó una investigación para buscar la herramienta más eficientepara el manejo de la información de los trabajos de grado. Debidoa la necesidad de poner dicha información en dominio público, esnecesario implementar herramientas que sean capaces de enlazar lainformación al resto del mundo mediante la web. Para tal fin seimplementaran servicios web que desarrollen dichas funciones, yacoplados a la web semántica para brindar conectividad ydescripción a dicha información, implementando herramientas deprimera línea y popularizarlas en la región.

A nivel internacional los Servicios Web Semánticos cuentan congran reconocimiento debido a la innovación que estos representan,uno de los grandes proyectos que tienen como finalidad losServicios Web Semánticos es el AdaptiveServicesGrid[ASG, 2004] elcual comenzó en el 2004 con el apoyo de 22 socios de seis países

17

europeos y Australia y tiene por objetivo desarrollar un prototipode plataforma abierta para la innovación, creación, composición ylanzamiento de servicios.

Otro proyecto relacionado con este tema es:TheEuropeanLearningGridInfraestructure [ELeGI, 2004]: Es una redsemántica para el aprendizaje humano para la puesta en marcha deescenarios futuros de aprendizaje basado en la ubicuidad y lacolaboración, y centrados en la experiencia y el aprendizajecontextualizado a través del diseño, implementación y validacióndel aprendizaje en red.

Se hace mención a un proyecto muy ambicioso con relación a losServicios Web Semánticos; esté es el proyecto GODO que ha sidofinanciado por el MITYC1 dentro del Plan Nacional de InvestigaciónCientífica Desarrollo e innovación Tecnológica 2008-2011 y elFondo de Desarrollo regional FEDER (España). Este proyectopretende desarrollar una infraestructura semántica que se basa enuna práctica de técnicas de análisis de lenguaje natural yontologías, de tal forma que se le pueda brindar al usuario unacapa de presentación sencilla para definir sus objetivos debúsqueda y descubrimiento de Servicios Web Semánticos.

En el ámbito nacional se cuenta con proyectos que en su mayoríason liderados por la Universidad Autónoma de Bucaramanga quien anivel internacional cuenta con un gran apoyo, se puede mencionarpor ejemplo; la tesis de maestría “ESTUDIO APLICANDO ONTOLOGÍAOWL-S PARA EL DESARROLLO DE SERVICIOS WEB SEMÁNTICOS”Colombia,2007, autores: Carlos Humberto Clavijo, Wilson Pinto Romero.Tenemos la tesis de maestría “Análisis comparativo de lenguajespara el desarrollo de Servicios Web Semánticos de informaciónfinanciera” Colombia, 2007, autores: Álvaro Valencia, Carlos MarioSarmiento, Universidad Autónoma de Bucaramanga.

1 MITYC Ministerio De Industria Y Comercio Español.18

En el entorno regional no se cuenta con datos relacionados al temaesto debido a que corresponde a un proceso relativamente nuevopara el mercado Colombiano.

Para el desarrollo de este trabajo, inicialmente se realizó unestudio previo tanto a estudiantes, profesores y personal ajeno ala Universidad de Córdoba, esto con el fin de identificar cuál erasu interés y conocimiento acerca del manejo de este tipo deinformación. Este trabajo está contemplado en una primera etapade preparación con un enfoque descriptivo y en una segunda etapade aplicación con un enfoque tecnológico aplicado.

En este documento se muestran las bases teóricas y tecnológicas delos Servicios Web Semánticos, se realizara un estudio con el finde evidenciar las falencias que se presentan con el manejo de lainformación concerniente a los trabajos de grado en la Universidadde Córdoba y que permitan ser abordados a través de tecnologíasSWS2. Para esto se hará uso de la investigación descriptiva, porconsiderarse la más óptima para el desarrollo de esta primeraetapa.

Finalmente el desarrollo de esta investigación tecnológicaaplicada se ve reflejado en el diseño e implementación deServicios Web Semánticos, que da solución a la problemáticaplanteada, en el área del manejo de la información de los trabajosde grado.

CAPITULO I

FUNDAMENTOS TEORICOS Y TECNOLOGICOS DE LOS SERVICIOS WEBSEMÁNTICOS

1.1 Marco Conceptual

2 SWS Servicios Web Semánticos19

La definición de los Servicios Web Semánticos, está sustentadaprincipalmente en el marco de referencia que entregan 2 conceptosy sus derivados: “Servicios Web” y “Web Semántica”.

1.2 Servicios Web:

La web no es solo una red informativa, es también un espacio deiteración, en el cual las aplicaciones toman fuerza, aquí surgenlos servicios web, web de aplicaciones.

““Un servicio de Web es un sistema de software diseñado para soportar la interacciónentre dos máquinas a través de una red. Posee una interfaz descrita en un formato quepuede ser procesado por una máquina (específicamente WSDL). Otros sistemas puedeninteractuar con el Servicio Web en la manera prescrita por su descripción utilizandomensajes SOAP, típicamente transportados utilizando HTTP y serializados con XML, enconjunción con otros estándares relacionados con la Web””[W3C, 2004]

Los servicios web son independiente a la plataforma de hardware ysoftware sobre la que esta implementado y deben ser capaces deinteractuar entre ellos.

Los servicios web pueden ser:

• Descritos mediante un lenguaje de descripción de servicio, comoel lenguaje WSDL (Web ServiceDescriptionLanguage)

• Publicados al someter las descripciones y políticas de uso enalgún registro bien conocido, utilizando el método de registroUDDI (Universal Description, Discovery and Integration) u otrométodo.

• Encontrados al enviar peticiones al registro y recibir detallesde enlace (binding) del servicio que se ajusta a los parámetros dela búsqueda.

• Asociados al utilizar la información contenida en la descripcióndel servicio para crear una instancia de servicio disponible oproxy.

20

• Invocados sobre la red de forma local o remota al utilizar lainformación contenida en la descripción del servicio o detalles deservicebinding (vinculación).

• Compuestos con otros servicios para integrar servicios yaplicaciones nuevas.

Ilustración 1: Ejemplo de Servicios Web

Fuente:http://www.w3c.es/divulgacion/guiasbreves/images/serviciosWeb1.png

1.2.1 Arquitectura De Los Servicios Web

Los principales aportes a los servicios web han sido realizadospor el Web ServicesArchitectureWorkingGroup de la W3C, en loscuales hacen referencia a los componentes funcionales y ademásforma la relación que existe entre ellos, para así conseguir laspropiedades de una arquitectura en forma general.

Si examinamos los componentes de un servicio web podemos encontrarlos siguientes elementos:

Servicio: Se ofrece la aplicación para que esta pueda serutilizada por aquellos solicitantes que cumplan los requisitosespecificados por el prestador de servicios. Se realiza la puestaen marcha del servicio por medio de una plataforma accesible en lared. El servicio es descrito por medio de un lenguaje dedescripción de servicio. Entonces tenemos que tanto la descripción

21

como las políticas ya han sido divulgadas con anterioridad en unregistro.

Proveedor de Servicio: Cuando hablamos de proveedor de servicio enla arquitectura de un servicio web hacemos referencia a laplataforma que provee el servicio.

Registro de Servicios: Es un archivador donde encontraremos lasdescripciones de servicios que también podremos consultar, aquí esdonde proveedores de servicios publican sus servicios y lossolicitantes encuentran los servicios y detalles para utilizardichos servicios.

Solicitante de servicios: Aplicando el término de arquitectura deservicio web el solicitante de servicios se refiere a laaplicación o cliente que busca e invoca un servicio.

Ilustración 1: Arquitectura Orientada a Servicios

Fuente:Web Services Architecture W3C Working Group Note 11 February 2004. Disponible en http://www.w3.org/TR/ws-arch/

Otra manera de mirar la arquitectura de los servicios web seriaexaminando los protocolos, los cuales todavía se encuentran en

22

evolución pero hasta el momento cuenta con cinco capasprincipales.

Ilustración 1: Arquitectura de Capas en Servicios Web

Fuente: Myerson Judith M., “IBM Advancing the Web Services Stack” http://www-106.ibm.com/developerworks/webservices/library/wswsa/?open&l=484,t=gr, 2002.

1.3 Web Semántica

En la actualidad el tamaño de la web, incluyendo la web profunda(bases de datos e información a la que se accede a través depáginas web, se estima mucho mayor que el de la informaciónimpresa, y el de la web superficial, solo contenido html, superioral contenido en cualquier biblioteca existente, de ahí proviene eléxito de la web, su tamaño descomunal, y es tanto que se cree queen la actualidad casi todo tiene su representación en ésta.

Procesos sencillos se convierten en unos verdaderos dolores decabeza. El uso de motores de búsqueda como: Google, Bind, Yahoo,facilitan el trabajo pero tiene sus limitaciones, la informaciónobtenida no necesariamente es la buscada, o no de la forma en laque se buscaba. Esto es porque la mayoría de los sistemasinformáticos de la actualidad no son capaces de interpretar elcontenido inmerso en la web y los algoritmos implementados para

23

tal fin no se basan en lógica de conceptos o significados sino enlógica de contenidos y comparaciones.

La web semántica es un concepto, apoyado por la W3C, que buscaintegrar a la web normal procesos ontológicos y semánticos paraayudar a la interpretación de la misma por parte de sistemasinformáticos.

“La Web Semántica es una extensión de la Web actual, dotada de mayor significado en laque cualquier usuario en Internet podrá encontrar respuestas a sus preguntas de formamás rápida y sencilla gracias a una información mejor definida” [José A. 2005]

Ilustración 1: Web actual vs Web Semántica

Fuente:http://sociedadinformacion.fundacion.telefonica.com/img/elementos/articulos/upload/148-img-01_e.jpg

1.3.1 Arquitectura De La Web Semántica

Las bases de la web semántica son consideradas como iniciativastecnológicas, donde las maquinas son capaces de apropiarse decualquier tipo de información e interpretarla como si ellastuviesen inteligencia. La web semántica es una web que poseemucha información que además está en la capacidad de relacionarrecursos e integrar diferentes servicios, para dar solución a

24

problemas como las búsquedas en internet las cuales son un pocotediosas. Aquí es donde la web semántica juega un papel importanteya que con la implementación de ésta se proyecta una web capaz deinterpretar el significado estructurado de la información y ademásrelacionar varios recursos de la web para que los resultadosobtenidos sean eficientes.

La web semántica según Tim Berners- Lee en 2001, maneja suinfraestructura de tecnologías y lenguajes necesarios en sietecapas o niveles como vemos en la imagen.

Ilustración 1: Arquitectura de la Web Semántica

Fuente: http://www.w3.org/2000/Talks/1206-xml2k-tbl/slide11-0.html

A continuación se describen cada una de las capas de laarquitectura, basados en la ilustración anterior.

Unicode: Este es un estándar el cual permite que el texto seacodificado para que sea utilizado en cualquier forma e idiomautilizando caracteres y alfabetos internacionales con la certezaque al momento de obtener la información no aparezcan símbolosextraños.

URI (UniformResourseIdentifier): Es el Identificador Uniforme deRecursos que consiste en cadenas que permiten acceder a cualquierrecurso de la Web como un URL (descripción de la ubicación).Consta de la URL más la URN (descripción del espacio de nombre).

25

Cuando dos objetos cuentan con la misma URI pueden existircolisiones pero el grupo de trabajo del W3C está intentandoresolver este problema.

XML+NS+XML Schema: Esta capa agrupa las diferentes tecnologías quehacen posible que exista una comunicación entre los distintosagentes, a esta capa también se la conoce como la capa más técnicade la web semántica. XML nos brinda un formato común para elintercambio de documentos, Namespaces (NS) ofrece un método paracualificar elementos y atributos de nombres usados en documentosXML asociándolos con espacios de nombres identificados porreferencias URIs. XML Schema es un lenguaje que permite describirla estructura y restringir el contenido de documentos XML.

RDF+RDF Schema: Esta capa se basa en la capa anterior, en ella sedefine el lenguaje universal con el que podemos expresardiferentes ideas en la Web Semántica. Con ellos es posible hacerdeclaraciones sobre objetos con URIs y definir los vocabulariosque pueden ser referenciados por una URI. Ésta es la capa dondepodemos definir tipos a los recursos y los enlaces.

Logic (lógica): Además de ontologías se precisan reglas deinferencia.

Proof (Pruebas): Se realizan intercambios de pruebas escritas enel lenguaje unificador de la web Semántica.

Trust (Confianza): Mientras no se esté totalmente seguro de lasfuentes de información, los agentes deberán ser muy prevenidosacerca de lo que leen en la web semántica.

Digital Signature (Firma digital): Utilizada por los ordenadores yagentes para verificar que la información ha sido ofrecida por unafuente fidedigna.

1.3.2 METADATOS

26

Un adecuado uso del manejo de la información en la www, dependebásicamente de una gestión normalizada de estructuras deorganización de la misma a esto se le llama metadatos. Losmetadatos son utilizados para dar una descripción ocaracterización de los documentos manejados en la www.

Los metadatos son descripciones estructuradas de informacióncontenida en documentos electrónicos que ayudan a localizarinformación de una manera ágil en la www.

El estándar de metadatos DublinCore fue elaborado y auxiliado porDMCI (DublinCoreMetadataInitiative) consiste en un sencillo pero asu vez muy eficaz serie de elementos que se encuentra compuestopor quince propiedades y además es utilizado para la descripciónde una amplia variedad de recursos de red. En otras palabras esteestándar provee un simple y estandarizado grupo de convencionesque son utilizadas para la descripción de objetos en línea demodo tal que sean más fácil de encontrar.

DublinCore en sus implementaciones usa XML y está basado en elResourceDescription Framework, por otra parte este estándar estádefinido por la ISO en su norma ISO 15836 del año 2003, y la normaNISO Z39.85-2007.Los quince elementos que hacen parte de DublinCorefueron dados aconocer desde el año 1998, estos elementos van por una vía denormalización y aplicación de prácticas para la web semántica. Suevolución lleva consigo la inclusión de asignaciones de dominios yrangos formales, también definición en lenguajes naturales.

Las quince propiedades que conforman el estándar DublinCore estánrepresentados en la siguiente tabla.

Tabla 1: Atributos de DublinCoreNo. NOMBRE DESCRIPCIÓN1 Contribuyent

eLlamamos así al ente responsable de algunacontribución significativa en la creación dealgún documento o recurso, bien puede ser;editor, traductor, ilustrador, etc.

2 Cobertura Contemplamos aquí Las característicasrelacionadas con tiempo y espacio del recurso

27

No. NOMBRE DESCRIPCIÓNo material. Se refiere A una región física, al lugar donde seránaplicados los recursos.

3 Creador Refiriéndose aquí a la entidad principal lacual es responsable de la construcción delrecurso. Ejemplo, los artistas, fotógrafos,etc.

4 Fecha Hace énfasis al periodo de tiempo de creacióno disponibilidad del recurso. Determinandoaquí la fecha de publicación o de disposiciónal público se utiliza el formato del ConsorcioWeb, Data and Time Format<http://www.w3.org/TR/NOTE-datetime> basado en la norma ISO 8601

5 Descripción Corresponde a una breve descripción textualdel contenido del material o recurso,incluyendo resúmenes en el caso de documentoscomo objetos, o descripciones de contenido encaso de recursos que son visuales.

6 Formato Formato de datos del documento, es utilizado parala identificación del software y muy posiblementees también el hardware que se necesita paramostrarlo.

7 Identificador

Hablamos de una serie de signos o númerosempleados para realizar la identificación delrecurso de forma unívoca.

8 Lenguaje Hace relación al idioma del contenidointelectual del recurso. El contenido de estecampo debe coincidir con la norma ISO 639.

9 Editorial oEditor

Organización responsable de la publicación delrecurso.

10 Relación Asocia recursos, es decir consiste en unidentificador de un material secundario y larelación que existe entre este y el materialprincipal.

11 Derechos Tiene que ver con el derecho de autor, esdecir los derechos que corresponden al titulardel recurso.

12 Origen Se describe el origen o fuente de la cual

28

No. NOMBRE DESCRIPCIÓNproviene el recurso.

13 Asunto Tema relacionado al recurso.14 Titulo Nombre del recurso. Generalmente es dado por

el creador. 15 Tipo Clase del recurso refiriéndose a su naturaleza

o género.1.3.3 ONTOLOGÍAS

Las ontologías para la web semántica son un eje fundamental ya queayudan a la representación del conocimiento, estas facilitan elintercambio y rehusó del conocimiento.

Las ontologías segúnGruber T. (2001) se crearon con la finalidadde representar de manera formal y consensuada especificaciones deconceptos que proveen un conocimiento compartido y común deldominio, como información semántica procesable por las máquinas einteroperable a través de agentes (organizaciones, individuos ysoftware). Las ontologías están definidas en formatos RDF.

1.3.3.1 Componentes de una Ontología

Las bases de las ontologías según Gruber Tom. R. que ayudan a larepresentación del conocimiento en un dominio están dadas por:

Conceptos: Elementos básicos de las tareas del dominio, quepor lo general se organizan en taxonomías. Los conceptos seconsideran como ideas básicas que se intentan formalizar ypueden ser: métodos, planes, clases de objetos, estrategias.

Instancias:Son elementos específicos de los conceptos quecontienen elementos o datos que describen un concepto y seutilizan para representar objetos determinados de unconcepto.

Relaciones: Expresan la interacción y enlace entre losconceptos del dominio. Es decir las relaciones que establecen

29

el tipo de interacción semántica entre los conceptos. Porejemplo: subclase-de, parte-de, conectado-a.

Funciones:Métodos que pueden ser invocados en la instanciaespecífica de un concepto, donde se identifica un elementomediante el cálculo de una función que considera varioselementos de la ontología. Por ejemplo, funciones como:categorizar-clase, asignar fecha.

Axiomas:Sentencias del modelo que son siempre ciertas.También se conoce como hechos o teoremas que se declaransobre relaciones que deben cumplir los elementos de laontología es decir los elementos que permiten hacerinferencias que no están explícitas en la taxonomía deconceptos. Por ejemplo: “Si A y B son de la clase C, entonces A no essubclase de B”, “Para todo A que cumpla la condición C1, A es B”.

Así podemos decir que la base de la web semántica se fundamenta enlas ontologías ya que por medio de ellas se pueden definir teoríassobre dominios compartidos y comunes, también permite que lacomunicación que existe entre máquina y persona sea eficaz.

1.3.3.2 RDF (RESOURCE DESCRIPTION FRAMEWORK) Y RDF Schema

Desarrollado por el World Wide Consortium (W3C) en1997, recomendado desde el 10 de febrero de 2004, se entiendecomo el lenguaje que permite la representación de metadatos.

Consiste en un esquema basado en sentencias de triple valor, endonde un sujeto es unido a un predicado a través de una acción opropiedad, podemos verlos como la representación de nodos ovértices (Sujetos, predicados), relacionados entre sí por medio dearcos o aristas (acciones o propiedades).

RDF, valiéndose de XML, plantea o describe la información de lainformación de los contenidos web (metadatos), a fin que seancomprensibles para un ordenador, teniendo por objetivo establecerverdadera semántica a través de ontologías dentro de la web.

30

Por ejemplo, mediante RDF podemos definir a “Antonio Vargas” comoun “Escritor”, a “Stephany Suarez” como una “Editora” y a“Semantic Web Service” como un “Libro”. Esto se podría definircomo: “Antonio Vargas, autor de Semantic Web Service, Libroeditado por Stephany Suarez”, y así lo entendería un ordenador.

“RDF SCHEMA es una extensión Semántica de RDF que consiste en unlenguaje primitivo de ontologías que proporciona loselementos básicos para la descripción devocabularios”[Wikipedia, 2008].

RDF Schema brinda además de las relaciones binarias, unajerarquización de sus representaciones o clases, permitiendo eluso de restricciones basadas en rango y dominio, lo cual le da unaaproximación más cercana a ontología que la vista en RDF, dándolela capacidad de realizar operaciones sobre el contenido de unconocimiento más que sobre su estructura en sí.

1.3.3.3 OWL (Web OntologyLanguage)

Este lenguaje está provisto de una gran capacidad expresiva, porlo cual se convierte en un estándar para la realización deanotaciones de ontologías en la web. Este lenguaje fuedesarrollado por la w3c, OWL está diseñado específicamente parala creación de ontologías en la web.

Este lenguaje está provisto por un mecanismo que se encuentra enla capacidad de desarrollar vocablos específicos que asociando losrecursos son capaces de proporcionar un lenguaje para poderestablecer ontologías estructuradas que podrán ser utilizadas pordiferentes sistemas.

1.3.3.4 XOL (XML-BASED ONTOLOGY EXCHANGE LANGUAGE)

Es un lenguaje fundamentado en clases y atributos, elemento que leresta potencial, está basado en OKBC. Permite el intercambio de

31

ontologías entre bases de datos, aplicaciones con implementacionesontológicas, contenidos establecidos es ontologías, etc.

1.3.3.5 XML, DTD y XML Schema

XML (Extensible MarkupLanguage) es un metalenguaje desarrolladopor la W3C, a través de su grupo de trabajo XML, e instituidodesde la versión 1.1 como recomendación, desde sus inicios en elaño 1998 , ha sufrido multitud de modificaciones a fin deestandarizarse en campos determinados o áreas específicas; RIXML,FpXML, ebXML en áreas financieras, XMLNews y NewsML parainformación periodística, SCORM, IEEE LOM en la educación son soloalgunos ejemplos de los muchos campos desde los que ha sidoabordada. Actualmente e-business no escatima esfuerzos en pro demejorar sus servicios, pues es visto como el pilar fundamentalpara la web semántica.

DTD (DocumentTypeDefinition) se puede ver cómo el diccionario oglosario de términos establecidos en un documento XML especificoel cual se encarga de validar el la sintaxis.

XML Schema define la estructura en que se será representado eldocumento, a fin de brindarle más dinamismo al documento XML.

XML es desarrollado luego de un exhaustivo estudio realizado aSGLM, “XML utiliza la misma notación genérica de marcado,pero evita las irregularidades detectadas en SGML. Los elementosdeben tener siempre marca de terminación (<x>...</x>) y estarbien anidados. Los elementos sin contenido se puedenrepresentar de manera abreviada (<z/>). Se introducen lasllamadas instrucciones de procesamiento: (<?....?>), y se mantienela referencia al tipo de documento mediante (<!DOCTYPE ...>”)”

Estándares de ontologías para web semántica

32

En la actualidad se manejan una gran variedad de estándares deontologías, la realización de un proyecto satisfactorio de websemántica tiene como punto crítico la elección de una ontologíacorrecta para el proyecto a realizar. La ontología escogida debeequiparar todos los requerimientos del proyecto.

Algunos de estos estándares son:

SIOS Semantically-Interlinked Online Communities Project estetipo de estructura de ontología expresa la información que seencuentra contenida bien sea explicita e implícitamente endiscusión de métodos en Internet, como blogs, foros o listas decorreo.

FOAFTheFriend of a Friendontology (Amigo de un amigo) estaestructura describe individualmente sus actividades y susrelaciones con otras personas y objetos. FOAF permite ladescripción de redes sociales en una distribución de moda.

DOAPDescription Of A Project (Descripción de un proyecto) es unaontología para describir proyectos open source.

ResumeRDFEsta ontología expresa un resumen o currículum vitae(CV) incluyendo información del trabajo, experiencia académica ohabilidades.

1.4 SERVICIOS WEB

A pesar de sus funcionalidades, los servicios web tienen, o mejor,carecen de un agregado fundamental, mecanismos que permitan accesoautomatizado de estos.

Para un humano es fácil interpretar la función de un servicio web,basándose en los datos que recibe y los que arroja, pero para unsistemas informático la tarea se complica, no sabría diferenciarentre un servicio que recibe un libro para su búsqueda a uno que

33

recibe un libro para su compra o que busque cualquier otroartículo, automóviles celulares, etc.

La solución es simple, implementar anotaciones ontológicas quedescriban, en lenguaje que sea interpretado por sistemas decómputo y por humanos, a los servicios web, de aquí surgen losservicios web semánticos.

Los servicios web semánticos están constituidos por servicios webordinarios con un agregado semántico que brinda descripcionessobre el mismo. La semántica se encarga de asociar conceptosontológicos sobre las operaciones y funciones de un servicio web,para así brindarle propiedades descriptivas y de interpretación.

Existen varias tecnologías relacionadas con el pasar de sw a sws acontinuación se muestran algunas de ellas:

34

Ilustración 1: Tecnologías Involucradas en el Desarrollo de los Servicios Web

Fuente: ONTOLOGÍAS PARA SERVICIOS WEB SEMÁNTICOS DE INFORMACIÓN DE TRÁFICO: DESCRIPCIÓN Y HERRAMIENTAS DEEXPLOTACIÓN (JOSÉ JAVIER SAMPER ZAPATER- universidad de valencia 2005 pag.91

1.4.1 ARQUITECTURA DE LOS SERVIVCIOS WEB

A partir de los esfuerzos del W3C a través de su grupo SemanticWeb ServicesInterestGroup se han propuesto una serie decaracterizas estándares con el fin de permitir a sistemas decómputo como entes inteligentes buscar, encontrar, llamar,

35

utilizar, reutilizar y componer a los SWS. Las característicaspueden ser vistas así:

- Acceso o comunicación: Dice el protocolo de comunicaciónempleado para el llamado del servicio, SOAP o HTTP por ejemplo.

- Descriptivas: Define las propiedades de interés de un swsespecifico, mostrándonos por ejemplo su ubicación geográfica,proveedor, clasificación comercial, etc. Esto es lo que se conocecomo dominio en el cual se desarrolla un sws, o en el cual opera,es de suma importancia a la hora de la buscar y clasificar lossws, pues se pueden descartar fácilmente los servicios que operanen un dominio distinto.

- Funcionales: Muestra la funcionalidad de un sws desde supropósito operacional, diciendo por ejemplo sus datos entrada,datos de salida, efectos, condiciones de pre y post ejecución,etc. Esto permite al sistema que realiza la llama descartar lossws que operan sobre su dominio de interés pero que no estándentro de la funcionalidad necesaria.

- Estructurales: Nos muestra la estructura interna de un sws,como está compuesto, la sinergia entre sus componentes, lainteracción de los mismos para lograr la ejecución del sws. Estoayuda a los sistemas establecer nuevos servicios a través de lasinterrelaciones de subservicios que a nivel estructural permitanla compatibilidad de tal interoperabilidad.

Para poder hacer uso de un servicio Web, un agentesoftware necesita una descripción del servicio que seainterpretable por un computador, y el medio por el cual esaccedido. El uso de DAML+OIL o posteriormente OWLproporciona el marco de trabajo apropiado para poderdesarrollar esto. A continuación se describirá este tipo deontologías basándonos en la especificación en el SWS

36

Un servicio descrito con DAML-S permite a un agente de softwarelocalizar, invocar, interoperar y monitorizar dicho servicio.DAML-S proporciona respuesta a las principales preguntas que cabeplantearse a la hora de describir un servicio Web:

• ¿Qué es lo que el servicio requiere de los usuarios,u otros agentes y que les proporciona?

• ¿Cómo funciona el servicio?

• ¿Cómo se puede utilizar el servicio?

Atendiendo a estas cuestiones anteriormente planteadas se hacenecesario el desarrollo de una ontología de orden superiorde servicios en la que aparecen determinados conceptos queintentan responder a estas preguntas.

La ontología de servicios fue estructurada considerando lasfuncionalidades arriba descritas. Esto dio lugar a tressubontologías reunidas en una cuarta que sirve paraidentificar el servicio como un concepto Service y que permiterelacionar los tres tipos de conocimientos del servicio descritospor las otras tres.

La clase Service es el punto de referencia para poder anunciar unservicio Web. Esta clase Service tienen tres propiedadespresents, describedby, supports donde los rangos de estaspropiedades son las tres clases asociadas para representar cadaparte de un servicio: ServiceProfile, ServiceModel,ServiceGrounding respectivamente. Cada vez que queramos anunciarun servicio, deberemos de instanciar cada una de estas clases.

• La clase Service es presentada (presents) por ServiceProfile,que nos sirve para definir qué es lo que el servicio necesita delusuario o agente.

• La clase Service es descrita (describedby) porServiceModel, en el que explica cómo trabaja el servicio (cómo

37

debe usar los inputs, el flujo de datos en un servicio compuestoetc.).

• La clase Service es soportada (supports) porServiceGrounding, nos indica cómo debe ser invocado el servicio.

CAPITULO

38

Los trabajos de grado, son el resultado de un largo proceso deinvestigación, realizado por parte de un estudiante u otrapersona, quien es el encargado de profundizar en un temaespecífico o en un área de estudio, él o los estudiantesencargados de realizar esta investigación demostraran un dominiode la metodología científica que se ajuste a la problemática de lainvestigación. La realización de un trabajo de grado conlleva unagran responsabilidad puesto que en determinado momento losresultados arrojados por esta investigación podrán ser utilizadoscomo base por otros para abordar alguna otra problemática querequiera el uso de la información que se encuentra reflejada enuno de estos trabajos. Es por esta razón que los trabajos de gradoson manejados con mucho cuidado, se hace necesario ejercer uncontrol sobre ellos y además es muy importante conocer la formacomo se debe manejar este tipo de información teniendo en cuentala importancia que estos representan. Su uso por parte de otraspersonas será un poco limitado, es decir, las personas que quierantener acceso a estos deben saber de antemano que estos trabajossolo le pueden servir de guía o referencia, a menos que esténautorizados por las personas que poseen los derechos sobre estos,para apropiarse del todo de la investigación o hacer uso de sucontenido de alguna forma. Podemos decir entonces que los trabajosde grado, son un medio de desarrollo de investigación los cualesuna vez finalizados pueden ser utilizados como libros de consultaspor otras personas, y que todos los derechos sobre su contenidopertenecen a sus desarrolladores y en un caso aparte a lasentidades mediante las cuales se hacen públicas(universidades,institutos, etc.).

En la Universidad de Córdoba, el concepto de los trabajos degrado, no discrepa del concepto general que se tiene sobre estos anivel global. Es por esta razón que su manejo y divulgación, elcual está a cargo de la biblioteca Misael Díaz Urzola, es de muchocuidado y como todo ente responsable la Institución de manera

Marco de análisis del manejo de la información de lostrabajos de grado en la Universidad de Córdoba.

39

autónoma rige el manejo de los trabajos de grado bajo una serie deprocesos, que son definidos internamente pero que van de acuerdoal concepto y a lo que se busca con este tipo de información anivel mundial, estos procesos se dan de la siguiente manera:

1- Proceso de ingreso de la información a la biblioteca:consiste en que cada departamento cuenta con la autonomía dedecidir la forma u estructura que se llevara en el trabajo degrado. Pero debe hacerla llegar a la biblioteca tanto deforma física como virtual (esta última a partir del 2003, sise cuenta con esta).

2- Proceso de almacenamiento de la información: una vez ingresenlos trabajos de grado a la biblioteca, se toman los datos deltrabajo en una bitácora con el fin de llevar un control sobreestos, además de esto, son ubicados de acuerdo a lafacultad, fecha y a los programas que pertenecen, enestantes ubicados en la biblioteca.

3- Proceso de consultas: las búsquedas sobre información detrabajos de grado se hace de forma manual, por medio delprograma u facultad al que pertenece el material de trabajode grado,

4- Proceso de préstamo: Las personas interesadas en estematerial, deben acudir de manera personal a la biblioteca dela Universidad, puesto que solo se puede tener acceso a lostrabajos de grado dentro de la biblioteca, debido a que sonconsiderados como material de consulta interna, no se permitesu préstamo y solo se puede obtener como un máximo la copiade 2 páginas del material.

La Biblioteca de la Universidad de Córdoba, se hace responsabledel material investigativo que se le hace entrega, y si estematerial es requerido con otro fin que no sea el de consulta, esteserá permitido si y solo si cuenta con la autorización de las

40

personas que participaron en el desarrollo de la investigación ydel comité de la biblioteca Misael Díaz Urzola.

En la actualidad a nivel global, se puede encontrar muchostrabajos de grado, al alcance de todos, esto debido al avance dela tecnología (internet), en muchos casos algunas institucionesdan a conocer estos trabajos (reservando sus derechos), por mediode internet. Permitiendo así que personas de todas partes seanconocedoras de las investigaciones realizadas y les sirva de apoyoen investigaciones futuras. No queriendo decir que todos lostrabajos de grado, son de conocimiento público total y que todo elmundo tendrá acceso a ellos. Debido a que esto va a depender delas personas que tienen los derechos sobre ellos.

Haciendo énfasis en la forma como se trata este tema a nivelnacional, se puede decir que el acceso a este tipo de documentoses reservado, debido a que no existe un estándar que controle eluso de los trabajos de grado. En Colombia cada institución esautónoma para decidir de qué forma se manejara esta información,aunque las bases son las mismas que a nivel global, ya que lo quese busca es mantener los derechos y reconocimiento a las personasque se encargan de realizar estas investigaciones.

Se pueden tomar algunos casos específicos; tenemos por ejemplo: Enla biblioteca “FRAY ALBERTO MONTEALEGRE GONZÁLEZ” de laUniversidad de San Buenaventura (sede Bogotá), en la cual, paraque los trabajos de grado lleguen a la biblioteca, deben habercumplido con ciertos requisitos internos que son exigidos segúnsus criterios, estos requisitos son[www.usbbog.edu.co 2011]:

1. Ajustarse a las normas técnicas para la elaboración, redaccióny presentación de los trabajos de grado asumidas por cada facultad(APA, CHICAGO, ICONTEC, otras). Es responsabilidad de cadafacultad y programa académico verificar que el estudiante presentesu trabajo final ajustado a la calidad exigida en todos losaspectos formales de redacción, ortografía, corrección gramaticaly presentación, siguiendo todas las normas del castellano como

41

lengua oficial de Colombia, según el artículo 10 de nuestraConstitución Política.

2. Entregar el texto completo el trabajo de grado con todos susanexos, aprobado por la Facultad, incluyendo el RAE, (resumenanalítico estructurado), según el formato adjunto, en unacuartilla y en un solo archivo, en formato digital, grabado enPDF, sin ninguna restricción, ni códigos secretos, en soporte deDISCO, ya sea de datos o de imágenes, para la consulta de losusuarios.

3. En el mismo disco se deben incluir, aquellos anexos, comoplanos, dibujos, gráficos, software, videos digitalizados,composiciones musicales, archivos de sonido o multimedia, ademásde producciones y creaciones que expresen el conocimientocientífico, literario o artístico desarrollado, en los archivosadecuados, distintos a PDF. El disco debe estar debidamenteidentificado con un rótulo impreso en el cual sea visible elescudo de la Universidad, el título del trabajo, el programa yFacultad a la cual pertenece el estudiante, la ciudad, fecha y losautores del trabajo de grado.

Luego de este proceso, se solicita a los autores de éstos suautorización para que el contenido de esta investigación seareproducido y divulgado públicamente siempre y cuando su fin seaeducativo, científicos y culturales, en bibliotecas digitalesinstitucionales, corporativas y asociadas. Aunque en un caso dadoque el estudiante no desee que su investigación sea publicada estadecisión será respetada y de igual forma se le es exigido undocumento firmado por él donde exprese la decisión que ha tomado.

Tenemos también la Escuela de Ingeniería de Antioquia, con labiblioteca “ALBERTO QUEVEDO DÍAZ” quien de forma parecida a lasexigencias que realiza la Universidad de San Buenaventura para quelos trabajos de grados lleguen a la biblioteca pero difieren almomento de realizar los préstamos, sus criterios son lossiguientes: [www.eia.edu.co 2002]:

42

a. Estudiantes de pregrado, postgrado, egresados, profesores,investigadores y empleados de la EIA: Préstamo por ocho (8) díascalendario y un máximo de dos (2) trabajos de grado. Este préstamopuede ser renovado una vez, por vía telefónica o con lapresentación del material, siempre y cuando no esté reservado porotro usuario o se haya incurrido en una mora en la entrega.

b. Usuarios externos: Este material solo se presta para consultaen sala.

En el instituto politécnico colombiano Jaime Isaza Cadavid lostrabajos de grado cumplen con cierta normatividad como: una vezterminados los trabajos de grado estos deben ser revisados deforma que cumplan con criterios como buena ortografía, buenaredacción y que hayan sido aprobadas por el programacorrespondiente a dicha investigación. Una vez realizado todo esteproceso deberán llegar de forma digital y física a la biblioteca ysolo se podrá tener acceso a estos trabajos dentro de la sala dela biblioteca, serán utilizados como libros de consulta interna.

En la Pontificia Universidad Javeriana los trabajos de grado,deben ser entregados por las facultades a la biblioteca generallos cuales deben llevar dos copias en CD, estos deben estaracompañados de los siguientes documentos [www.javeriana.edu.co2009]:

1. Carta de cesión de los derechos morales debidamente firmada,que autoriza la consulta, la reproducción y publicaciónelectrónica del texto completo del trabajo para la visibilidad delos contenidos en Bases de Datos, Catálogos, Redes y Sistemas deInformación nacionales e internacionales “Open Access”.

2. Formato de la Descripción de la Tesis y/o del Trabajo de Gradodebidamente diligenciado y firmado por los autores.

3. Tesis o trabajo de grado aprobado. Estos han de cumplir lasnormas del programa respectivo en lo referente a:

43

Portada

Carta de presentación del Director o Directora de la Tesis oTrabajo de grado

Tabla de contenido

Cuerpo del texto

Bibliografía

Anexos

La Tesis y/o Trabajo de grado en CD-ROM ha de ser fiel copia deloriginal en impreso: texto, figuras, tablas y anexoscorrespondientes.

4. Todos los documentos anteriores deben venir en un solo archivoen formato PDF (Portable Document File) y un índice con losenlaces a los diferentes ítems del texto, lo cual facilitará laconsulta por parte de los usuarios interesados. La caja y el CD –ROM deben venir debidamente rotulados.

5. La carta de cesión de derechos autor, el formato de descripcióny las tesis laureadas o con mención especial se entregarán a laBiblioteca General en formato impreso además de las dos copias enCD-ROM.

6. La Facultad es responsable de enviar a la Biblioteca Generalperiódicamente y por escrito la relación de cada una de las tesisy/o trabajos de grado presentados por sus graduandos de acuerdocon los procesos establecidos en los puntos anteriores.

7. La Facultad es responsable que el contenido que aparezca en elCD-ROM sea fiel copia de la tesis y/o trabajo de grado aprobado.

Una vez terminado con los requisitos anteriores la bibliotecageneral de la Pontificia Universidad Javeriana, se hace elsiguiente compromiso [www.javeriana.edu.co 2009]:

44

1. La Biblioteca General recibirá las copias en CD-ROM de la tesisy de los trabajos de grado, los catalogará, clasificará eingresará al catálogo BIBLOS en el menor tiempo posible para laconsulta de su contenido en la Sala de Tesis y en Bases de Datos,Catálogos, Redes y Sistemas de Información nacionales einternacionales “Open Access”.

Los contenidos del texto completo de la tesis y/o trabajo de gradoincluidos en el CD-ROM, podrán consultarse en línea a través delcatálogo BIBLOS y de la página Web de la Biblioteca, siempre ycuando el (los) autor (es) haya (n) entregado la carta deautorización (Cesión de derechos del autor) para la consulta ypublicación en la red.

2. La Biblioteca conservará en archivo especial la relación de lastesis y/o trabajos de grado entregados a la Biblioteca por losrespectivos programas académicos, junto con las cartas impresas deautorización debidamente firmadas por el (los) autor (es).

3. La Biblioteca General no se hace responsable por los conceptosemitidos por los autores en las tesis y/o los trabajos.

En el entorno regional se ha realizado un estudio sobre el manejode estos documentos en una de las instituciones másrepresentativas de la región; este estudio arroja como resultadola siguiente información:

En la Universidad Pontificia Bolivariana, luego que cada trabajoes finalizado una copia de este trabajo debe ser entregada porcada programa de forma directa a la biblioteca general de lainstitución. En este proceso cada una de las partes se haceresponsable del uso de este material, debido a que ellos son losencargados de mantener la privacidad de estos documentos, y quefinalmente lleguen a su destino para así poder controlar su usofinal.

45

Al llegar los documentos a la biblioteca de la UPB, de ningunaforma se le es permitido a un consultor sacar la investigación dela sala de biblioteca ya que no está permitido que ningún personalajeno a las personas que manejan los derechos sobre estos trabajosmanipulen de forma libre la información contenida en estosdocumentos, en general solo se le puede facilitar estos documentosal público dentro de la biblioteca de la institución y solo sepermite sacarle fotocopia a 1 o 2 páginas como máximo deldocumento. En caso de que el documento se encuentre de formavirtual se le es facilitado al consultor un equipo donde puedahacer uso de su consulta todo esto dentro de la sección debiblioteca.

Nótese que al no existir una forma general de asignarles algúntipo de identificación a los trabajos de grado, como ISBN, la UPBdecide implementar su propio sistema de identificación de lastesis el cual consiste en asignarle un código a cada tesis;primero cada programa posee un código que lo identifica, luego deacuerdo a las iníciales del nombre y apellidos del autor seagregan el resto de códigos que serán el id de cada tesis, estoquedaría así: Cod-programa+inicialesautor. Esto con el fin detener un método para identificarlas y así mantener un orden ypoder establecer un método de búsqueda preciso y más eficiente.

No obstante al mirar la forma en cómo se es tratado los trabajosde grado en estas instituciones se puede observar que en laUniversidad de Córdoba el sistema con el cual se cuentaactualmente es poco eficiente con todo lo relacionado con estetipo de material algunas fallas en los procesos se detallan acontinuación:

Tabla 2: Procesos de Gestión de trabajos de Grado

Nombre de losprocesos Debilidades en los procesos

Proceso de En la actualidad el ingreso de la información de

46

ingreso deinformación

trabajos de grado, a la biblioteca de launiversidad de córdoba se realiza por parte decada uno de los departamentos de la universidad,esta información se entrega de forma física y enun dicho caso que se encuentre de forma digitaltambién se hace entrega de este material; noobstante la entrega de este material por partede los departamentos es irregular, pues no sonentregadas a tiempo y existe un desorden en elcontrol de esto.

Proceso dealmacenamientode información

El desarrollo de este proceso se realiza de unaforma muy tediosa, debido a, que una vez que elmaterial de trabajos de grado se encuentra en labiblioteca, en esta no se cuenta con un sistemaeficiente capaz de dar orden al almacenamiento ycontrol de esta información, la Universidad deCórdoba a diferencia de las diferentesUniversidades de la región no cuenta con unsistema de identificación de los trabajos degrado, es decir, no se ha implementado un códigoque identifique cada uno de los trabajos degrados.

Proceso deconsultas

Las consultas por parte de los usuarios es unproceso lento, ya que al no existir un sistema umétodo eficiente en la forma en la que sealmacenan los trabajos de grado, la búsqueda decualquier tipo de información contenida en estosmateriales es un poco engorrosa ya que no existeuna forma ágil de dar con el contenido buscadopor parte del usuario. Además de esto el usuariono cuenta con una forma de realizar consultasque no sea directamente en las instalaciones dela biblioteca, la cual tampoco posee todos lostrabajos de grado de todos los departamentos,

47

tenemos explícitamente el caso de los trabajosrealizados en los departamentos que seencuentran en las sedes de Berasategui que nuncallegan de ninguna forma a la biblioteca centralde la Universidad, entonces una consulta de unade éstos hace necesario desplazarse hasta estasinstalaciones, no hay una centralización de todaesta información.

Proceso deprestamos

El préstamo de este material, es bastantecomplicado pues el usuario no cuenta con unaforma de realizar prestamos que no sean demanera personal ya que en ningún momento se dejaque este material salga de las instalaciones dela biblioteca, ni se le permite obtener unacopia completa de este material, todo tipo deconsulta es realizada en la biblioteca.

Al aplicar semántica al proceso de ingreso de información detrabajos de grado al sistema, se busca darle a este la autonomíanecesaria para crear interrelaciones en dicha información, con elfin de enlazar de manera coherente los datos de las tesis degrado.

Cuando se posee información interrelacionada de manera coherente,siguiendo reglas previamente establecidas, se logra ampliar ycomplementar el conocimiento que estas poseen, logrando así unamayor eficiencia y eficacia en el proceso de almacenamiento.

Disponiendo de una base de conocimiento, brindada por lasemántica, y recorrida por Servicios Web Semánticos que seancapaces de interpretarla, se obtiene una herramienta capaz deentender la información con la que cuenta, que permite compartir ydifundir dicha información a través de la web.

48

Al desarrollar Servicios Web Semánticos, que faciliten lo antesmencionado, se tiene un sistema en el cual personal interesado enel desarrollo de investigación puede consultar de forma sencilla yeficaz el contenido de trabajos de grado desarrollados en laUniversidad de Córdoba; otorgándole así reconocimiento tanto anivel nacional como internacional a los trabajos desarrollados porestudiantes de la institución, y a la misma institución como tal,ya que usualmente éstos trabajos quedan estancados en labiblioteca de la institución y el acceso a ellos resulta un pocotedioso, y en muchas ocasiones la información con la que se cuentano es lo suficientemente clara como para identificar de maneraprecisa cual puede ser el trabajo investigativo que resulte másacorde a un tema de interés específico de la consulta, y no existeuna manera de asociar los trabajos de grado que se relacionenentre si y le brinden al usuario colaboración para agilizar eltrabajo de consulta. Por otra parte el desarrollo de un ServicioWeb Semántico para el desarrollo de gestión de consulta resultabastante eficiente en vista de que el sistema no solo brinda eldocumento con la información más precisa para la consulta sino quetambién al ser un sistema inteligente identificara de forma taltodos los documentos que serán útiles para completar la consulta ybrindara apoyo, ofreciendo estos documentos directamente.

CAPITULO III

Propuesta metodológica para el diseño e implementación deServicios Web Semánticos de información de trabajos de

grado, basado en modelos de datos semánticos, aplicados aServicios Web, ya existentes.

49

La siguiente propuesta metodológica para el diseño de servicios web semánticos de gestión de trabajos de grado se da en el desarrollo de cuatro (4) fases en las cuales se llevan a cabo actividades en donde se cumple los objetivos que darán como resultado el desarrollo del proyecto.

Esta metodología está diseñada según la gestión de procesos detrabajos de grado en las instituciones. A continuación se muestranlas fases y actividades que se deben tener en la metodología.

2.1 METODOLOGIA

FASE I

Diagnóstico del entorno del tema a investigar.

Esta fase consiste en obtener un análisis de la problemática,justificación y tecnologías para solucionar el problema; para ellose pueden desarrollar las siguientes actividades.

Actividad 1: realizar una investigación acerca de cómo semanejan los procesos del tema a estudiar, cuáles son susventajas, sus falencias, en qué aspectos se puede mejorar ycómo está afectando el entorno.

Actividad 2: investigar cómo se realizan estos procesos enotros lugares, para así examinar cual será la mejor salida ala problemática que se ha abordado y encontrar por medio decomparaciones una solución factible que satisfaga losrequerimientos de los procesos y que éste procedimiento nosolo sea para una región sino, que sirva como estándarinternacional bajo las mismas características, entorno y/oambiente.

Actividad 3: indagar sobre los conceptos relacionados conservicios web semánticos, para saber de qué forma se pueden

50

adoptar o adaptar para que cumplan con las necesidades delproblema.

El resultado de esta fase es un marco de análisis general de lasituación o problemática a abordar en las cuales, en unadescripción detallada, se evidencia la forma en la cual sepresenta dicha problemática y con qué puede estar relacionada.

FASE II

Modelado semántico.

Está dirigido al desarrollo de una base del conocimiento por mediode la implementación de una ontología.

Actividad 4: buscar modelos semánticos existentes(ontologías), que brinden posibles soluciones a los problemasestablecidos, adaptarlos, implementarlos o establecer nuevosmodelos, de acuerdo al problema, con el fin de obtener unabase del conocimiento que sea capaz de mejorar elfuncionamiento del sistema.

En esta fase se obtiene un modelo semántico a seguir para eldesarrollo de los procesos en el sistema y comunicación en él.

FASE III

Servicios web semánticos.

Se establece el uso de servicios web capaces de adaptarse almodelo semántico planteado y desarrollar servicios web semánticos.

Actividad 5: modelar servicios web idóneos que permitanconectar al usuario con sus requerimientos y que éstos puedanhacer uso de la base del conocimiento generada por el modelosemántico (ontología) a través de los servicios web.

Actividad 6: por medio de estándares o modelos se debeadaptar los servicios web de manera semántica con el fin de

51

obtener mejores resultados en los procesos brindados y asíagilizar sus funciones.

Aquí son obtenidos los servicios web y los servicios websemánticos necesarios que se encargan de manejar los procesos delsistema y de relacionarlos.

FASE IV

Resultados.

Implementación de servicios web semánticos.

Actividad 7: En este punto ya debe haberse identificado eltipo de aplicación que el usuario desea, de igual maneradeben seleccionarse las herramientas de desarrollo apropiado.

Actividad 8: implementar los servicios web semánticos quecumplan con los requerimientos del usuario bien sea orientadoa la web, aplicaciones de escritorio o aplicaciones paradispositivos móviles, y que éstos interactúen conaplicaciones y servicios ya definidos.

2.2 Aplicación de la metodología en la Universidad de Córdoba

El planteamiento inicial de este trabajo consiste en desarrollarservicios web semánticos para la gestión de trabajos de grado enla Universidad de Córdoba, su desarrollo está enmarcado en unaserie de procesos y actividades que se deben tener en cuenta parasu realización. En el entorno de la institución, esta metodologíaes implementada de la siguiente forma:

Fase IDiagnóstico del entorno del tema a investigar.

52

Esta fase consta de 3 actividades en las cuales se hace una seriede investigaciones para identificar de una forma clara laproblemática.

Actividad 1: inicialmente se produce un acercamiento a lasinstalaciones encargadas de gestionar este tipo de información enla Universidad de Córdoba, las cuales son la biblioteca MisaelDíaz Urzola y los departamentos de cada programa, una vez estandoallí se realizan entrevistas (Anexo) al personal encargado delmanejo de los procesos, se observan archivos, datos en los cualesse evidencia la forma en la que se dan, es realizada una encuestaa un grupo de estudiantes(anexo), con el fin de mostrar la formaen la cual estos procesos afectan al personal de la institución,de acuerdo a la información obtenida se hace un análisis de lasituación en donde se evidencian las falencias y las ventajas quese presentan con la gestión de los trabajos de grado; En base aestas conclusiones se realiza un estudio detallado de cómo estaproblemática afecta su entorno y cuáles pueden ser sus soluciones.

Actividad 2: con base en lo obtenido en la actividad anterior serealizó un mapeo de la gestión de trabajos de grado en otroslugares y un contacto personal con las instituciones de la regiónpara conocer como son manejados estos procesos, también, por mediode consultas e investigaciones a través de la web se pudo conocerla gestión de este tipo de información en otras instituciones anivel mundial.

El acercamiento a estas instituciones da respuesta a criterios quehay que tener en cuenta en el proyecto, para dar solución a unaserie de preguntas que surgen del desarrollo de la primeraactividad por ejemplo:

¿Cómo se da el manejo de trabajos de grado en otrasinstituciones?

¿Quiénes son los encargados?

53

¿Qué vocabulario es común entre éstas?

¿Qué se puede tomar o adaptar para mejorar los procesos?

¿Qué es necesario para la gestión de éstos?

Una vez resueltas estas preguntas es realizado un análisiscomparativo entre cómo son realizados los procesos en laUniversidad de Córdoba y como se realiza en otras instituciones,esto con el fin de relacionar los procesos para identificar cuales la forma más factible para su desarrollo. Una vez conocidos losresultados se puede mejorar el sistema adaptando procesos deafuera a los procesos actuales de la universidad y que, no sirvanúnicamente para una sola institución sino que cumplan con losrequerimientos de instituciones a nivel internacional.

Actividad 3: se indaga sobre la tecnología que se toma parasolucionar la problemática: los servicios web semánticos, aquí serealiza un estudio sobre los temas que tienen que ver con éstos yes identificada la forma en como ellos ayudan a mejorar la gestiónde trabajos de grado responde a cuestionamientos como:

¿El medio en el que estamos es el adecuado para desarrollareste tipo de tecnología?

¿Los servicios web semánticos son los indicados para eldesarrollo de estos procesos?

¿De qué forma pueden los servicios web semánticos mejorar losprocesos de gestión de trabajos de grado en la institución?

¿Por medio de que herramienta se pueden implementar losservicios web semánticos para que tengan un buenfuncionamiento en el desarrollo de estos procesos?

Finalmente la fase muestra como resultado un marco de análisissobre la gestión de trabajos de grado en la Universidad de Córdobay la forma como deben ser abordados los problemas por losservicios web semánticos (anexo).

54

Fase II

Modelado semántico.

Esta fase se encuentra desarrollada en una actividad que va sujetaa las actividades anteriores, en cualquier parte del desarrollo deesta fase se puede recurrir a la actividad anterior en caso decualquier duda.

Actividad 4: teniendo en cuenta las actividades anteriores esplanteado un modelo semántico que colabora con el uso de serviciosweb semánticos en la gestión de trabajos de grado, este modelosemántico denominado ontología teweb (anexo), se desarrolla deforma tal que cumple con facilitar los procesos relacionados atrabajos de grado, este modelo interactúa entre sí de modo que escapaz de enlazar los datos y formar una estrecha comunicaciónentre ellos para hacer del sistema un sistema inteligente diseñadopara comprender la información que maneja, la cual nos permitecompartir y reutilizar bases del conocimiento de maneracomputacional delimitando así el significado que la maquina lepueda brindar a algún tipo de dato haciendo especifica la funciónde los datos contenidos en la base del conocimiento.

Esta fase tiene como producto una ontología diseñada para elmanejo de trabajos de grado y no solo en la Universidad de Córdobasino que puede ser utilizada para el manejo de este tipo deinformación en cualquier otro lugar.

Fase III

Servicios Web Semánticos.

Involucra el desarrollo de dos actividades en las cuales por mediode las fases anteriores se identifica el modelo de servicios websemánticos más apropiado para la gestión de trabajos de grado enla institución.

55

Actividad 5: a partir de las necesidades del sistema se lograidentificar el uso de los servicios web que requieren serimplementados para facilitar los procesos que se modelan yresuelven por medio de los siguientes servicios web:

Tabla 3: Servicios de Logueo

SERVICIO DE LOGUEO

()

Servidor (operaciones) Cliente (acción)

login(nameuser, password)(void)

Logueo

loginResponse(user)

Servicio web normal encargado de la autentificación de un usuario,por medio de la acción de logueo se llevan a través del servicio de login un nombre de usuario y una password que dan como respuesta el usuario autenticado en el sistema. Este usuario o este servicio se encuentran directamente conectados con los servicios de login de google, el usuario que se registre para ingresar en el sistema deberá estar registrado en google para que sea reconocido por los servicios.

Tabla 4: Servicio de Gestión de Usuarios

SERVICIO DE GESTIÓN DE USUARIOS

56

(userService)

Servidor(operaciones)Cliente(acción)

Listusuariosrol(tipo usuario)(void)

Listar usuarios por tipoListusuariosrol Response(tipo deusuarios)

getusuarios(cedula usuario)(void) Consultar usuario

getusuariosResponse(usuario)

adduser(datos usuario)(void)Agregar usuario

adduserresponse(Boolean)

updateUser()(new datos usuarios)Actualizar usuario

updateUserResponse(Boolean)

El proceso de gestión de usuario realiza por medio de un servicio web que presente una serie de acciones ejecutadas por el cliente:

Acción de listar usuarios por tipo: esta acción permite que dependiendo el rol que escoja el usuario éste servicio se conecte con la base de datos y se obtenga como respuesta la lista de los usuarios que pertenecen a ese rol.

Acción consultar usuario: aquí el servicio por medio de la cedula que es el dato requerido está apto para proporcionar información de un usuario específico en el sistema.

Acción agregar usuario: consiste en llenar un formulario con los datos del usuario a agregar y este servicio se encarga dellevar los datos y devolver una respuesta.

57

Acción actualizar usuario: el objetivo de esta acción es mantener los datos del usuario actualizado modificándolos pormedio del servicio si es necesario.

Tabla 5: Servicio de Gestión de Documento

SERVICIO DE GESTIÓN DE DOCUMENTO

(documentoService)

Servidor(operaciones) Cliente(acción)

getDoc()(void)Listar documentos

getDocResponse(Documentos)

getDocsId(isbn)(void)Consultar documentos

getDocsIdResponse(Documento)()

addDoc(datos documento)(void)Agregar documentos

addDocResponse(Boolean)

updateDoc(new datos doc)(void)Actualizar documento

updateDocResponse(Boolean)

El servicio web sobre la gestión de documentos cuenta con las siguientes acciones:

Acción Listar documentos: en esta acción el servicio recibe como parámetro el tipo de documento a buscar y se obtiene como resultado una lista de los documentos.

58

Acción consultar documento: el servicio por medio del Id devuelve los datos que se relacionan con ese Id.

Acción agregar documentos: el servicio lleva los datos obtenidos en el formulario a la base del conocimiento y a la base de datos dando como respuesta al documento agregado.

Acción actualizar documento: el servicio ofrece la posibilidad de modificar y actualizar los datos contenidos enlas bases de datos y base del conocimiento relacionados con un documento.

Tabla 6: Servicio de Búsqueda de Documentos

SERVICIO DE BUSQUEDA DE DOCUMENTO

(QueryService)

Servidor(operación) Cliente(acción)

consulta(dato a buscar)(void)

Búsqueda generalconsultaResponse(temas relacionados con el dato a buscar)

Consultaavanzada(criterio, dato)(void)

Búsqueda avanzada

Consultaavanzadaresponse(documento)

Muestra documentoverTesisId(Documento)(void)

verTesisIdResponse(ID, usuario, infor)()

59

El servicio de búsqueda es un servicio web semántico que consiste en consultar los documentos y comprende las siguientes acciones:

Acción de búsqueda general: esta búsqueda es realizada por temas el usuario da como parámetro el tema a buscar y el servicio se encarga de llevarlo y por medio de la relación semántica traer el resultado apropiado al término a buscar.

Acción de búsqueda avanzada: esta acción permite que el servicio realicé la búsqueda de acuerdo a unos criterios específicos que son escogidos por el usuario y así da como resultado una búsqueda eficaz de acuerdo a lo solicitado por el usuario.

Acción Muestra documento: una vez se tiene el resultado de labúsqueda el servicio se encarga de mostrar todos los datos correspondientes al documento arrojado por la acción anterior.

Tabla 7: Servicio de Préstamo

SERVICIO DE PRESTAMO

(prestamoService)

Servidor(operaciones) Cliente(acción)

getsolicitud(isbn, usuario, observación)(void)

Enviar solicitudgetsolicitudResponse(resultado dela solicitud)

60

Solicitarprestamo()()

Préstamo

SolicitarprestamoResponse()()

El servicio web de préstamo está contemplado en las siguientes acciones:

Acción Solicitar préstamo: el usuario envía una solicitud de préstamo del documento con los parámetros del servicio a esperas de una respuesta que será entregada por el mismo servicio.

Acción solicitar préstamo: una vez recibida la solicitud estaes llevada por el servicio para ser evaluada y de acuerdo a esa evaluación el servicio retorna el estado del préstamo.

Al finalizar esta fase se tiene como resultado la identificación de los servicios web y servicios web semánticos que cumplen con eldesarrollo de una aplicación que resuelva y/o facilite los procesos seguidos en la gestión de trabajos de grado en la Universidad de Córdoba.

Fase IV

Implementación de servicios web semánticos.

En esta fase se tiene un resultado final que es el producto y paraesto comprende 2 actividades:

Actividad 7: en este punto con base en las actividades resueltas anteriormente se reconoce que la aplicación requerida para este proyecto es una aplicación web capaz de brindar solución a los problemas planteados en el desarrollo del proceso metodológico,

61

1: Estudio de los procesos

2: Aproximación a la Optimización de los procesos

3: Abordar los procesos por medio de los SWS

Modelado Semántico

4: Desarrollo de la Ontología.

Servicios Web Semánticos

5: Modelado de SW.

6: De SW a SWS.

Implementación

7: Planteamiento de la aplicación

8: Implementación de los SWS.

Entorno del tema a investigar

esta aplicación cuenta con el uso de herramientas como: XML, WSDL,DoublinCore, RDF, protege para el desarrollo de la ontología.

Actividad 8: esta actividad corresponde a la implementación de la aplicación denominada TeWeb que con base en el desarrollo de la metodología, esta aplicación brinda un resultado eficaz a la problemática planteada en el proyecto.

Ilustración 1: Metodología para la creación de Servicios Web Semánticos

62

Proceso de actividades criticas en el desarrollo de las fases.

CAPITULO IV

MODELADO SEMANTICO ONTOLOGIA TEWEB

A continuación se explica con más detalle la razón por la cual senecesitan de sistemas que sean modelados ontológicamente, cuandose quiere administrar la información de los Trabajos de Grado enla Universidad de Córdoba.

Se da a conocer además en qué consiste dicho modelado, lasconsideraciones a tener en cuenta y las ventajas adquiridas alimprentar sistemas de este tipo.

Introducción

Con el fin de brindar significado a la información a gestionar, senecesita de modelos que brinde coherencia a los datos, además dereglas y funciones, que permitan a los sistemas de cómputoentenderlos y utilizarlos. Estos modelos se conocen como lasemántica de la información, la semántica no es más que elsignificado de las cosas, es un concepto que utilizamos a diario,sin darnos cuenta; cuando nuestra cerebro procesa una imagenmental al escuchar la palabra “mesa” es producto de la semántica

63

que nos relación las palabras que escuchamos con objetos, hechos,momentos, información de palabra escuchada.

Para que exista relación entre datos y significados del mismo debeexistir una serie de reglas predefinidas encargadas de decir quetipo de relación existe entre los datos y su significado y entrelos mismos datos. Esta información de la información, o metadatosen el lenguaje informático, entrelazada a través de reglas yrepresentadas como entidades en un mapa interrelacional es lo quese conoce como ontología.

“El término ontología en informática hace referencia a laformulación de un exhaustivo y riguroso esquema conceptual dentrode uno o varios dominios dados; con la finalidad de facilitar lacomunicación y el intercambio de información entre diferentessistemas yentidades”(http://es.wikipedia.org/wiki/Ontología_(informática))

La web semántica y los servicios web semánticos sustentan susbases sobre este concepto, ya que sin una concesión establecida enuna ontología sería imposible brindar significado a determinadosobjetos para que pudieran ser comprendidos por sistemas decómputo.

Para la construcción o adaptación de una ontología se deben seguiruna serie de procesos que serían al final los que nos darán losrequisitos que esta debe cumplir.

Para el proceso de adaptación se debe tener claro los requisitos asatisfacer y buscar un modelo ontológico que los satisfaga, opermita adaptarlos para satisfacerla. Lastimosamente aún no secuentan con sistemas muy avanzados al momento de la búsqueda deuna ontología, existe SWOOGLE, cuya principal característica esque las búsquedas las hace solo sobre documentos rdf, rdf-s, owl,owl-s, etc., formatos en los que se almacenan las ontologías y lasbases de conocimiento dependiendo del lenguaje utilizado para lamisma.

64

Para el proceso de construcción o diseño es recomendable acataralgunas de las metodologías establecidas para tal fin. Entre lasmás populares se pueden destacar: Methontology, CyC, Uschold yKing.

En la construcción de una ontología se deben establecer y declara3 conceptos muy claros:

Las Clases: Son la representación de los conceptos del dominio.

Slots: Son las propiedades de las representaciones de dominio.

Las Facets: son las restricciones establecidas sobre los Slots.

Las Clases me definen o instancian los objetos y acciones delmundo real en el contexto semántico de la ontología, persona, rio,calle, país; los Slots son las propiedades que definen a dichasclases, nombre, color, nacionalidad; y las Facets son lasrestricciones a los Slots, el sexo solo puede ser M o F, la edadsolo puedes ser entre 18 y 99.

“Persona” es una clase que representa a cualquier ser humano sobreuna ontología, “Numero_Identificacion” puede ser un slots quedefine un id único para tal persona, “Literal” puede ser unaFacets que nos define el id como una cadena de texto, por ejemplo.

3.1 Abordar la problemática desde un plano ontológico.

Los Trabajos de Grado son una fuente indiscutible de conocimiento,ya analizado y aplicado a campos específicos, en muchas ocasiones,muchos de los problemas que se nos presentan a la hora de realizaruna investigación, trabajo de campo, practica académica ocualquier otra actividad que implique el uso de conocimientos queya han sido abordados en un Trabajo de Grado, en un grado mayor omenor de profundidad al que nos interesa, pero lo importante esque la mayoría de las veces se está reinventando la rueda y

65

desaprovechando mucho material científico inmerso en estosdocumentos.

En el caso particular de la Universidad de Córdoba el uso de losTrabajos de Grado, como material de consulta esta relegado a unsegundo plano, superado en gran medida por otro tipo de materialesimpresos y más aun por materiales digitales.

En los últimos tiempos, en la Universidad de Córdoba, se estánimplementando herramientas que tiene como fin digitalizar elmaterial correspondiente a los Trabajos de Grado y asignarle unpoco más de orden al proceso de almacenamiento, proporcionando asíuna mayor claridad a la hora de consultarlas.

El simple hecho de pasar el material impreso a digital y almacenareste en un sitio virtual es un gran avance, pero no una solucióndel todo optima, pues lo métodos convencionales de consulta ymanejo de datos se quedan cortos ante grandes volúmenes deinformación.

Se puede comprobar a la hora de ir a una biblioteca y consultarinformación, en su base de datos si esta dispone de una, sobrelimite de funciones, se obtendrá un sinfín de resultados, enGoogle se obtienen 3.210.000 (30 de mayo 2012), del cual unaminoría hará relación al tema de derivadas, que claramente entraen el tema de límites, y los resultados que lo hacen, la muestranporque la palabra “limite” aparece en el contexto, dejando de ladola relación intelectual y limitándose solo a la relación textual.Este es solo uno de un millar de errores e inconvenientes de estetipo que encontramos en los motores de búsqueda de la actualidad.

Las consultas en la actualidad se basan en simples comparacionestaxonómicas y relaciones textuales, dejando de lado la informaciónmás a fondo y omitiendo la información no tangible generada deesta otra, por ejemplo la relaciones existente entre los distintosdocumentos, grado de profundidad con la que se aborda el tema aconsultar, temas relacionados al tema a tratar, etc. Para dar

66

solución a este falencia se hace necesario el uso de un modeloontológico que sea capaz de satisfacer las necesidades encontradasen (capitulo de problemática).

Consideraciones.

A la hora de gestionar la información de los Trabajos de Grado através de un sistema de computo se debe tener en cuenta un sinnúmero de consideraciones, con el fin de obtener un sistemafiable, eficaz y capaz de prevalecer y adaptarse a nuevos sistemasen un futuro.

La información es la base de todo el proceso, en cuanto más seconozca sobre algo más se puede hacer con eso, esto es, cuando secuenta con mayor información sobre un determinado objeto más sesabe acerca de él. Por esto la obtención de la información debebasarse en metadatos, datos de la información, con el fin deconocer sobre lo que se está tratando.

Se debe tener en cuenta también, la envergadura de la ontología,saber a qué se le quiere dar respuesta, y sobre qué contexto se vaa trabajar. No se debe olvidar el principio básico de la websemántica, tener información entrelazada y entendible porordenadores.

Para aprovechar al máximo un sistema modelado a través de unaontología se tiene que salir de las consultas simples basadas encomparaciones de texto y brindar una gama de opciones a losusuarios a fin de responder su necesidad.

Ejemplo:

¿Qué tesis me sirve si quiero saber sobre un tema X?

¿Qué tesis se han realizado en un determinado programa, en unadeterminada facultad?

¿No hay más documentos en los que puede leer sobre el mismo tema?67

¿Qué tan reciente es esa tesis?

¿Qué otros documentos ha hecho este autor? ¿En que otrosdocumentos ha participado?

Basándose en los conocimientos obtenidos acerca de la problemáticaabordada y teniendo en cuenta la envergadura, se deben definir losentes que actuaran en la ontología y la relación e integraciónentre ellos.

3.2Arquitectura de la Ontología

Al haber definido la problemática solo para la Universidad deCórdoba, no se puede plantear una envergadura para la ontologíaque vaya más allá, pero si se puede definir esta como un modeloontológico aplicable a cualquier contexto que cumpla concondiciones similares a las tenidas al momento de realizar elmodelo ontológico.

Para definir los entes que harán parte de la ontología se debetener claro todos los procesos que se ven involucrados dentro dela gestión de los Trabajos de Grado en la Universidad de Córdoba.

Los Trabajos de Grado en la Universidad de Córdoba son trabajosinvestigativos que se realizan con el fin de obtener un títulouniversitario, son desarrollados, por lo general en el últimosemestre de un programa académico.

El Trabajo de Grado como proyecto de investigación debe conteneruna serie de información básica, no muy diferentes a cualquierotro documento investigativo, como lo es:

Un titulo, en donde se debe definir a groso modo que se va ahacer en dicha investigación.

Un tema principal, que establece el tema de mayor envergaduratratado en el desarrollo de la investigación.

68

Un resumen, que no puede superar las 500 palabras y defineelentorno de la investigación.

Un abstrac, que no será otra cosa más que el resumen traducido alingles.

Las palabras claves, mínimo 4, son los otros temas tratados en lainvestigación.

Los keyWord, son la representación en ingles de las palabrasclaves.

Los autores, son estudiantes responsables de la investigación.

Los directores, él o los docentes asesores de la investigación.

ISBN, los libros comerciales e investigativos cuentan con un idúnico para identificación conocido como ISBN, para efectos de esteproyecto, los Trabajos de Grado contaran con un ISBN, basado en elmismo principio de el estándar, pero adatado al enfoque requerido.

De esta información se rescatan 2 datos valiosos, el contenidointelectual de los Trabajos de Grado se basa en los temas de laque esta trata o habla, y la propiedad intelectual que hacereferencia a las personas involucradas en la investigación.

Por lo anterior se puede clasificar la información de acuerdo a suinferencia en el problema de la siguiente forma:

Material intelectual (Tesis).

Propiedad intelectual (Persona, Programa, Facultad).

Contenido intelectual (Temas).

Cada una de estas expresiones será representada como una clasedentro del modelo ontológico.

Pensando en su interacción con otros modelos semánticos yadesarrollados y a fin de brindarle mayor internacionalización, se

69

ha optado por adaptar metadatos y ontologías ya establecidas almodelado de esta. De esta forma la clase persona será abordada porla ontología FOAF, dedicada a la representación de personas eninternet, y los atributos establecidos para esta clase seránbasados en los recomendados por FOAF, la base principal de FOAF esel email, identificador inequívoco de las personas en internet.

La Clase Tesis será una representación de los trabajos de gradodentro del modelo, sus atributos son una adaptación de DublínCore, puesto que este no establece atributos propios para lastesis de grado, aunque en esencia una tesis es igual a undocumento, desde un enfoque semántico difieren en diversosaspectos, guardando más relación a una publicación científica oartículo que a un libro en sí.

A continuación se puede ver una aproximación a la adaptación deDublín Core a los trabajos de grado:

Tabla 8: Definición de Metadatos de Dublín Core para los trabajos de grado.

Atributo del objeto Atributo Dublín Core

implementado

Titulo Title

Tema principal Subject

Resumen Description

Abstrac Description

Palabras claves Description

Key Words Description70

Idioma (ISO 639) Languaje

Autores Creator

Director Contributor

Derechos Rights

Fecha

(<http://www.w3.org/TR/NOTE-

datetime> , ISO 8601)

Date

Formato Format

ISBN Identifier

Las clases temas, programas y facultad, contendrán los atributosbasados en las necesidades vistas en etapas anteriores en lainvestigación (Capitulo II).

Este proceso de adaptación de modelos ya desarrollados brindarauna posible integración del modelo ontológico con otros yadesarrollados y así facilitarauna mayor cantidad informacióndentro de la Base del conocimiento.

Luego de definir las clases se debe establecer las reglas por lasque estas se relacionan, entonces se encontrara que:

Una persona puede ser el autor o el director de un TG.

UnTG pertenece a uno o varios programas.

Un programa pertenece a una facultad.71

Un tema describe uno o varios TG.

UnTG es descrito por varios temas.

UnTG pertenece a una fecha.

Con estas reglas básicas se puede construir una ontología capaz deresolver las preguntas planteadas con anterioridad.

3.3 Pruebas y herramientas auxiliares para desarrollo yconstrucción de la Ontología

Para las diferentes etapas del desarrollo de la ontología se usode una serie herramientas que tienen por fin facilitar el procesode construcción:

Protègè. Es un editor de código abierto, desarrollada en ellenguaje java, destinado al desarrollo de ontología, o a laadquisición de conocimiento, como se menciona la misma página dedicho proyecto, cuenta con un sin número de plugins para el uso delenguajes ontológicos. Permite la creación, edición y pruebas demodelos ontológicos en los lenguajes más comunes para tal fin.

Por si mismo Protègè no permite una verdadera interacción usuario-ontología, pero es ideal como framework auxiliar de otrasherramientas desarrollo como Netbeans.

72

Ilustración 2: Entorno General de Protègè.

Una vez definida y elaborada la ontología, es necesario comprobarsi satisface los requisitos establecidos. Protègè incluye unmodulo de consultas muy básico, que permite realizar pruebassencillas, pero a la hora de realizar consultas de mayorenvergadura, en las que de verdad se evidencie la semántica, sequeda corto, así que para el desarrollo completo del proyecto seopto por incorpora otra herramienta ideal para dicho propósito.

Twinkle. Es un editor de SPARQL, lenguaje de consulta paraontologías, desarrollado en java, implementa la librería JENA,creada entre otras cosas para la consulta de ontologías.

73

SPARQL, Es definido así: “Se trata de un lenguaje estandarizadopara la consulta de grafos RDF, normalizado por el RDF DataAccess WorkingGroup (DAWG) del Word Wide Web Consortium(W3C). Es una tecnología clave en el desarrollo de la WebSemántica que se constituyó como Recomendación oficial delW3C el 15 de Enero de 2008.”, tomado dehttp://es.wikipedia.org/wiki/SPARQL

Twinkle al igual que Protègè, no es más que una herramientaauxiliar en el desarrollo del proyecto, pero al ser incorporada,en conjunto con Protègè, a Netbeans brinda una interacción entrela aplicación y la ontología.

Ilustración 3: Consulta en Twinkle sobre la Ontología ya desarrollada.

74

METODOLOGÌA

Población

La investigación está dirigida a la universidad de córdoba ysus áreas encargadas del manejo de la información de lostrabajos de grado, a estudiantes, docentes y demás personalinteresada en dicha información.

Muestra

Para la puesta en marcha de este proyecto se cuenta con la participación de los departamentos de química y español y literatura, los cuales servirán como muestra para la investigación.

Tipo de trabajo.

Este trabajo está contemplado en una primera etapa depreparación con un enfoque descriptivo y en una segundaetapa de aplicación con un enfoque tecnológico aplicado.

En la etapa de preparación se estudiaran las bases teóricas ytecnológicas de los servicios web semánticos, se realizara unestudio con el fin de evidenciar las falencias que sepresentan con el manejo de la información concerniente a lostrabajos de grado en la universidad de córdoba y que permitan

75

ser abordados a través de tecnologías SWS. Para esto se haráuso de la investigación descriptiva, por considerarse la másóptima para el desarrollo de esta primera etapa.

La investigación tecnológica aplicada se verá reflejada a lahora de diseñar e implementar servicios web semánticos,basados en una propuesta metodológica obtenida de la etapa depreparación, en el área del manejo de la información de lostrabajos de grado.

DISCUSIÓNES

En el dominio de la gestión de trabajos de grado en la Universidadde Córdoba, el uso de servicios web semánticos se convierte enalgo especialmente útil. Si por ejemplo, se toma la gran cantidadde información, referente a los trabajos de grado y sus diferentesfuentes, se torna una gran confusión en la búsqueda y gestión delos mismos. El uso de servicios web y el tratamiento que se le daal flujo de datos pueden dar como resultado asistencia precisa yen el mejor de los casos completa a los usuarios de este tipo deinformación.

76

En los procesos que se llevan a cabo en la gestión de trabajos degrado en la institución, se encuentran ciertas falencias que dejanal usuario de alguna u otra forma desubicado. Se Parte del hechoque un usuario no cuenta con un método eficiente y eficaz paraidentificar o encontrar el material preciso y necesario a buscar;como consecuencia de la forma de almacenamiento del material, noes la idónea para este tipo de información.

En este trabajo se ha conseguido mejorar el proceso dealmacenamiento y por ende los demás procesos afectados en lagestión de estos documentos, mejorando la calidad de los serviciosprestados a los usuarios; dándole la oportunidad de escoger lainformación precisa que necesitan. No obstante, los trabajos degrado en la Universidad de Córdoba no cuentan con un método deidentificación lo cual hace tedioso sus consultas por tal motivoeste trabajo plantea el uso de un ISBN para estos documentos, elcual facilitara la identificación de los trabajos en general.

En el desarrollo de este trabajo se ha logrado establecer unametodología en la cual se evidencian las falencias y posiblessoluciones a los procesos llevados a cabo en la gestión de estetipo de información. Siguiendo un orden estructurado de cómo sedan estos procesos en la institución, también se presentan lasposibles soluciones o mejoras que nos pueden brindar los serviciosweb semánticos para estos procesos. Dando como resultado final laidentificación de los procesos y como deben ser abordados cada unopara mejorar el funcionamiento del sistema.

77

CONCLUSIONES

Con base en el trabajo realizado en este proyecto, se ha podidoconstatar que los servicios web semánticos se encuentran en unproceso de desarrollo y evolución en búsqueda de su madurez, sinembargo su implementación en este proyecto permite ver conclaridad sus ventajas en cuanto a la gestión de trabajos de gradoconcierne debido a que resuelven de una manera apropiada losobjetivos planteados en el desarrollo de este proyecto.

En lo referente al análisis de los procesos que abordan estaproblemática este trabajo hace claridad al momento deidentificarlos y exponer su mejora por medio de los servicios websemánticos y además esto corresponde a una propuesta novedosa einnovadora que satisface las necesidades de los usuarios.

El desarrollo e implementación de una propuesta metodológicaexclusiva para este tipo de trabajo hacen que el proyecto secentre en las prioridades y necesidades que van a satisfacer a losusuarios logrando así un sistema único, eficiente y eficazdedicado a solucionar los posibles problemas presentados a lolargo de los procesos y capaz de comprender los requerimientos delusuario.

La aparición de los servicios web semánticos ha dejado ver congran claridad las ventajas que estos representan para la gestiónde trabajos de grado pero también hacen evidentes las dificultadesque conlleva el hacer uso de tecnologías que no están de un todoconsolidadas ya que están en constante evolución y su uso a lafecha de este proyecto se encuentra en un proceso de inmadurez anivel mundial. Por tal motivo se piensa que el desarrollo de esteproyecto constituye un pequeño grano de arena que contribuye elproceso de madurez de las tecnologías aplicadas en éste, dándole

78

reconocimiento a las capacidades con las que cuentan los serviciosweb semánticos.

RECOMENDACIONES

Tomando como referencia el trabajo investigativo realizado para eldesarrollo de este proyecto, las principales recomendaciones que se pueden realizar a partir de este trabajo son:

La implementación de un sistema de identificación individual para las tesis como por ejemplo un ISBN.

Implementación de un formato único para la entrega de trabajos de grado.

79

[W3C, 2004] World Wide WebConsortium (W3C).Web Services Glossary, W3C Working Group Note 11.Disponible en: http://www.w3c.org/TR/ws-gloss/, Feb. 2004.

[José A. 2005] W3C 2005, Web Semántica pag.18 disponible: http://www.w3c.es/Presentaciones/2005/0202-BPMS-JA/18

BIBLIOGRAFIA

80

[ASG,2004] URL: http://asg-platform.org/cgi-bin/twiki/view/Public

[ELeGI. 2004] URL: http://www.elegi.ecs.soton.ac.uk/

Gruber, T. (2001). "What is an Ontology?".StanfordUniversity.Retrieved 2009-11-09.

[Wikipedia, 2008] esta información fue tomada de:http://es.wikipedia.org/wiki/RDF_Schema

Santiago M. 2007, Trabajo final de Carrera, Web Semántica yServicios Web Semánticos.

Javier G.G.& Antonio D.G, 2003. La biblioteca pública antelasnecesidades informativas de su

comunidad: recursos y serviciosa través de la web.

José S. (2005), ONTOLOGÍAS PARA SERVICIOS WEB SEMÁNTICOSDEINFORMACIÓN DE TRÁFICO: DESCRIPCIÓN YHERRAMIENTAS DEEXPLOTACIÓN. Universidad de Valencia.

Leidy C. H. (2010), AUTOMATIZACION DE PROCESOS DE NEGOCIO USANDOSERVICIOS WEB SEMANTICOS.

Diego L. (2009), Buscador Semántico sobre una Red Social depreguntas de examen.UNIVERSIDAD CARLOS III DE MADRID.

[www.usbbog.edu.co 2011]: tomado a la fecha de 4 de febrero de2012 dehttp://www.usbbog.edu.co/Estudiantes/Documentos/trabajos_grado.pdf

Gloria C. (2010), TECNOLOGÍAS DE WEB SEMÁNTICA ORIENTADAALDESARROLLO DE SERVICIOS WEB. Universidad Técnica Particular deLOJA

[www. www.javeriana.edu.co 2009]: tomado a la fecha de 23 deenero 2012 dehttp://www.javeriana.edu.co/cyl/website/pre_comunicacion/docs/TESIS_CDS.pdf

81

[www.eia.edu.co 2002]: tomado a la fecha de 23 de enero 2012 dehttp://www.eia.edu.co/SITE/LinkClick.aspx?fileticket=l5TmuGnGJpo%3D&tabid=609

E. Sirin, J. Hendler, B. Parsia. Semi-automatic Composition of WebServices using Semantic Descriptions.

Esmeralda R. y Haydemar N. Julio 2007, ONTOLOGÍAS: componentes,metodologías, lenguajes, herramientas y aplicaciones.Centro deIngeniería de Software y Sistemas -ISYS- Laboratorio deInteligencia Artificial -LIA- Caracas.

Terry Payne. Semantic Web Services.Publicado en el IEEEIntelligentSystems, en 2004

Aaron Swartz. MusicBrainz: A Semantic Web Service. Publicado en elIEEE. Año 2002

The OWL Services Coalition. OWL-S: Semantic Markup for WebServices

Nickolas Kavantzas, David Burdett, Gregory Ritzinger, TonyFletcher, Yves Lafon, Charlton Barreto.Web Services ChoreographyDescription Language Versión 1.0.W3C Candidate Recommendation.[Enlínea] 09 de Noviembre de 2005. http://www.w3.org/TR/2005/CR-ws-cdl-10-20051109/.

David Martin, Mark B., Jerry H., OraLassila, Dres M., Sheila M.,Srini N., Massimo P., Bijan P., Terry P., Evre S., Naveen S. yKatia Sycara.OWL-S: Semantic Markup for Web Services. W3CMemberSubmission.[En línea] 22 de Noviembre de 2004. http://www.

Rama A., Joel F., John M., Meenakshi N., Marc-Thomas S., Amit S. yKunalVerma.WebServiceSemantics – WSDL-S. W3C MemberSubmission.[Enlínea] 07 de Noviembre de 2005. http://www.w3.org/Submission/WSDL-S/. w3.org/Submission/OWL-S/.

Protégé Web Site: http://protege.stanford.edu/

82

Staab S, Studer R, Schnurr H and Sure Y. (2001).Knowledge Processand Ontologies.IEEE Intelligent Systems.16(1):26-34. January-February.

http://dublincore.org/

http://sioc-project.org/

http://www.foaf-project.org/

http://www.wshoy.sidar.org/index.php?2004/10/13/15-doap-descripcion-de-un-proyecto

http://rdfs.org/resume-rdf/

http://swoogle.umbc.edu

http://protege.stanford.edu

http://www.ldodds.com/projects/twinkle/

http://sparql.org/

83