Buscador Semántico para la recuperación de Objetos de Aprendizaje

De Computacion

BUSCADOR SEMANTICO PARA LA RECUPERACION DE OBJETOS DE APRENDIZAJE DEL DSPACE

Tabla de contenidos

Capítulo I: Estado del Arte

La cantidad inmensa de información contenida en la Web a traído como consecuencia el uso de sofisticados paquetes de software llamados buscadores para ayudar a los internautas a filtrar los contenidos en la red; sin embargo, los resultados arrojados por estos programas son poco relevantes, además de ser numerosos lo que ha hecho que el usuario gaste tiempo y paciencia filtrando nuevamente la información arrojada por los buscadores. Para solventar éste y otros problemas aparecen producto del apogeo de la Web 3.0, los buscadores de tercera generación o semánticos. Este tipo de aplicaciones intentan solucionar el principal problema de sus predecesores (buscadores sintácticos), la escasa relevancia en los resultados. Por tal motivo este trabajo tiene como objetivo revisar los enfoques, estructuras y métodos utilizados por los diferentes componentes de un buscador semántico. Además se realiza un estudio de los problemas que poseen los buscadores actuales, que han dado lugar a nuevos mecanismos para buscar información; los problemas de los buscadores actuales tienen un trasfondo en la Web actual, por tal razón las técnicas de Recuperación de Información Aproximada son las que mejor se ajustan a la realidad de la información contenida en la Web y que existen maneras semánticas y no semánticas para dotar de inteligencia a un buscador.

Enlace al Capítulo: https://docs.google.com/a/utpl.edu.ec/document/pub?id=158Dzz15G_e1dO3CmqWjtiXuSYu_5aE-oXr7Z1XOVbGA

Capítulo II: Análisis Comparativo de herramientas Open Source sobre sistemas de RI, PLN, EI

En este capítulo se presenta un análisis de las diferentes herramientas disponibles en la Web para resolver las tareas que existen dentro de un buscador semántico (RI, PLN, EI). Se han encontrado varias herramientas para resolver problemas particulares y otras de propósito general, de todo el conjunto de herramientas encontradas se ha preferido aquellas que trabajan con la tecnología java, debido a que el repositorio de objetos de aprendizaje, Dspace; de la Universidad1 trabaja con ella, también se ha visto la necesidad de trabajar con herramientas con suficiente documentación ya que es muy importante a la hora de personalizar las herramientas a intereses específicos.

Algunas de las herramientas que no se tomaron en consideración en el presente análisis constan: Para RI se han desechado SemacticVectors2, SemanticSpace3 por ser herramientas con poca documentación (solo javadocs) lo que hace complicado aprovechar las prestaciones de la herramienta. En PLN en un principio se consideró las herramientas de LingPipe4, Mallet5, Stanford NLP6, sin embargo; se dejaron de lado por qué no procesan el lenguaje español o en su defecto no cuenta con modelos para hacerlo, otras herramientas como Natural Language Toolkit7 trabajan con Phyton lo cual hace difícil la integración con java.

Los datos de prueba así como también las métricas utilizadas en la mayoría de componentes han sido tomados de eventos científicos internacionales, se toma en cuenta conferencias como: Senseval8, CONLL9 y MUC10. Cada una ofrece un conjunto de datos de entrenamiento y prueba los cuales han sido procesados y acoplados al escenario de cada componente.

Este análisis está enfocado a someter a las herramientas a problemas reales dentro de cada campo, por tal motivo se han preferido utilizar datos de prueba de congresos expertos en las problemáticas tratadas en este trabajo. Se busca también examinar las prestaciones de cada herramienta, así como también conocer su funcionamiento, detalles de implementación y uso.

Enlace al Capítulo: https://docs.google.com/a/utpl.edu.ec/document/pub?id=1gGZJFLLGlx8hNV01BPL6DNbrA2zPEjiEKcMFMsGF6UY

Capítulo III: Implementación

En este capítulo se especifican los detalles de desarrollo, las herramientas utilizadas, la arquitectura del sistema. Requerimientos, casos de uso, diagrama de clases y demas configuraciones del sistema. Actualmente esta fase se encuentra en desarrollo.

Capítulo IV: Pruebas

Esta fase consiste en medir el desempeño del buscador, esta fase aun esta pendiente.

Herramientas personales
Sitios UTPL