Categorización de textos científicos mediante aprendizaje automático
Ver/ Abrir
Nivel Educativo:
Tipo Documental:
Trabajo fin de gradoEstadísticas:
Ver Estadísticas de usoMetadatos:
Mostrar el registro completo del ítemAutor:
Fecha:
2016Resumen:
El presente documento se corresponde con el Trabajo de Fin de Grado elaborado para analizar el Doble Grado de Ingeniería Informática y Administración de Empresas, referido este al primer grado. Se ha recoge el proceso llevado a cabo para el desarrollo de un software que genere automáticamente las palabras clave necesarias para etiquetar un artículo científico a partir de su resumen. Para ello, ha sido necesario, en primer lugar, conocer el Estado de la Cuestión, es decir, investigar qué era exactamente un problema de clasificación multietiqueta y de qué técnicas se disponían para resolverlo. Además, también fue necesario averiguar cómo se podía transformar un texto para poder generar de él una serie de atributos que explicaran su contenido. Una vez se tenían los conocimientos suficientes, se pudo pasar al análisis, diseño e implementación del sistema, fases que han sido debidamente documentadas, y puestas a prueba en la evaluación. Esto se ha realizado mediante la generación de cuatro módulos: extracción de la información, elaboración de los conjuntos de entrenamiento, la construcción de los modelos y la evaluación. En cuanto a las pruebas de comportamiento realizadas, se detectó que la labor de aprendizaje se dificultaba enormemente a medida que las etiquetas estaban muy relacionadas, pues sus atributos no eran lo suficientemente diferentes como para poder diferenciarlos con claridad. Este trabajo se cierra con un capítulo de conclusiones, donde se ha realizado un repaso de los aspectos más importantes detectados durante el desarrollo, así como las limitaciones del sistema y las líneas futuras de investigación.
El presente documento se corresponde con el Trabajo de Fin de Grado elaborado para analizar el Doble Grado de Ingeniería Informática y Administración de Empresas, referido este al primer grado. Se ha recoge el proceso llevado a cabo para el desarrollo de un software que genere automáticamente las palabras clave necesarias para etiquetar un artículo científico a partir de su resumen. Para ello, ha sido necesario, en primer lugar, conocer el Estado de la Cuestión, es decir, investigar qué era exactamente un problema de clasificación multietiqueta y de qué técnicas se disponían para resolverlo. Además, también fue necesario averiguar cómo se podía transformar un texto para poder generar de él una serie de atributos que explicaran su contenido. Una vez se tenían los conocimientos suficientes, se pudo pasar al análisis, diseño e implementación del sistema, fases que han sido debidamente documentadas, y puestas a prueba en la evaluación. Esto se ha realizado mediante la generación de cuatro módulos: extracción de la información, elaboración de los conjuntos de entrenamiento, la construcción de los modelos y la evaluación. En cuanto a las pruebas de comportamiento realizadas, se detectó que la labor de aprendizaje se dificultaba enormemente a medida que las etiquetas estaban muy relacionadas, pues sus atributos no eran lo suficientemente diferentes como para poder diferenciarlos con claridad. Este trabajo se cierra con un capítulo de conclusiones, donde se ha realizado un repaso de los aspectos más importantes detectados durante el desarrollo, así como las limitaciones del sistema y las líneas futuras de investigación.
Leer menos