Expansão Automática de Termos baseada em Ontologia

Image Description
Glauco Munsberg Dezembro 07, 2015
Compartilhar:

em currículos Lattes

Hoje completo minha trajetória acadêmica na graduação através da apresentação do meu trabalho de conclusão de curso. Neste trabalho exploro o Processamento de Linguagem Natural com o intuito de melhorar as buscas dos currículos Lattes. Veja abaixo o abstract deste trabalho.

Image Description

Resumo

A Plataforma Lattes, criada e mantida pelo CNPq, integra as bases de dados de curríıculos, grupos de pesquisa e instituiçõ̃es, em um único sistema de informações e é um importante meio pelo qual pesquisadores, professores e alunos vêm reunindo informacões sobre a suas formações e trabalhos produzidos durante décadas. Assim, hoje o Lattes é referência nacional no formato de currículo, divulgação da produção científica e tecnológica brasileira. Porém, a ferramenta de pesquisa atual do Lattes exige grande compreensão da busca que se espera, e de certa forma, uma objetividade ao realizar uma pesquisa. Com isso, propomos um mecanismo de busca que permita uma melhor experiência de uso, aumentando a relevância dos resultados retornados a partir de uma busca fornecida pelo usuário. De um lado, percebe-se que há um alto grau de informalidade nos termos buscados mais frequentemente pelos usuários, enquanto os pesquisadores tendem a usar termos técnicos específicos para descrever seus trabalhos em seus currículos. Como as ferramentas tradicionais de recuperação de informação utilizam apenas os termos que são mencionados nos currículos para indexar a informação, os usuários precisam ter conhecimento desses termos para recuperar currículos relevantes em suas consultas. Como forma de melhorar esses resultados, propomos aqui o desenvolvimento de um mecanismo de busca com expansão de termos apoiado por uma base de conhecimento. O objetivo é ampliar os resultados da busca fornecendo assim uma melhor experiência de uso.

Resultados

Os resultados obtidos mostraram que houve um ganho significativo na aproximação do vocabulário entre o utilizado pela comunidade e pelas publicações indexadas. Também foi observando que 23,1% das consultas realizadas contaram com uma expansão e que destas 64,9% foram clicadas pelo usuário. Isso demonstra, que para esse conjunto de curŕıculos, houve uma relevância significativa para o motor de busca o uso de expansão de termos proposto aqui.

Banca

  • Prof. Dr. Ricardo Matsumura Araujo – Orientador
  • Profa . Dr. Daniela Francisco Brauner - Coorientadora
  • Prof. Dr. Alexandre Reademaker
  • Profa. Dr. Ana Marilza Pernas Fleischamn
  • Profa. Dr. Tatiana Aires Tavares

Leia no Pelotas Parque Tecnológico

Siga e acompanhe também no Medium, LinkedIn e Instagram.

Compartilhar:
Image Description
Escrito por

Glauco Munsberg

Cientista de dados, apaixanado por inovação e tecnologia.

Mestre em Inteligência Artificial/UFPel.