Artigo - Trilha Principal

O uso da Mineração de Textos para Extração e Organização não Supervisionada de Conhecimento


Autores: REZENDE, S. O.; MARCACINI, R. M.; MOURA, M. F.

Resumo:O avanço das tecnologias para aquisição e armazenamento de dados tem permitido que o volume de informação gerado em formato digital aumente de forma significativa nas organizações. Cerca de 80\% desses dados estão em formato não estruturado, no qual uma parte significativa são textos. A organização inteligente dessas coleções textuais é de grandeinteresse para a maioria das instituições, pois agiliza processos de busca e recuperação da informação. Nesse contexto, a Mineração de Textos permite a transformação desse grande volume de dados textuais não estruturados em conhecimento útil, muitas vezes inovador para as organizações. Em especial, o uso de métodos não supervisionados para extraçãoeorganização de conhecimento recebe grande atenção na literatura, uma vez que não exigem conhecimento prévio a respeitodas coleções textuais a serem exploradas. Nesse artigo são descritas as principais técnicas e algoritmos existentes para extração e organizaçãonão supervisionada de conhecimento a partir de dados textuais. Os trabalhos mais relevantes na literatura são apresentados e discutidos em cada fase do processo de Mineração de Textos; e, são sugeridas ferramentas computacionais existentes para cada tarefa. Por fim, alguns exemplos e aplicações são apresentados para ilustrar o uso da Mineração de Textos em problemas reais.

Palavras chave:Mineração de Textos, Agrupamento de Documentos, Aprendizado Não Supervisionado, Extração de Metadados, Hierarquias de Tópicos

Artigo completo

Referência completa: REZENDE, S. O.; MARCACINI, R. M.; MOURA, M. F., "O uso da Mineração de Textos para Extração e Organização não Supervisionada de Conhecimento", Revista de Sistemas de Informação da FSMA n 7 (2011) pp. 7 – 21


Voltar