Uso de informações lingüísticas na etapa de pré - processamento em mineração de textos

Uso de informações lingüísticas na etapa de pré - processamento em mineração de textos

Silva, Cassiana Fagundes da

URI: http://www.repositorio.jesuita.org.br/handle/UNISINOS/2195

Data da Defesa: 2004-02-27

Orientador: Vieira, Renata

Resumo:

Este trabalho apresenta estudos, com realização de experimentos e análise de resultados, da aplicação de informações lingüísticas na etapa de pré-processamento no processo de Mineração de Textos para as tarefas de Categorização e Agrupamento de Documentos. Usualmente, o pré-processamento utilizado no processo de Mineração de Textos para estas tarefas consiste na remoção de termos irrelevantes (tais como, preposição, artigos, pronomes, entre outros), normalização morfológica e seleção dos termos (ao que denominamos baseado em métodos usuais). Propõe-se, ao longo deste trabalho, um pré-processamento que faz o uso de informações lingüísticas, ou seja, um préprocessamento baseado em combinações gramaticais, visando avaliar a repercussão do uso dessas informações nos resultados de tarefas de Mineração de Textos. Foram realizados diversos experimentos para a validação da abordagem proposta junto à língua portuguesa. O corpus utilizado nos experimentos consiste de um extrato do corpus NILC (Núcleo Inter

Mostrar registro completo

Arquivos deste item

Nome: Informacoeslingui ...

Tamanho: 639.9Kb

Formato: PDF

Descrição: Informacoeslingui ...

Visualizar/Abrir

Este item aparece na(s) seguinte(s) coleção(s)

PPG Computação Aplicada [363]
PPG Computação Aplicada

Buscar

Navegar

Todo o repositório
- Comunidades e Coleções
Esta coleção

Minha conta

Estatística

Ver as estatísticas de uso

Uso de informações lingüísticas na etapa de pré - processamento em mineração de textos

Uso de informações lingüísticas na etapa de pré - processamento em mineração de textos

Resumo:

Arquivos deste item

Este item aparece na(s) seguinte(s) coleção(s)

Buscar

Navegar

Todo o repositório

Esta coleção

Minha conta

Estatística