Portal do Governo Brasileiro
BDPA - Bases de Dados da Pesquisa Agropecuária Embrapa
 






Registro Completo
Biblioteca(s):  Embrapa Agricultura Digital.
Data corrente:  25/11/2008
Data da última atualização:  31/01/2020
Tipo da produção científica:  Artigo em Anais de Congresso / Nota Técnica
Autoria:  NOGUEIRA, B. M.; MOURA, M. F.; CONRADO, M. da S.; ROSSI, R. G.; MARCACINI, R. M.; REZENDE, S. O.
Afiliação:  BRUNO MAGALHÃES NOGUEIRA, USP; MARIA FERNANDA MOURA, CNPTIA; MERLEY DA SILVA CONRADO, USP; RAFAEL GERALDELI ROSSI, USP; RICARDO MARCONDES MARCACINI, USP; SOLANGE OLIVEIRA REZENDE, USP.
Título:  Winning some of the document preprocessing challenges in a text mining process.
Ano de publicação:  2008
Fonte/Imprenta:  In: SIMPÓSIO BRASILEIRO DE BANCO DE DADOS, 23.; SIMPÓSIO BRASILEIRO DE ENGENHARIA DE SOFTWARE, 22.; WORKSHOP EM ALGORITMOS E APLICAÇÕES DE MINERAÇÃO DE DADOS, 4., 2008, Campinas. Anais... Campinas: UNICAMP, Instituto de Computação, 2008.
Páginas:  p. 10-18.
Idioma:  Inglês
Conteúdo:  Considering the huge growth of the number of documents in the digital universe and the possibility of obtaining some competitive advantage in processing them, this paper describes some of the difficulties of working with text collections. More specifically, it shows some of the challenges on the step considered one of the most important of the Text Mining process - the data preprocessing - focusing on two of its main tasks: attribute generation and selection, considering not only single terms but composed terms too. In order to overcome the challenges imposed by these problems, this paper presents efficient unsupervised solutions. The application of these solutions in three real data sets is presented in order to evaluate them and to show a way to treat the data step by step. Good results were obtained at the end of the whole process.
Palavras-Chave:  Dados semânticos; Mineração de textos; Text mining.
Categoria do assunto:  X Pesquisa, Tecnologia e Engenharia
URL:  https://ainfo.cnptia.embrapa.br/digital/bitstream/item/80367/1/winning.pdf
Marc:  Mostrar Marc Completo
Registro original:  Embrapa Agricultura Digital (CNPTIA)
Biblioteca ID Origem Tipo/Formato Classificação Cutter Registro Volume Status URL
CNPTIA12368 - 2UPCAA - DD
Voltar






Ordenar por: RelevânciaAutorTítuloAnoImprime registros no formato resumido      Imprime registros no formato resumido
Registros recuperados : 1
Primeira ... 1 ... Última
1.Imagem marcado/desmarcadoNOGUEIRA, B. M.; MOURA, M. F.; CONRADO, M. da S.; ROSSI, R. G.; MARCACINI, R. M.; REZENDE, S. O. Winning some of the document preprocessing challenges in a text mining process. In: SIMPÓSIO BRASILEIRO DE BANCO DE DADOS, 23.; SIMPÓSIO BRASILEIRO DE ENGENHARIA DE SOFTWARE, 22.; WORKSHOP EM ALGORITMOS E APLICAÇÕES DE MINERAÇÃO DE DADOS, 4., 2008, Campinas. Anais... Campinas: UNICAMP, Instituto de Computação, 2008. p. 10-18.
Tipo: Artigo em Anais de Congresso / Nota Técnica
Biblioteca(s): Embrapa Agricultura Digital.
Visualizar detalhes do registroAcesso ao objeto digitalImprime registro no formato completo
Registros recuperados : 1
Primeira ... 1 ... Última
Nenhum registro encontrado para a expressão de busca informada.
 
 

Embrapa
Todos os direitos reservados, conforme Lei n° 9.610
Política de Privacidade
Área Restrita

Embrapa Agricultura Digital
Av. André Tosello, 209 - Barão Geraldo
Caixa Postal 6041- 13083-886 - Campinas, SP
SAC: https://www.embrapa.br/fale-conosco

Valid HTML 4.01 Transitional