|
|
Registro Completo |
Biblioteca(s): |
Embrapa Agricultura Digital. |
Data corrente: |
25/11/2008 |
Data da última atualização: |
31/01/2020 |
Tipo da produção científica: |
Artigo em Anais de Congresso / Nota Técnica |
Autoria: |
NOGUEIRA, B. M.; MOURA, M. F.; CONRADO, M. da S.; ROSSI, R. G.; MARCACINI, R. M.; REZENDE, S. O. |
Afiliação: |
BRUNO MAGALHÃES NOGUEIRA, USP; MARIA FERNANDA MOURA, CNPTIA; MERLEY DA SILVA CONRADO, USP; RAFAEL GERALDELI ROSSI, USP; RICARDO MARCONDES MARCACINI, USP; SOLANGE OLIVEIRA REZENDE, USP. |
Título: |
Winning some of the document preprocessing challenges in a text mining process. |
Ano de publicação: |
2008 |
Fonte/Imprenta: |
In: SIMPÓSIO BRASILEIRO DE BANCO DE DADOS, 23.; SIMPÓSIO BRASILEIRO DE ENGENHARIA DE SOFTWARE, 22.; WORKSHOP EM ALGORITMOS E APLICAÇÕES DE MINERAÇÃO DE DADOS, 4., 2008, Campinas. Anais... Campinas: UNICAMP, Instituto de Computação, 2008. |
Páginas: |
p. 10-18. |
Idioma: |
Inglês |
Conteúdo: |
Considering the huge growth of the number of documents in the digital universe and the possibility of obtaining some competitive advantage in processing them, this paper describes some of the difficulties of working with text collections. More specifically, it shows some of the challenges on the step considered one of the most important of the Text Mining process - the data preprocessing - focusing on two of its main tasks: attribute generation and selection, considering not only single terms but composed terms too. In order to overcome the challenges imposed by these problems, this paper presents efficient unsupervised solutions. The application of these solutions in three real data sets is presented in order to evaluate them and to show a way to treat the data step by step. Good results were obtained at the end of the whole process. |
Palavras-Chave: |
Dados semânticos; Mineração de textos; Text mining. |
Categoria do assunto: |
X Pesquisa, Tecnologia e Engenharia |
URL: |
https://ainfo.cnptia.embrapa.br/digital/bitstream/item/80367/1/winning.pdf
|
Marc: |
LEADER 01679nam a2200217 a 4500 001 1005283 005 2020-01-31 008 2008 bl uuuu u00u1 u #d 100 1 $aNOGUEIRA, B. M. 245 $aWinning some of the document preprocessing challenges in a text mining process.$h[electronic resource] 260 $aIn: SIMPÓSIO BRASILEIRO DE BANCO DE DADOS, 23.; SIMPÓSIO BRASILEIRO DE ENGENHARIA DE SOFTWARE, 22.; WORKSHOP EM ALGORITMOS E APLICAÇÕES DE MINERAÇÃO DE DADOS, 4., 2008, Campinas. Anais... Campinas: UNICAMP, Instituto de Computação$c2008 300 $ap. 10-18. 520 $aConsidering the huge growth of the number of documents in the digital universe and the possibility of obtaining some competitive advantage in processing them, this paper describes some of the difficulties of working with text collections. More specifically, it shows some of the challenges on the step considered one of the most important of the Text Mining process - the data preprocessing - focusing on two of its main tasks: attribute generation and selection, considering not only single terms but composed terms too. In order to overcome the challenges imposed by these problems, this paper presents efficient unsupervised solutions. The application of these solutions in three real data sets is presented in order to evaluate them and to show a way to treat the data step by step. Good results were obtained at the end of the whole process. 653 $aDados semânticos 653 $aMineração de textos 653 $aText mining 700 1 $aMOURA, M. F. 700 1 $aCONRADO, M. da S. 700 1 $aROSSI, R. G. 700 1 $aMARCACINI, R. M. 700 1 $aREZENDE, S. O.
Download
Esconder MarcMostrar Marc Completo |
Registro original: |
Embrapa Agricultura Digital (CNPTIA) |
|
Biblioteca |
ID |
Origem |
Tipo/Formato |
Classificação |
Cutter |
Registro |
Volume |
Status |
URL |
Voltar
|
|
Registros recuperados : 171 | |
13. | | KALIL FILHO, A. N.; CLEMENT, C. R. Pupunha. In: LOPES, R.; OLIVEIRA, M. do S. P. de; CAVALLARI, M. M.; BARBIERI, R. L.; CONCEIÇÃO, L. D. H. C. S. da. (Ed.). Palmeiras nativas do Brasil. Brasília, DF: Embrapa, 2015. Cap. 11. p. 339-368.Tipo: Capítulo em Livro Técnico-Científico |
Biblioteca(s): Embrapa Florestas. |
| |
15. | | KALIL FILHO, A. N.; POLTRONIERI, M. C. Flutuação estacional de mandarova em viveiro de seringueira em Altamira, PA. In: SIMPÓSIO DO TRÓPICO ÚMIDO, 1., 1984, Belém, PA. Resumos. Belém, PA: EMBRAPA-CPATU, 1984. p. 247. (EMBRAPA-CPATU. Documentos, 31).Biblioteca(s): Embrapa Amazônia Oriental. |
| |
Registros recuperados : 171 | |
|
Expressão de busca inválida. Verifique!!! |
|
|