|
|
Registros recuperados : 41 | |
22. | | RODRIGUES, L. S.; SINOARA, R. A.; REZENDE, S. O.; MARCACINI, R. M.; MOURA, M. F. Identificação de Pontos Perceptualmente Importantes (PIP) em séries temporais de tópicos extraídos de dados textuais. In: MOSTRA DE ESTAGIÁRIOS E BOLSISTAS DA EMBRAPA INFORMÁTICA AGROPECUÁRIA, 11., 2015, Campinas. Resumos expandidos... Brasília, DF: Embrapa, 2015. p. 38-44. Biblioteca(s): Embrapa Agricultura Digital. |
| |
24. | | MOURA, M. F.; MARCACINI, R. M.; NOGUEIRA, B. M.; CONRADO, M. da S.; REZENDE, S. O. A proposal for building domain topic taxonomies. In: WORKSHOP ON WEB AND TEXT INTELLIGENCE, 1.; SIMPÓSIO BRASILEIRO EM INTELIGÊNCIA ARTIFICIAL, 19., 2008, Salvador: Proceedings... São Carlos: ICMC/USP, 2008. p. 83-84. Biblioteca(s): Embrapa Agricultura Digital. |
| |
27. | | SILVA JÚNIOR, E. L.; SINOARA, R. A.; REZENDE, S. O.; MARCACINI, R. M.; MOURA, M. F. Uma ferramenta para expansão do vocabulário com base em coocorrência. In: MOSTRA DE ESTAGIÁRIOS E BOLSISTAS DA EMBRAPA INFORMÁTICA AGROPECUÁRIA, 11., 2015, Campinas. Resumos expandidos... Brasília, DF: Embrapa, 2015. p. 11-16. Biblioteca(s): Embrapa Agricultura Digital. |
| |
29. | | SANTOS, F. F. dos; DOMINGUES, M. A.; SUNDERMANN, C. V.; CARVALHO, V. O. de; MOURA, M. F.; REZENDE, S. O. Latent association rule cluster based model to extract topics for classification and recommendation applications. Expert Systems with Applications, New York, v. 112, n. 1, p. 34-60, Dec. 2018. Biblioteca(s): Embrapa Agricultura Digital. |
| |
32. | | NOGUEIRA, B. M.; MOURA, M. F.; CONRADO, M. da S.; ROSSI, R. G.; MARCACINI, R. M.; REZENDE, S. O. Winning some of the document preprocessing challenges in a text mining process. In: SIMPÓSIO BRASILEIRO DE BANCO DE DADOS, 23.; SIMPÓSIO BRASILEIRO DE ENGENHARIA DE SOFTWARE, 22.; WORKSHOP EM ALGORITMOS E APLICAÇÕES DE MINERAÇÃO DE DADOS, 4., 2008, Campinas. Anais... Campinas: UNICAMP, Instituto de Computação, 2008. p. 10-18. Biblioteca(s): Embrapa Agricultura Digital. |
| |
33. | | MOURA, M. F.; TARARAM, G.; SILVA, L. A.; GONZALES, L. E.; TAKEMURA, C. M.; REZENDE, S. O.; MARCACINI, R. M.; SANTOS, F. F. dos; EVANGELISTA, S. R. M. CRITIC 1.0: ambiente web para busca e análise da informação utilizada ou produzida pela Rede AgroHidro. In: SEMINÁRIO DA REDE AGROHIDRO, 3.; WORKSHOP DO PROJETO OS IMPACTOS DA AGRICULTURA E DAS MUDANÇAS CLIMÁTICAS NOS RECURSOS HÍDRICOS, 1., 2015, Corumbá. Água na agricultura: desafios frente às mudanças climáticas e de uso da terra: resumos. Brasília, DF: Embrapa, 2015. p. 30. Biblioteca(s): Embrapa Agricultura Digital. |
| |
34. | | MOURA, M. F.; TARARAM, G.; SILVA, L. A.; GONZALES, L. E.; TAKEMURA, C. M.; REZENDE, S. O.; MARCACINI, R. M.; SANTOS, F. F. DOS; EVANGELISTA, S. R. M. CRITIC 1.0: Ambiente Web para Busca e Análise da Informação Utilizada ou Produzida pela Rede AgroHidro. In: SEMINÁRIO DA REDE AGROHIDRO, 3.; WORKSHOP DO PROJETO OS IMPACTOS DA AGRICULTURA E DAS MUDANÇAS CLIMÁTICAS NOS RECURSOS HÍDRICOS, 1., 2015, Corumbá. Água na agricultura: desafios frente às mudanças climáticas e de uso da terra: resumos. Brasília, DF: Embrapa, 2015. p. 30 Biblioteca(s): Embrapa Territorial. |
| |
35. | | MOURA, M. F.; MERCANTI, E.; PEIXOTO, B. M.; MARCACINI, R. M.; TAMADA, T.; LIMA, A. F.; SANTOS, F. F. dos; REZENDE, S. O.; HIGA, R. H. TaxEdit - Taxonomy Editor V 3.0. Versão 1.0. Campinas: Embrapa Informática Agropecuária, 2012. 1 CD-ROM. Biblioteca(s): Embrapa Agricultura Digital. |
| |
36. | | MOURA, M. F.; PEREIRA, R. G.; TARARAM, G. M.; GONZALES, L. E.; TAKEMURA, C. M.; OLIVEIRA, S. R. de M.; EVANGELISTA, S. R. M.; REZENDE, S. O.; SANTOS, F. F. dos. Compilação e análise da informação utilizada ou produzida pela rede Agrohidro. In: SEMINÁRIO DA REDE AGROHIDRO, 4., 2016, Brasília, DF. Água e agricultura: incertezas e desafios para a sustentabilidade frente às mudanças do clima e do uso da terra: anais. Brasília, DF: Embrapa, 2016. p. 52-58. Biblioteca(s): Embrapa Territorial. |
| |
37. | | MOURA, M. F.; PEREIRA, R. G.; TARARAM, G. M.; GONZALES, L. E.; TAKEMURA, C. M.; OLIVEIRA, S. R. de M.; EVANGELISTA, S. R. M.; REZENDE, S. O.; SANTOS, F. F. dos. Compilação e análise da informação utilizada ou produzida pela rede Agrohidro. In: SEMINÁRIO DA REDE AGROHIDRO, 4., 2016, Brasília, DF. Água e agricultura: incertezas e desafios para a sustentabilidade frente às mudanças do clima e do uso da terra: anais. Brasília, DF: Embrapa, 2016. p. 52-58. Biblioteca(s): Embrapa Cerrados. |
| |
38. | | MOURA, M. F.; PEREIRA, R. G.; TARARAM, G. M.; GONZALES, L. E.; TAKEMURA, C. M.; OLIVEIRA, S. R. de M.; EVANGELISTA, S. R. M.; REZENDE, S. O.; SANTOS, F. F. dos. Compilação e análise da informação utilizada ou produzida pela rede Agrohidro. In: SEMINÁRIO DA REDE AGROHIDRO, 4., 2016, Brasília, DF. Água e agricultura: incertezas e desafios para a sustentabilidade frente às mudanças do clima e do uso da terra: anais. Brasília, DF: Embrapa, 2016. p. 52-58. Biblioteca(s): Embrapa Agricultura Digital. |
| |
39. | | MOURA, M. F.; TARARAM, G. M.; MARCACINI, R. M.; GONZALES, L. E.; TAKEMURA, C. M.; SILVA, L. E. A.; SANTOS, F. F. dos; REZENDE, S. O.; EVANGELISTA, S. R. M. Um software para recuperar e analisar artigos Open Access em agricultura utilizando técnicas de mineração de textos. In: CONGRESSO BRASILEIRO DE AGROINFORMÁTICA, 10., 2015, Ponta Grossa. Uso de VANTs e sensores para avanços no agronegócio: anais. Ponta Grossa: Universidade Estadual de Ponta Grossa, 2015. Não paginado. SBIAgro 2015. Biblioteca(s): Embrapa Agricultura Digital; Embrapa Territorial. |
| |
40. | | GONZALES, L. E.; MOURA, M. F.; TARARAM, G.; SILVA, L. E. A.; TAKEMURA, C. M.; REZENDE, S. O.; MARCACINI, R. M.; SANTOS, F. F. dos; EVANGELISTA, S. R. M. CRITIC - Compilação e Recuperação de Informação Técnico-científica e Indução ao Conhecimento. Versão 1.0. Campinas: Embrapa Informática Agropecuária, 2015. 1 CD-ROM. Biblioteca(s): Embrapa Agricultura Digital. |
| |
Registros recuperados : 41 | |
|
|
Registro Completo
Biblioteca(s): |
Embrapa Agricultura Digital. |
Data corrente: |
12/04/2011 |
Data da última atualização: |
12/04/2011 |
Tipo da produção científica: |
Boletim de Pesquisa e Desenvolvimento |
Autoria: |
MOURA, M. F.; NOGUEIRA, B. M.; CONRADO, M. da S.; SANTOS, F. F. dos; REZENDE, S. O. |
Afiliação: |
MARIA FERNANDA MOURA, CNPTIA; BRUNO MAGALHÃES NOGUEIRA, USP; MERLEY DA SILVA CONRADO, USP; FABIANO FERNADES DOS SANTOS, ICMC/USP; SOLANGE OLIVEIRA REZENDE, ICMC/USP. |
Título: |
Um modelo para a seleção de n-gramas significativos e não redundantes em tarefas de mineração de textos. |
Ano de publicação: |
2010 |
Fonte/Imprenta: |
Campinas: Embrapa Informática Agropecuária, 2010. |
Páginas: |
37 p. il. |
Série: |
(Embrapa Informática Agropecuária. Boletim de pesquisa e desenvolvimento, 23). |
Idioma: |
Português |
Conteúdo: |
Uma proposta completa para resolver o problema de selecionar automaticamente atributos não redundantes do tipo n-gramas é apresentada neste trabalho. Geralmente, o uso de n-gramas é um requisito para melhorar a interpretação subjetiva dos resultados em tarefas de mineração de textos, nesses casos, eles são estatisticamente gerados e selecionados. Após a seleção, em geral, há a presença de redundâncias, por exemplo, o termo "informática agropecuária" e seus componentes "informática" e "agropecuária". Assim, propõe-se um modelo que envolve a remoção de stopwords estatisticamente identificadas, uma seleção estatística eficiente para os atributos do tipo n-grama e a remoção das redundâncias apresentadas após a seleção. Observa-se, pelos resultados experimentais apresentados, sobre os atributos originais e os atributos sem as redundâncias, que, como esperado, após a eliminação das redundâncias não há perda de representatividade. Além disso, a redução no número de atributos é expressiva, o que pode significar ganhos em desempenho nas tarefas de extração de padrões, bem como na interpretabilidade subjetiva dos resultados. Deve-se salientar que o método proposto é útil a qualquer algoritmo de aprendizado de máquina aplicado a uma tarefa de mineração de textos, e, parece ser igualmente aplicável a textos em quaisquer línguas. |
Palavras-Chave: |
Atributos redundantes; Attribute selection; Categorical data; Dados categorizados; Mineração de textos; N-gramas; N-grams; Recuperação da informação; Redundant attribute; Seleção de atributos; Text mining. |
Thesaurus NAL: |
Information retrieval. |
Categoria do assunto: |
X Pesquisa, Tecnologia e Engenharia |
URL: |
https://ainfo.cnptia.embrapa.br/digital/bitstream/item/32458/1/BolPesq23.pdf
|
Marc: |
LEADER 02446nam a2200325 a 4500 001 1885611 005 2011-04-12 008 2010 bl uuuu u0uu1 u #d 100 1 $aMOURA, M. F. 245 $aUm modelo para a seleção de n-gramas significativos e não redundantes em tarefas de mineração de textos.$h[electronic resource] 260 $aCampinas: Embrapa Informática Agropecuária$c2010 300 $a37 p. il. 490 $a(Embrapa Informática Agropecuária. Boletim de pesquisa e desenvolvimento, 23). 520 $aUma proposta completa para resolver o problema de selecionar automaticamente atributos não redundantes do tipo n-gramas é apresentada neste trabalho. Geralmente, o uso de n-gramas é um requisito para melhorar a interpretação subjetiva dos resultados em tarefas de mineração de textos, nesses casos, eles são estatisticamente gerados e selecionados. Após a seleção, em geral, há a presença de redundâncias, por exemplo, o termo "informática agropecuária" e seus componentes "informática" e "agropecuária". Assim, propõe-se um modelo que envolve a remoção de stopwords estatisticamente identificadas, uma seleção estatística eficiente para os atributos do tipo n-grama e a remoção das redundâncias apresentadas após a seleção. Observa-se, pelos resultados experimentais apresentados, sobre os atributos originais e os atributos sem as redundâncias, que, como esperado, após a eliminação das redundâncias não há perda de representatividade. Além disso, a redução no número de atributos é expressiva, o que pode significar ganhos em desempenho nas tarefas de extração de padrões, bem como na interpretabilidade subjetiva dos resultados. Deve-se salientar que o método proposto é útil a qualquer algoritmo de aprendizado de máquina aplicado a uma tarefa de mineração de textos, e, parece ser igualmente aplicável a textos em quaisquer línguas. 650 $aInformation retrieval 653 $aAtributos redundantes 653 $aAttribute selection 653 $aCategorical data 653 $aDados categorizados 653 $aMineração de textos 653 $aN-gramas 653 $aN-grams 653 $aRecuperação da informação 653 $aRedundant attribute 653 $aSeleção de atributos 653 $aText mining 700 1 $aNOGUEIRA, B. M. 700 1 $aCONRADO, M. da S. 700 1 $aSANTOS, F. F. dos 700 1 $aREZENDE, S. O.
Download
Esconder MarcMostrar Marc Completo |
Registro original: |
Embrapa Agricultura Digital (CNPTIA) |
|
Biblioteca |
ID |
Origem |
Tipo/Formato |
Classificação |
Cutter |
Registro |
Volume |
Status |
Fechar
|
Nenhum registro encontrado para a expressão de busca informada. |
|
|