|
|
Registro Completo |
Biblioteca(s): |
Embrapa Agricultura Digital. |
Data corrente: |
12/04/2011 |
Data da última atualização: |
12/04/2011 |
Tipo da produção científica: |
Boletim de Pesquisa e Desenvolvimento |
Autoria: |
MOURA, M. F.; NOGUEIRA, B. M.; CONRADO, M. da S.; SANTOS, F. F. dos; REZENDE, S. O. |
Afiliação: |
MARIA FERNANDA MOURA, CNPTIA; BRUNO MAGALHÃES NOGUEIRA, USP; MERLEY DA SILVA CONRADO, USP; FABIANO FERNADES DOS SANTOS, ICMC/USP; SOLANGE OLIVEIRA REZENDE, ICMC/USP. |
Título: |
Um modelo para a seleção de n-gramas significativos e não redundantes em tarefas de mineração de textos. |
Ano de publicação: |
2010 |
Fonte/Imprenta: |
Campinas: Embrapa Informática Agropecuária, 2010. |
Páginas: |
37 p. il. |
Série: |
(Embrapa Informática Agropecuária. Boletim de pesquisa e desenvolvimento, 23). |
Idioma: |
Português |
Conteúdo: |
Uma proposta completa para resolver o problema de selecionar automaticamente atributos não redundantes do tipo n-gramas é apresentada neste trabalho. Geralmente, o uso de n-gramas é um requisito para melhorar a interpretação subjetiva dos resultados em tarefas de mineração de textos, nesses casos, eles são estatisticamente gerados e selecionados. Após a seleção, em geral, há a presença de redundâncias, por exemplo, o termo "informática agropecuária" e seus componentes "informática" e "agropecuária". Assim, propõe-se um modelo que envolve a remoção de stopwords estatisticamente identificadas, uma seleção estatística eficiente para os atributos do tipo n-grama e a remoção das redundâncias apresentadas após a seleção. Observa-se, pelos resultados experimentais apresentados, sobre os atributos originais e os atributos sem as redundâncias, que, como esperado, após a eliminação das redundâncias não há perda de representatividade. Além disso, a redução no número de atributos é expressiva, o que pode significar ganhos em desempenho nas tarefas de extração de padrões, bem como na interpretabilidade subjetiva dos resultados. Deve-se salientar que o método proposto é útil a qualquer algoritmo de aprendizado de máquina aplicado a uma tarefa de mineração de textos, e, parece ser igualmente aplicável a textos em quaisquer línguas. |
Palavras-Chave: |
Atributos redundantes; Attribute selection; Categorical data; Dados categorizados; Mineração de textos; N-gramas; N-grams; Recuperação da informação; Redundant attribute; Seleção de atributos; Text mining. |
Thesaurus Nal: |
Information retrieval. |
Categoria do assunto: |
X Pesquisa, Tecnologia e Engenharia |
URL: |
https://ainfo.cnptia.embrapa.br/digital/bitstream/item/32458/1/BolPesq23.pdf
|
Marc: |
LEADER 02446nam a2200325 a 4500 001 1885611 005 2011-04-12 008 2010 bl uuuu u0uu1 u #d 100 1 $aMOURA, M. F. 245 $aUm modelo para a seleção de n-gramas significativos e não redundantes em tarefas de mineração de textos.$h[electronic resource] 260 $aCampinas: Embrapa Informática Agropecuária$c2010 300 $a37 p. il. 490 $a(Embrapa Informática Agropecuária. Boletim de pesquisa e desenvolvimento, 23). 520 $aUma proposta completa para resolver o problema de selecionar automaticamente atributos não redundantes do tipo n-gramas é apresentada neste trabalho. Geralmente, o uso de n-gramas é um requisito para melhorar a interpretação subjetiva dos resultados em tarefas de mineração de textos, nesses casos, eles são estatisticamente gerados e selecionados. Após a seleção, em geral, há a presença de redundâncias, por exemplo, o termo "informática agropecuária" e seus componentes "informática" e "agropecuária". Assim, propõe-se um modelo que envolve a remoção de stopwords estatisticamente identificadas, uma seleção estatística eficiente para os atributos do tipo n-grama e a remoção das redundâncias apresentadas após a seleção. Observa-se, pelos resultados experimentais apresentados, sobre os atributos originais e os atributos sem as redundâncias, que, como esperado, após a eliminação das redundâncias não há perda de representatividade. Além disso, a redução no número de atributos é expressiva, o que pode significar ganhos em desempenho nas tarefas de extração de padrões, bem como na interpretabilidade subjetiva dos resultados. Deve-se salientar que o método proposto é útil a qualquer algoritmo de aprendizado de máquina aplicado a uma tarefa de mineração de textos, e, parece ser igualmente aplicável a textos em quaisquer línguas. 650 $aInformation retrieval 653 $aAtributos redundantes 653 $aAttribute selection 653 $aCategorical data 653 $aDados categorizados 653 $aMineração de textos 653 $aN-gramas 653 $aN-grams 653 $aRecuperação da informação 653 $aRedundant attribute 653 $aSeleção de atributos 653 $aText mining 700 1 $aNOGUEIRA, B. M. 700 1 $aCONRADO, M. da S. 700 1 $aSANTOS, F. F. dos 700 1 $aREZENDE, S. O.
Download
Esconder MarcMostrar Marc Completo |
Registro original: |
Embrapa Agricultura Digital (CNPTIA) |
|
Biblioteca |
ID |
Origem |
Tipo/Formato |
Classificação |
Cutter |
Registro |
Volume |
Status |
URL |
Voltar
|
|
Registros recuperados : 16 | |
2. | | SILVA, V. A.; BERTECHINI, A. G.; NOGUEIRA, B. R. F.; MAZZUCO, H.; RIBEIRO, H. V. Comparison of selenium sources and time of supplementation on performance, lipids peroxides and tissue selenium concentration in broilers. In: PSA ANNUAL MEETING, 2014, Corpus Christi. Abstracts... Champaign: Poultry Science Association, 2014. p. 155. Publicado em: Poultry Science, v. 93, E-Suppl. 1, 2014.Tipo: Resumo em Anais de Congresso |
Biblioteca(s): Embrapa Suínos e Aves. |
| |
3. | | MOURA, M. F.; MARCACINI, R. M.; NOGUEIRA, B. M.; CONRADO, M. da S.; REZENDE, S. O. A proposal for building domain topic taxonomies. In: WORKSHOP ON WEB AND TEXT INTELLIGENCE, 1.; SIMPÓSIO BRASILEIRO EM INTELIGÊNCIA ARTIFICIAL, 19., 2008, Salvador: Proceedings... São Carlos: ICMC/USP, 2008. p. 83-84.Tipo: Resumo em Anais de Congresso |
Biblioteca(s): Embrapa Agricultura Digital. |
| |
4. | | MAIONE, N. R.; GAMBETTA, R.; SECCHI, A. R.; NOGUEIRA, B. L.; PACHECO, T. F.; RODRIGUES, D. de S. Avaliação da severidade do processo organosolv sobre a hidrólise enzimática de bagaço de cana-de-açúcar. In: CONGRESSO BRASILEIRO DE ENGENHARIA QUÍMICA - COBEQ, 22.; Encontro Brasileiro sobre o Ensino de Engenharia Química - ENBEQ, 17., 2018, São Paulo, SP. Anais ... São Paulo: ABEQ, 2018. Não paginado.Tipo: Artigo em Anais de Congresso |
Biblioteca(s): Embrapa Agroenergia. |
| |
5. | | NOGUEIRA, B. de A.; CARMO, H. F. do; SOUSA, R. N. de; XIMENES, P. A.; LEANDRO, W. M. Altura de plantas de duas variedades de mamona (ricinus communis l.) cultivadas sob diferentes níveis de fósforo nos cerrados. In: CONGRESSO BRASILEIRO DE MAMONA, 4.; SIMPÓSIO INTERNACIONAL DE OLEAGINOSAS ENERGÉTICAS, 1., 2010, João Pessoa. Inclusão social e energia: anais. Campina Grande: Embrapa Algodão, 2010.Biblioteca(s): Embrapa Algodão. |
| |
6. | | PEREIRA, M. B.; NOGUEIRA, B. L.; RODRIGUES, D. de S.; MONTANO, I. D. C.; SUAREZ, C. A. G. Celulases imobilizadas para a hidrólise de biomassa. In: ENCONTRO REGIONAL DE CATÁLISE, 13., 2018, São Carlos, SP. [Anais ...]. São Paulo: ABEQ, 2018. Não paginado.Tipo: Resumo em Anais de Congresso |
Biblioteca(s): Embrapa Agroenergia. |
| |
8. | | NOGUEIRA, B. L.; SECCHI, A. R.; MACHADO, F.; RODRIGUES, C. V. S.; GAMBETTA, R.; RODRIGUES, D. S. Improvement of enzymatic saccharification by simultaneous pulping of sugarcane bagasse and washing of its cellulose fibers in a batch reactor. Biotechnology Journal, v. 18, n. 8, 2200542, Aug. 2023.Tipo: Artigo em Periódico Indexado | Circulação/Nível: A - 2 |
Biblioteca(s): Embrapa Agroenergia. |
| |
9. | | PEREIRA, M. B.; NOGUEIRA, B. L.; RODRIGUES, D. de S.; MONTANO, I. D. C.; GALEANO SUAREZ, C. A. Imobilização sequencial de enzimas celulolíticas. In: ENCONTRO DE PESQUISA E INOVAÇÃO DA EMBRAPA AGROENERGIA, 5., 2018, Brasília, DF. Anais ... Brasília, DF: Embrapa Agroenergia, 2018. p. 41.Tipo: Resumo em Anais de Congresso |
Biblioteca(s): Embrapa Agroenergia. |
| |
10. | | NOGUEIRA, B. L.; CORREA, P. C.; CAMPOS, S. de C.; OLIVEIRA, G. H. H.; BAPTESTINI, F. M. Influência do Teor de Água e do Estádio de Maturação na Taxa Respiratória do Café In: SIMPÓSIO DE PESQUISA DOS CAFÉS DO BRASIL, 7, 2011, Araxá, MG. Anais... Araxá: VII Simpósio de Pesquisa dos Cafés do Brasil, 2011Tipo: Resumo em Anais de Congresso |
Biblioteca(s): Embrapa Agrossilvipastoril. |
| |
12. | | NOGUEIRA, B. M.; MOURA, M. F.; CONRADO, M. da S.; ROSSI, R. G.; MARCACINI, R. M.; REZENDE, S. O. Winning some of the document preprocessing challenges in a text mining process. In: SIMPÓSIO BRASILEIRO DE BANCO DE DADOS, 23.; SIMPÓSIO BRASILEIRO DE ENGENHARIA DE SOFTWARE, 22.; WORKSHOP EM ALGORITMOS E APLICAÇÕES DE MINERAÇÃO DE DADOS, 4., 2008, Campinas. Anais... Campinas: UNICAMP, Instituto de Computação, 2008. p. 10-18.Tipo: Artigo em Anais de Congresso / Nota Técnica |
Biblioteca(s): Embrapa Agricultura Digital. |
| |
13. | | MARIA, L. P.; FREITAS, L. F. V. B. de; NOGUEIRA, B. R. F.; LEME, B. B.; SAKOMURA, N. K.; KRABBE, E. L. Efeito da associação de níveis de proteína e probiótico sobre o desempenho de frangos de corte desafiados por eimeria máxima. In: JORNADA DE INICIAÇÃO CIENTÍFICA, 15., 2021, Concórdia. Anais... Concórdia: Embrapa Suínos e Aves: UNC, 2021. p. 51-52.Tipo: Artigo em Anais de Congresso |
Biblioteca(s): Embrapa Suínos e Aves. |
| |
14. | | CAMARGO, L. S. de A.; SIQUEIRA, L. G. B.; SARAIVA, N. Z.; MAIA, G.; NOGUEIRA, B.; QUINTAO, C. C. R.; OLIVEIRA, C. S. Effect of physiological heat stress on HSP70 and CASPASE 3 levels in bovine oocytes. In: ANNUAL CONFERENCE, 52., 2019, San Jose. Beyond possible: remarkable transformation of reproductive biology: abstracts. San Jose: Society for the Study of Reproduction, 2019.Tipo: Resumo em Anais de Congresso |
Biblioteca(s): Embrapa Gado de Leite. |
| |
15. | | CAMPOS, S. de C.; Correa, P. C.; Rodrigues, A. P. L.; Nogueira, B. L.; Botelho, F. M.; Oliveira, G. H. H. Perda de água e coeficiente de transpiração de goiabas em relação à superfície-volume. Revista Brasileira de Armazenamento, v. 36, n. 2, p. 195-202, 2011. 36 195-202Tipo: Artigo em Periódico Indexado | Circulação/Nível: B - 3 |
Biblioteca(s): Embrapa Agrossilvipastoril. |
| |
16. | | AMARAL, D. L.; ZANETTE, R. S.; ALMEIDA, C. G.; ALMEIDA, L. B.; OLIVEIRA, L. F.; MARCOMINI, R. F.; NOGUEIRA, B. V.; SANTOS, M. O.; BRANDAO, H. de M.; MARANDUBA, C. M. C.; MUNK, M. In vitro evaluation of barium titanate nanoparticle/alginate 3D scaffold for osteogenic human stem cell differentiation. Biomedical Materials, v. 14, article 035011, 2019.Tipo: Artigo em Periódico Indexado | Circulação/Nível: A - 2 |
Biblioteca(s): Embrapa Gado de Leite. |
| |
Registros recuperados : 16 | |
|
Nenhum registro encontrado para a expressão de busca informada. |
|
|