|
|
Registro Completo |
Biblioteca(s): |
Embrapa Agricultura Digital. |
Data corrente: |
12/04/2011 |
Data da última atualização: |
12/04/2011 |
Tipo da produção científica: |
Boletim de Pesquisa e Desenvolvimento |
Autoria: |
MOURA, M. F.; NOGUEIRA, B. M.; CONRADO, M. da S.; SANTOS, F. F. dos; REZENDE, S. O. |
Afiliação: |
MARIA FERNANDA MOURA, CNPTIA; BRUNO MAGALHÃES NOGUEIRA, USP; MERLEY DA SILVA CONRADO, USP; FABIANO FERNADES DOS SANTOS, ICMC/USP; SOLANGE OLIVEIRA REZENDE, ICMC/USP. |
Título: |
Um modelo para a seleção de n-gramas significativos e não redundantes em tarefas de mineração de textos. |
Ano de publicação: |
2010 |
Fonte/Imprenta: |
Campinas: Embrapa Informática Agropecuária, 2010. |
Páginas: |
37 p. il. |
Série: |
(Embrapa Informática Agropecuária. Boletim de pesquisa e desenvolvimento, 23). |
Idioma: |
Português |
Conteúdo: |
Uma proposta completa para resolver o problema de selecionar automaticamente atributos não redundantes do tipo n-gramas é apresentada neste trabalho. Geralmente, o uso de n-gramas é um requisito para melhorar a interpretação subjetiva dos resultados em tarefas de mineração de textos, nesses casos, eles são estatisticamente gerados e selecionados. Após a seleção, em geral, há a presença de redundâncias, por exemplo, o termo "informática agropecuária" e seus componentes "informática" e "agropecuária". Assim, propõe-se um modelo que envolve a remoção de stopwords estatisticamente identificadas, uma seleção estatística eficiente para os atributos do tipo n-grama e a remoção das redundâncias apresentadas após a seleção. Observa-se, pelos resultados experimentais apresentados, sobre os atributos originais e os atributos sem as redundâncias, que, como esperado, após a eliminação das redundâncias não há perda de representatividade. Além disso, a redução no número de atributos é expressiva, o que pode significar ganhos em desempenho nas tarefas de extração de padrões, bem como na interpretabilidade subjetiva dos resultados. Deve-se salientar que o método proposto é útil a qualquer algoritmo de aprendizado de máquina aplicado a uma tarefa de mineração de textos, e, parece ser igualmente aplicável a textos em quaisquer línguas. |
Palavras-Chave: |
Atributos redundantes; Attribute selection; Categorical data; Dados categorizados; Mineração de textos; N-gramas; N-grams; Recuperação da informação; Redundant attribute; Seleção de atributos; Text mining. |
Thesaurus Nal: |
Information retrieval. |
Categoria do assunto: |
X Pesquisa, Tecnologia e Engenharia |
URL: |
https://ainfo.cnptia.embrapa.br/digital/bitstream/item/32458/1/BolPesq23.pdf
|
Marc: |
LEADER 02446nam a2200325 a 4500 001 1885611 005 2011-04-12 008 2010 bl uuuu u0uu1 u #d 100 1 $aMOURA, M. F. 245 $aUm modelo para a seleção de n-gramas significativos e não redundantes em tarefas de mineração de textos.$h[electronic resource] 260 $aCampinas: Embrapa Informática Agropecuária$c2010 300 $a37 p. il. 490 $a(Embrapa Informática Agropecuária. Boletim de pesquisa e desenvolvimento, 23). 520 $aUma proposta completa para resolver o problema de selecionar automaticamente atributos não redundantes do tipo n-gramas é apresentada neste trabalho. Geralmente, o uso de n-gramas é um requisito para melhorar a interpretação subjetiva dos resultados em tarefas de mineração de textos, nesses casos, eles são estatisticamente gerados e selecionados. Após a seleção, em geral, há a presença de redundâncias, por exemplo, o termo "informática agropecuária" e seus componentes "informática" e "agropecuária". Assim, propõe-se um modelo que envolve a remoção de stopwords estatisticamente identificadas, uma seleção estatística eficiente para os atributos do tipo n-grama e a remoção das redundâncias apresentadas após a seleção. Observa-se, pelos resultados experimentais apresentados, sobre os atributos originais e os atributos sem as redundâncias, que, como esperado, após a eliminação das redundâncias não há perda de representatividade. Além disso, a redução no número de atributos é expressiva, o que pode significar ganhos em desempenho nas tarefas de extração de padrões, bem como na interpretabilidade subjetiva dos resultados. Deve-se salientar que o método proposto é útil a qualquer algoritmo de aprendizado de máquina aplicado a uma tarefa de mineração de textos, e, parece ser igualmente aplicável a textos em quaisquer línguas. 650 $aInformation retrieval 653 $aAtributos redundantes 653 $aAttribute selection 653 $aCategorical data 653 $aDados categorizados 653 $aMineração de textos 653 $aN-gramas 653 $aN-grams 653 $aRecuperação da informação 653 $aRedundant attribute 653 $aSeleção de atributos 653 $aText mining 700 1 $aNOGUEIRA, B. M. 700 1 $aCONRADO, M. da S. 700 1 $aSANTOS, F. F. dos 700 1 $aREZENDE, S. O.
Download
Esconder MarcMostrar Marc Completo |
Registro original: |
Embrapa Agricultura Digital (CNPTIA) |
|
Biblioteca |
ID |
Origem |
Tipo/Formato |
Classificação |
Cutter |
Registro |
Volume |
Status |
URL |
Voltar
|
|
| Acesso ao texto completo restrito à biblioteca da Embrapa Soja. Para informações adicionais entre em contato com valeria.cardoso@embrapa.br. |
Registro Completo
Biblioteca(s): |
Embrapa Soja. |
Data corrente: |
08/06/2020 |
Data da última atualização: |
17/12/2020 |
Tipo da produção científica: |
Artigo em Periódico Indexado |
Circulação/Nível: |
A - 1 |
Autoria: |
MOLINARI, M. D. C.; FUGANTI-PAGLIARINI, R.; MARIN, S. R. R.; FERREIRA, L. C.; BARBOSA, D. de A. |
Afiliação: |
Mayla Daiane Correa Molinari, Universidade Estadual de Londrina, Departamento Geral de Biologia, Londrina, PR, Brazil.; Renata Fuganti-Pagliarini, Universidade Estadual de Londrina, Departamento Geral de Biologia, Londrina, PR, Brazil.; SILVANA REGINA ROCKENBACH MARIN, CNPSO; Leonardo Cesar Ferreira, Universidade Estadual de Londrina, Departamento Geral de Biologia, Londrina, PR, Brazil.; Daniel de Amorim Barbosa, 1Universidade Estadual de Londrina, Departamento Geral de Biologia, Londrina, PR, Brazil. |
Título: |
Overexpression of AtNCED3 gene improved drought tolerance in soybean in greenhouse and field conditions. |
Ano de publicação: |
2020 |
Fonte/Imprenta: |
Genetics and Molecular Biology, v. 43, n. 3, e20190292, 2020. |
DOI: |
10.1590/1678-4685-GMB-2019-0292 |
Idioma: |
Inglês |
Palavras-Chave: |
Déficit hídrico; Medições de trocas gasosas; RT-qPCR. |
Thesagro: |
Ácido Abscisico; Glycine Max. |
Thesaurus NAL: |
Abscisic acid; Gas exchange; Soil water deficit. |
Categoria do assunto: |
F Plantas e Produtos de Origem Vegetal |
Marc: |
LEADER 00848naa a2200265 a 4500 001 2123138 005 2020-12-17 008 2020 bl uuuu u00u1 u #d 024 7 $a10.1590/1678-4685-GMB-2019-0292$2DOI 100 1 $aMOLINARI, M. D. C. 245 $aOverexpression of AtNCED3 gene improved drought tolerance in soybean in greenhouse and field conditions.$h[electronic resource] 260 $c2020 650 $aAbscisic acid 650 $aGas exchange 650 $aSoil water deficit 650 $aÁcido Abscisico 650 $aGlycine Max 653 $aDéficit hídrico 653 $aMedições de trocas gasosas 653 $aRT-qPCR 700 1 $aFUGANTI-PAGLIARINI, R. 700 1 $aMARIN, S. R. R. 700 1 $aFERREIRA, L. C. 700 1 $aBARBOSA, D. de A. 773 $tGenetics and Molecular Biology$gv. 43, n. 3, e20190292, 2020.
Download
Esconder MarcMostrar Marc Completo |
Registro original: |
Embrapa Soja (CNPSO) |
|
Biblioteca |
ID |
Origem |
Tipo/Formato |
Classificação |
Cutter |
Registro |
Volume |
Status |
Fechar
|
Nenhum registro encontrado para a expressão de busca informada. |
|
|