|
|
Registro Completo |
Biblioteca(s): |
Embrapa Agricultura Digital. |
Data corrente: |
12/04/2011 |
Data da última atualização: |
12/04/2011 |
Tipo da produção científica: |
Boletim de Pesquisa e Desenvolvimento |
Autoria: |
MOURA, M. F.; NOGUEIRA, B. M.; CONRADO, M. da S.; SANTOS, F. F. dos; REZENDE, S. O. |
Afiliação: |
MARIA FERNANDA MOURA, CNPTIA; BRUNO MAGALHÃES NOGUEIRA, USP; MERLEY DA SILVA CONRADO, USP; FABIANO FERNADES DOS SANTOS, ICMC/USP; SOLANGE OLIVEIRA REZENDE, ICMC/USP. |
Título: |
Um modelo para a seleção de n-gramas significativos e não redundantes em tarefas de mineração de textos. |
Ano de publicação: |
2010 |
Fonte/Imprenta: |
Campinas: Embrapa Informática Agropecuária, 2010. |
Páginas: |
37 p. il. |
Série: |
(Embrapa Informática Agropecuária. Boletim de pesquisa e desenvolvimento, 23). |
Idioma: |
Português |
Conteúdo: |
Uma proposta completa para resolver o problema de selecionar automaticamente atributos não redundantes do tipo n-gramas é apresentada neste trabalho. Geralmente, o uso de n-gramas é um requisito para melhorar a interpretação subjetiva dos resultados em tarefas de mineração de textos, nesses casos, eles são estatisticamente gerados e selecionados. Após a seleção, em geral, há a presença de redundâncias, por exemplo, o termo "informática agropecuária" e seus componentes "informática" e "agropecuária". Assim, propõe-se um modelo que envolve a remoção de stopwords estatisticamente identificadas, uma seleção estatística eficiente para os atributos do tipo n-grama e a remoção das redundâncias apresentadas após a seleção. Observa-se, pelos resultados experimentais apresentados, sobre os atributos originais e os atributos sem as redundâncias, que, como esperado, após a eliminação das redundâncias não há perda de representatividade. Além disso, a redução no número de atributos é expressiva, o que pode significar ganhos em desempenho nas tarefas de extração de padrões, bem como na interpretabilidade subjetiva dos resultados. Deve-se salientar que o método proposto é útil a qualquer algoritmo de aprendizado de máquina aplicado a uma tarefa de mineração de textos, e, parece ser igualmente aplicável a textos em quaisquer línguas. |
Palavras-Chave: |
Atributos redundantes; Attribute selection; Categorical data; Dados categorizados; Mineração de textos; N-gramas; N-grams; Recuperação da informação; Redundant attribute; Seleção de atributos; Text mining. |
Thesaurus Nal: |
Information retrieval. |
Categoria do assunto: |
X Pesquisa, Tecnologia e Engenharia |
URL: |
https://ainfo.cnptia.embrapa.br/digital/bitstream/item/32458/1/BolPesq23.pdf
|
Marc: |
LEADER 02446nam a2200325 a 4500 001 1885611 005 2011-04-12 008 2010 bl uuuu u0uu1 u #d 100 1 $aMOURA, M. F. 245 $aUm modelo para a seleção de n-gramas significativos e não redundantes em tarefas de mineração de textos.$h[electronic resource] 260 $aCampinas: Embrapa Informática Agropecuária$c2010 300 $a37 p. il. 490 $a(Embrapa Informática Agropecuária. Boletim de pesquisa e desenvolvimento, 23). 520 $aUma proposta completa para resolver o problema de selecionar automaticamente atributos não redundantes do tipo n-gramas é apresentada neste trabalho. Geralmente, o uso de n-gramas é um requisito para melhorar a interpretação subjetiva dos resultados em tarefas de mineração de textos, nesses casos, eles são estatisticamente gerados e selecionados. Após a seleção, em geral, há a presença de redundâncias, por exemplo, o termo "informática agropecuária" e seus componentes "informática" e "agropecuária". Assim, propõe-se um modelo que envolve a remoção de stopwords estatisticamente identificadas, uma seleção estatística eficiente para os atributos do tipo n-grama e a remoção das redundâncias apresentadas após a seleção. Observa-se, pelos resultados experimentais apresentados, sobre os atributos originais e os atributos sem as redundâncias, que, como esperado, após a eliminação das redundâncias não há perda de representatividade. Além disso, a redução no número de atributos é expressiva, o que pode significar ganhos em desempenho nas tarefas de extração de padrões, bem como na interpretabilidade subjetiva dos resultados. Deve-se salientar que o método proposto é útil a qualquer algoritmo de aprendizado de máquina aplicado a uma tarefa de mineração de textos, e, parece ser igualmente aplicável a textos em quaisquer línguas. 650 $aInformation retrieval 653 $aAtributos redundantes 653 $aAttribute selection 653 $aCategorical data 653 $aDados categorizados 653 $aMineração de textos 653 $aN-gramas 653 $aN-grams 653 $aRecuperação da informação 653 $aRedundant attribute 653 $aSeleção de atributos 653 $aText mining 700 1 $aNOGUEIRA, B. M. 700 1 $aCONRADO, M. da S. 700 1 $aSANTOS, F. F. dos 700 1 $aREZENDE, S. O.
Download
Esconder MarcMostrar Marc Completo |
Registro original: |
Embrapa Agricultura Digital (CNPTIA) |
|
Biblioteca |
ID |
Origem |
Tipo/Formato |
Classificação |
Cutter |
Registro |
Volume |
Status |
URL |
Voltar
|
|
Registro Completo
Biblioteca(s): |
Embrapa Arroz e Feijão. |
Data corrente: |
29/05/1998 |
Data da última atualização: |
28/02/2019 |
Tipo da produção científica: |
Resumo em Anais de Congresso |
Autoria: |
GUIMARÃES, C. M.; BELHASSEN, E.; BEVITORI, R.; ANTAL, J. B.; CASTIGLIONI, V. B. |
Afiliação: |
CLEBER MORAIS GUIMARAES, CNPAF; ROSANGELA BEVITORI, CNPAF; VANIA BEATRIZ RODRIGUES CASTIGLIONI, CNPSo. |
Título: |
Efeito da deficiência hídrica em híbridos de girassol. |
Ano de publicação: |
1995 |
Fonte/Imprenta: |
In: REUNIAO NACIONAL DE PESQUISA DE GIRASSOL, 11., 1995, Goiania. Resumos. Goiania: EMBRAPA-CNPAF: EMGOPA, 1995. |
Páginas: |
p. 62-63. |
Idioma: |
Português |
Conteúdo: |
Objetivando selecionar genótipos de girassol mais adaptados a essas condições climáticas, estudou-se o efeito da deficiência hídrica durante a fase reprodutiva, por ser a mais susceptível a seca, de oito híbridos. |
Thesagro: |
Cerrado; Deficiência Hídrica; Girassol; Hibrido. |
Categoria do assunto: |
F Plantas e Produtos de Origem Vegetal |
URL: |
https://ainfo.cnptia.embrapa.br/digital/bitstream/item/162067/1/CNPAF-1995-p610001.pdf
|
Marc: |
LEADER 00856nam a2200217 a 4500 001 1204843 005 2019-02-28 008 1995 bl uuuu u00u1 u #d 100 1 $aGUIMARÃES, C. M. 245 $aEfeito da deficiência hídrica em híbridos de girassol. 260 $aIn: REUNIAO NACIONAL DE PESQUISA DE GIRASSOL, 11., 1995, Goiania. Resumos. Goiania: EMBRAPA-CNPAF: EMGOPA$c1995 300 $ap. 62-63. 520 $aObjetivando selecionar genótipos de girassol mais adaptados a essas condições climáticas, estudou-se o efeito da deficiência hídrica durante a fase reprodutiva, por ser a mais susceptível a seca, de oito híbridos. 650 $aCerrado 650 $aDeficiência Hídrica 650 $aGirassol 650 $aHibrido 700 1 $aBELHASSEN, E. 700 1 $aBEVITORI, R. 700 1 $aANTAL, J. B. 700 1 $aCASTIGLIONI, V. B.
Download
Esconder MarcMostrar Marc Completo |
Registro original: |
Embrapa Arroz e Feijão (CNPAF) |
|
Biblioteca |
ID |
Origem |
Tipo/Formato |
Classificação |
Cutter |
Registro |
Volume |
Status |
Fechar
|
Nenhum registro encontrado para a expressão de busca informada. |
|
|