|
|
Registro Completo |
Biblioteca(s): |
Embrapa Agricultura Digital. |
Data corrente: |
27/01/2011 |
Data da última atualização: |
13/04/2011 |
Tipo da produção científica: |
Software |
Autoria: |
MOURA, M. F.; MAGALHÃES, R. B. |
Afiliação: |
MARIA FERNANDA MOURA, CNPTIA; RODRIGO BUSTAMANTE MAGALHÃES, IC/UNICAMP, Estagiário/CNPTIA. |
Título: |
NGramSel - N-gram Selection. Versão 1.0. |
Ano de publicação: |
2010 |
Fonte/Imprenta: |
Campinas: Embrapa Informática Agropecuária, 2010. |
Descrição Física: |
1 CD-ROM. |
Idioma: |
Português |
Conteúdo: |
Este software seleciona n-gramas que sejam estatisticamente considerados significantes em uma coleção de textos. Neste contexto, n-gramas foram considerados como combinações de palavras de uma coleção de textos, por exemplo: "informática", "agropecuária", "informática agropecuária'", "desenvolvimento da informática agropecuária". Um n-grama é considerado estatisticamente significante em uma coleção de textos se a sua ocorrência não é aleatória e tem algum peso na coleção, por exemplo, o n-grama "informática agropecuária" provavelmente não é aleatório, porém "inteligência agropecuária" poderia ser. Para testar a hipótese de relevância/significância utilizam-se testes de interdependência entre as partes do n-grama em relação a todos os n-gramas obtidos a partir da coleção de textos., e, para tal, vários métodos podem ser empregados. Este software implementa o método proposto por seus autores, com um algoritmo muito simples e computacionalmente eficiente, que decompõe os n-gramas em n-gramas mais simples e os testa do mais simples para os mais complexos, considerando apenas os formados pelos mais simples e estatisticamente significantes; e, utilizando um teste estatístico robusto, o Q de Yule aplicado à decomposição de tabelas de contingência. Os dados de entrada são matrizes do tipo atributo-valor para a coleção de textos completa e cada conjunto de n-gramas. A saída são novas matrizes atributo-valor com apenas os n-gramas de interesse. |
Palavras-Chave: |
Algoritmo; Mineração de textos; N-gramas; Recuperação da informação; Software. |
Thesaurus Nal: |
Algorithms; Information retrieval. |
Categoria do assunto: |
X Pesquisa, Tecnologia e Engenharia |
Marc: |
LEADER 02091nam a2200217 a 4500 001 1874799 005 2011-04-13 008 2010 bl uuuu u0uu1 u #d 100 1 $aMOURA, M. F. 245 $aNGramSel - N-gram Selection. Versão 1.0. 260 $aCampinas: Embrapa Informática Agropecuária$c2010 300 $c1 CD-ROM. 520 $aEste software seleciona n-gramas que sejam estatisticamente considerados significantes em uma coleção de textos. Neste contexto, n-gramas foram considerados como combinações de palavras de uma coleção de textos, por exemplo: "informática", "agropecuária", "informática agropecuária'", "desenvolvimento da informática agropecuária". Um n-grama é considerado estatisticamente significante em uma coleção de textos se a sua ocorrência não é aleatória e tem algum peso na coleção, por exemplo, o n-grama "informática agropecuária" provavelmente não é aleatório, porém "inteligência agropecuária" poderia ser. Para testar a hipótese de relevância/significância utilizam-se testes de interdependência entre as partes do n-grama em relação a todos os n-gramas obtidos a partir da coleção de textos., e, para tal, vários métodos podem ser empregados. Este software implementa o método proposto por seus autores, com um algoritmo muito simples e computacionalmente eficiente, que decompõe os n-gramas em n-gramas mais simples e os testa do mais simples para os mais complexos, considerando apenas os formados pelos mais simples e estatisticamente significantes; e, utilizando um teste estatístico robusto, o Q de Yule aplicado à decomposição de tabelas de contingência. Os dados de entrada são matrizes do tipo atributo-valor para a coleção de textos completa e cada conjunto de n-gramas. A saída são novas matrizes atributo-valor com apenas os n-gramas de interesse. 650 $aAlgorithms 650 $aInformation retrieval 653 $aAlgoritmo 653 $aMineração de textos 653 $aN-gramas 653 $aRecuperação da informação 653 $aSoftware 700 1 $aMAGALHÃES, R. B.
Download
Esconder MarcMostrar Marc Completo |
Registro original: |
Embrapa Agricultura Digital (CNPTIA) |
|
Biblioteca |
ID |
Origem |
Tipo/Formato |
Classificação |
Cutter |
Registro |
Volume |
Status |
URL |
Voltar
|
|
Registros recuperados : 47 | |
9. | | CAMPOS, A. R.; LARA, F. M.; WAQUIL, J. M.; MAGALHAES, R. O.; F. JUNIOR, A. Comportamento de genótipos de sorgo granífero em relação a mosca do sorgo, Contarinia sorghicola (Coquilett, 1898) (Diptera, cecidomyiidae) e seus parasitóides na região de Ilha Solteira (SP). In: CONGRESSO BRASILEIRO DE ENTOMOLOGIA, 13.; SIMPOSIO INTERNACIONAL SOBRE BICUDO DO ALGODOEIRO, 1.; ENCONTRO SOBRE COCHONILHA DA PALMA FORRAGEIRA, 2.; ENCONTRO SOBRE MOSCAS-DAS-FRUTAS, 3., 1991, Recife. Resumos. Recife: Sociedade Entomológica do Brasil, 1991. v. 2, p. 550.Tipo: Resumo em Anais de Congresso |
Biblioteca(s): Embrapa Milho e Sorgo. |
| |
11. | | MAGALHÃES, R. T.; GONÇALVES, L. C.; BORGES, I.; RODRIGUES, J. A. S.; FONSECA, J. F. Produção e composição bromatológica de vinte e cinco genótipos de sorgo (Sorghum bicolor (L.) Moench). Arquivo Brasileiro de Medicina Veterinária e Zootecnia, Belo Horizonte, v. 62, n. 3, p. 747-751, 2010.Tipo: Artigo em Periódico Indexado | Circulação/Nível: A - 2 |
Biblioteca(s): Embrapa Milho e Sorgo. |
| |
15. | | BATISTA, D. da C.; ANDRADE, J. N; BARBOSA, M. A. G.; MAGALHÃES, R. P. Sobrevivência de fitopatógenos em restos de cultura da mangueira expostos a radiação solar. In: CONGRESSO BRASILEIRO DE FRUTICULTURA, 25.; REUNIÃO ANUAL DA SOCIEDADE INTERAMERICANA DE HORTICULTURA TROPICAL, 63., 2017, Porto Seguro. Grandes desafios, ciência e conhecimento para inovação.Porto Seguro: SBF: ISTH: SBFPO: ABH, 2017.Tipo: Resumo em Anais de Congresso |
Biblioteca(s): Embrapa Semiárido. |
| |
17. | | BATISTA, D. da C.; ANDRADE, J. N.; BARBOSA, M. A. G.; MAGALHÃES, R. P. Uso de fungicidas para prevenção de morte súbita em mudas de mangueira. In: CONGRESSO BRASILEIRO DE FRUTICULTURA, 25.; REUNIÃO ANUAL DA SOCIEDADE INTERAMERICANA DE HORTICULTURA TROPICAL, 63., 2017, Porto Seguro. Grandes desafios, ciência e conhecimento para inovação.Porto Seguro: SBF: ISTH: SBFPO: ABH, 2017.Tipo: Resumo em Anais de Congresso |
Biblioteca(s): Embrapa Semiárido. |
| |
18. | | MAGALHÃES, R. T. de; COELHO, O. C.; BENKO, J. S.; COSTA, K. A. de P.; OLIVEIRA, I. P. de. Avaliação das características físicas do solo submetidos ao cultivo de pastagens nas áreas do Campus II da U. C. G. In: INTERNATIONAL SYMPOSIUM SOIL FUNCTIONING UNDER PASTURES IN INTERTROPICAL AREAS, 2000, Brasilia, DF. Extended abstracts. Planaltina, DF: Embrapa Cerrados, 2000. 4 p. 1 CD-ROM.Tipo: Artigo em Anais de Congresso / Nota Técnica |
Biblioteca(s): Embrapa Arroz e Feijão. |
| |
19. | | RAPOSO, T. P.; MAGALHÃES, R. S.; SOUZA, J. R. de; MINGOTTE, F. L. C.; CASTRO, G. S. A.; CARVALHO, A. Alteração da agregação de um latossolo vermelho-amarelo em função do preparo físico. Science and Technology Innovation in Agronomy, Bebedouro, v. 2, n. 1, p. 72-82, mar. 2018. p. 72-82Tipo: Artigo em Periódico Indexado |
Biblioteca(s): Embrapa Territorial. |
| |
20. | | MAGALHÃES, R. de S. C. de; VILLELA, J. C. B.; CASSANA, F.; MISTURA, C.; HEIDEN, G.; BARBIERI, R. L. Etnobotânica de butiá em área urbana, balneário Laranjal, Pelotas-RS In: SIMPÓSIO DE RECURSOS GENÉTICOS PARA A AMÉRICA LATINA E CARIBE, 10., 2015, Bento Gonçalves. Recursos genéticos no século 21: de Vavilov a Svalbard. Anais... [s.l.]: Sociedade Brasileira de Recursos Genéticos, 2015.Tipo: Resumo em Anais de Congresso |
Biblioteca(s): Embrapa Clima Temperado. |
| |
Registros recuperados : 47 | |
|
Nenhum registro encontrado para a expressão de busca informada. |
|
|