01853nam a2200229 a 450000100080000000500110000800800410001902000220006010000170008224501490009926001220024830000130037050000620038352009990044565300290144465300280147365300260150165300340152765300270156165300160158870000190160418673452020-01-15 2010 bl uuuu u00u1 u #d a978-85-7669-250-81 aMOURA, M. F. aContribuições para a construção de taxonomias de tópicos em domínios restritos utilizando aprendizado estatístico.h[electronic resource] aIn: JOINT CONFERENCE, 2010, São Bernardo do Campo. Proceedings... [S.l.]: Sociedade Brasileira de Computaçãoc2010 ap. 1-12. aCTDIA 2010. VII Best MSc Dissertation/PhD Thesis Contest. aEste trabalho tem como tema principal uma abordagem para a construção de taxonomias de tópicos em domínios de conhecimento restritos, cuja principal novidade é a integração de técnicas em etapas muito bem de?nidas, com várias contribuições inovadoras ao longo das mesmas. Dentre essas contribuições tem-se uma seleção de atributos multi-palavras e uma seleção de descritores para agrupamentos hierárquicos de documentos, processo conhecido por rotulação de agrupamentos. O método de seleção de atributos multi-palavras (n-gramas) baseia-se no pressuposto que a redundância é inerente à sua natureza estocástica e que a eliminação desta não traz perda de representatividade ao conjunto de atributos. Os dois métodos de rotulação propostos identi?cam unicamente cada grupo formado, observado por meio da forma de validação comparativa dos resultados dos métodos com dois outros da literatura; e tendo o segundo método proposto atingido os melhores resultados. aAprendizado estatístico aMétodos de rotulação aMineração de textos aOrganização da informação aTaxonomias de tópicos aText mining1 aREZENDE, S. O.