01963nam a2200277 a 450000100080000000500110000800800410001902200140006010000260007424501180010026000550021830000100027349000850028352010860036865300200145465300340147465300250150870000240153370000170155770000210157470000220159570000180161770000150163570000190165070000160166910028362024-02-28 2006 bl uuuu u0uu1 u #d a1677-92661 aOLIVEIRA, S. R. de M. aUma metodologia para seleção de parâmetros em modelos de classificação de proteínas.h[electronic resource] aCampinas: Embrapa Informática Agropecuáriac2006 a18 p. a(Embrapa Informática Agropecuária. Boletim de pesquisa e desenvolvimento, 14). aOs principais desafios relacionados ao problema de classificação de enzimas em banco de dados de estruturas de proteínas são: 1) o ruído presente nos dados; 2) o grande número de variáveis; 3) o número não-balanceado de membros por classe. Para abordar esses desafios, apresenta-se uma metodologia para seleção de parâmetros, que combina recursos de matemática (ex: Transformada Discreta do Cosseno) e da estatística (ex:.g., correlação de variáveis e amostragem com reposição). A metodologia foi validada considerando-se os três principais métodos de classificação da literatura, a saber; árvore de decisão, classificação Bayesiana e redes neurais. Os experimentos demonstram que essa metodologia é simples, eficiente e alcança resultados semelhantes àqueles obtidos pelas principais técnicas para seleção de parâmetros na literatura.Termos para indexação classificação de enzimas,predição de função de proteínas, estruturas de proteínas, banco de dados de proteínas, seleção de parâmetros, métodos para classsificação de dados. aBioinformática aClassificação de proteínas aMineração de dados1 aYAMAGISHI, M. E. B.1 aBORRO, L. C.1 aFALCAO, P. R. K.1 aSANTOS, E. H. dos1 aVIEIRA, F. D.1 aMAZONI, I.1 aJARDINE, J. G.1 aNESHICH, G.