02611nam a2200241 a 450000100080000000500110000800800410001910000230006024501620008326000250024530000210027050001670029152017650045865000100222365300120223365300170224565300190226265300180228165300160229965300300231565300090234565300150235410289832005-05-23 2001 bl uuuu m 00u1 u #d1 aTEIXEIRA, R. de A. aTreinamento de redes neurais artificiais através de otimização multi-objetivobuma nova abordagem para o equilíbrio entre a polarização e a variância. aBelo Horizontec2001 a168 p.c1 CD-ROM aTese ( Doutorado ) - Universidade Federal de Minas Gerais. Orientador: Antônio de Pádua Braga. Co-Orientadores : Ricardo H. C. Takahashi e Rodney R. Saldanha. aNeste trabalho é desenvolvido um novo método para treinamento de Redes Neurais Artifi ciais (RNAs) do tipo Perceptron Multi-camadas (Multilayer Perceptron-MLP) utilizando- se técnicas de otimização multi-objetivo para encontrar soluções com alta capacidade de generalização. Na abordagem proposta, além de ser utilizado o erro quadrático como função de custo, utiliza-se também a função norma do vetor de pesos como um segundo objetivo. Estas duas funções são minimizadas e como consequência deste processo, obtém-se um conjunto de soluções chamadas Pareto-ótimas. Através de um decisor, estas soluções são avaliadas e apenas uma delas é escolhida como solução final, a qual equilibra os efeitos da polarização e da variância resultando em alta capacidade de generalização dada uma determinada realização do conjunto de treinamento. O método multi-objetivo proposto controla a flexibilidade do modelo independente- mente da quantidade de pesos existente na rede, a partir de uma estrutura mínima. Além disso, a utilização de parâmetros de treinamento apesar de ser necessária, influencia pouco a solução final, o que faz com que a escolha destes parâmetros seja uma tarefa simples. Além do algoritmo multi-objetivo proposto e do algoritmo Backpropagation, métodos conhecidos os quais também visam ao aumento da capacidade de generalização como 10-Fold Cross-Validation, Early Stopping, Optimal Brain Damage, Weight Decay e Support Vector Machines são abordados. Uma análise qualitativa e quantitativa dos algoritmos é feita, através da qual pode-se observar a superioridade do método proposto, sendo o mesmo capaz de gerar soluções com alta capacidade de generalização de forma simples e eficiente. aVetor adecisor aotimização aPareto-ótimas apolarização aquadrático aRedes Neurais Artificiais aRNAs avariância