Registro Completo |
Biblioteca(s): |
Embrapa Cerrados. |
Data corrente: |
13/11/2001 |
Data da última atualização: |
13/11/2001 |
Autoria: |
PRADO, H. A. do. |
Título: |
Orpheo: uma estrutura de trabalho para integracao dos paradigmas de aprendizado supervisionado e nao-supervisionado. |
Ano de publicação: |
2001 |
Fonte/Imprenta: |
Porto Alegre: UFRGS, 2001. |
Páginas: |
150p. |
Idioma: |
Português |
Notas: |
Tese Doutorado. |
Conteúdo: |
Esta tese apresenta contribuicoes ao processo de Descoberta de Conhecimento em Bases de Dados(DCBD). DCBD pode ser entendido como um conjunto de tecnicas automatizadas - ou semi-automatizadas - otimizadas para extrair conhecimento a partir de grandes bases de dados. Assim, o ja, de longa data, praticado processo de descoberta de conhecimento passa a contar com aprimoramentos que tornam mais facil de ser realizado. A partir dessa visao , bem conhecidos algortimos de Estatistica e de Aprendizado de Maquina passam a funcionar com desempenho aceitavel sobre bases de dados cada vez maiores. Da mesma forma , tarefas como coleta, limpeza e transformacao de dados e selecao de atributos, parametros e modelos recebem um suporte que facilita cada vez mais a sua execucao. a contribuicao principal deta tese consiste na aplicacao dessa visao para a otimizacao da descoberta de conhecimento a partir de dados nao-classificados. Adicionalmente sao apresentadas algumas contribuicoes sobre o Modelo Neural Combinatorio (MNC), um sistema hibrido neurossimbolico para classificacao que elegemos como foco de trabalho. Quanto a principal contribuicao, percebeu-se que a descoberta de conhecimento a partir de dados nao-classificados, em geral, e dividida em dois subprocessos: identificacao de agrupamentos (aprendizado nao-supervisionado) seguida de classificacao (aprendizado supervisionado). Esses subprocessos correspondem as tarefas de rotulagem ds itens de dados e obtencao das correlacoes entre os atributos da entrada e os rotulos. Nao encontramos outra razao para que haja essa separacao que as limitacoes inerentes aos algoritmos especificos. Uma dessas limitacoes, por exemplo, e a necessidade de iteracao de muitos deles buscando a convergencia para um determinado modelo. Isto obriga a que o algoritmo realize varias leituras da base de dados, o que, para Mineracao de Dados, e proibitivo. A partir dos avancos em DCBD, particulamente com o desenvolvimento de algoritmos de aprendizado que realizam sua tarefa em apenas uma leitura dos dados, fica evidente a possibilidade de se reduzir o numero de acessos na realizacao do processo completo. Nossa contribuicao, nesse caso, se materializa na proposta de uma estrutura de trabalho para integracao dos dois paradigmase a implantacao de um prototipo dessa estrutura utilizando-se os algoritmos de aprendizado ART1, para identificacao de agrupamentos, e MNC, para a tarefa de classificacao . E tambem apresentada uma aplicacao no mapeamento de areas homigeneas de plantio trigo no Brasil, de 1975 a 1999. Com reacors a contribuicoes sobreo MNC sao apresentados: (a) uma variante do algoritmo de treinamento que permite uma reducao significatica do tamanho do modelo apos o aprendizado; (b) um estudo sobre a reducao da complexibilidade do modelo com o uso de maquinas de comite; (c) uma tecnica, usando o metodo do envoltorio, para poda controlada do modelo final e (d) uma abordagem para tratamento de inconsistencias e perda de conhecimento que podem ocorrer na construcao do modelo. MenosEsta tese apresenta contribuicoes ao processo de Descoberta de Conhecimento em Bases de Dados(DCBD). DCBD pode ser entendido como um conjunto de tecnicas automatizadas - ou semi-automatizadas - otimizadas para extrair conhecimento a partir de grandes bases de dados. Assim, o ja, de longa data, praticado processo de descoberta de conhecimento passa a contar com aprimoramentos que tornam mais facil de ser realizado. A partir dessa visao , bem conhecidos algortimos de Estatistica e de Aprendizado de Maquina passam a funcionar com desempenho aceitavel sobre bases de dados cada vez maiores. Da mesma forma , tarefas como coleta, limpeza e transformacao de dados e selecao de atributos, parametros e modelos recebem um suporte que facilita cada vez mais a sua execucao. a contribuicao principal deta tese consiste na aplicacao dessa visao para a otimizacao da descoberta de conhecimento a partir de dados nao-classificados. Adicionalmente sao apresentadas algumas contribuicoes sobre o Modelo Neural Combinatorio (MNC), um sistema hibrido neurossimbolico para classificacao que elegemos como foco de trabalho. Quanto a principal contribuicao, percebeu-se que a descoberta de conhecimento a partir de dados nao-classificados, em geral, e dividida em dois subprocessos: identificacao de agrupamentos (aprendizado nao-supervisionado) seguida de classificacao (aprendizado supervisionado). Esses subprocessos correspondem as tarefas de rotulagem ds itens de dados e obtencao das correlacoes entre os a... Mostrar Tudo |
Palavras-Chave: |
Computacao; Computer applications; Inteligencia artificial. |
Categoria do assunto: |
-- |
Marc: |
LEADER 03545nam a2200169 a 4500 001 1558129 005 2001-11-13 008 2001 bl uuuu m 00u1 u #d 100 1 $aPRADO, H. A. do 245 $aOrpheo$buma estrutura de trabalho para integracao dos paradigmas de aprendizado supervisionado e nao-supervisionado. 260 $aPorto Alegre: UFRGS$c2001 300 $a150p. 500 $aTese Doutorado. 520 $aEsta tese apresenta contribuicoes ao processo de Descoberta de Conhecimento em Bases de Dados(DCBD). DCBD pode ser entendido como um conjunto de tecnicas automatizadas - ou semi-automatizadas - otimizadas para extrair conhecimento a partir de grandes bases de dados. Assim, o ja, de longa data, praticado processo de descoberta de conhecimento passa a contar com aprimoramentos que tornam mais facil de ser realizado. A partir dessa visao , bem conhecidos algortimos de Estatistica e de Aprendizado de Maquina passam a funcionar com desempenho aceitavel sobre bases de dados cada vez maiores. Da mesma forma , tarefas como coleta, limpeza e transformacao de dados e selecao de atributos, parametros e modelos recebem um suporte que facilita cada vez mais a sua execucao. a contribuicao principal deta tese consiste na aplicacao dessa visao para a otimizacao da descoberta de conhecimento a partir de dados nao-classificados. Adicionalmente sao apresentadas algumas contribuicoes sobre o Modelo Neural Combinatorio (MNC), um sistema hibrido neurossimbolico para classificacao que elegemos como foco de trabalho. Quanto a principal contribuicao, percebeu-se que a descoberta de conhecimento a partir de dados nao-classificados, em geral, e dividida em dois subprocessos: identificacao de agrupamentos (aprendizado nao-supervisionado) seguida de classificacao (aprendizado supervisionado). Esses subprocessos correspondem as tarefas de rotulagem ds itens de dados e obtencao das correlacoes entre os atributos da entrada e os rotulos. Nao encontramos outra razao para que haja essa separacao que as limitacoes inerentes aos algoritmos especificos. Uma dessas limitacoes, por exemplo, e a necessidade de iteracao de muitos deles buscando a convergencia para um determinado modelo. Isto obriga a que o algoritmo realize varias leituras da base de dados, o que, para Mineracao de Dados, e proibitivo. A partir dos avancos em DCBD, particulamente com o desenvolvimento de algoritmos de aprendizado que realizam sua tarefa em apenas uma leitura dos dados, fica evidente a possibilidade de se reduzir o numero de acessos na realizacao do processo completo. Nossa contribuicao, nesse caso, se materializa na proposta de uma estrutura de trabalho para integracao dos dois paradigmase a implantacao de um prototipo dessa estrutura utilizando-se os algoritmos de aprendizado ART1, para identificacao de agrupamentos, e MNC, para a tarefa de classificacao . E tambem apresentada uma aplicacao no mapeamento de areas homigeneas de plantio trigo no Brasil, de 1975 a 1999. Com reacors a contribuicoes sobreo MNC sao apresentados: (a) uma variante do algoritmo de treinamento que permite uma reducao significatica do tamanho do modelo apos o aprendizado; (b) um estudo sobre a reducao da complexibilidade do modelo com o uso de maquinas de comite; (c) uma tecnica, usando o metodo do envoltorio, para poda controlada do modelo final e (d) uma abordagem para tratamento de inconsistencias e perda de conhecimento que podem ocorrer na construcao do modelo. 653 $aComputacao 653 $aComputer applications 653 $aInteligencia artificial
Download
Esconder MarcMostrar Marc Completo |
Registro original: |
Embrapa Cerrados (CPAC) |
|