04531nam a2200301 a 450000100080000000500110000800800410001910000200006024501400008026000160022030000110023650002130024752034090046065000160386965000190388565000220390465000130392665000420393965000250398165000180400665000140402465000230403865300200406165300200408165300310410165300520413265300450418420941712018-08-16 2015 bl uuuu m 00u1 u #d1 aSILVA, J. M. da aDetecção de variações genômicas em bovinos da raça nelore usando dados de genotipagem e ressequenciamento.h[electronic resource] a2015.c2015 a107 p. aTese (Doutorado em Genética e Biologia Molecular) - Instituto de Biologia, Universidade Estadual de Campinas, Campinas. Orientador: Michel Eduardo Beleza Yamagishi, Coorientador: Alexandre Rodrigues Caetano. aResumo: Os grandes avanços tecnológicos têm permitido o uso da genotipagem e do ressequenciamento para o estudo de variações genômicas que compreendem polimorfismos de base única (Single Nucleotide Polimorphism - SNP), pequenas inserções ou deleções, variações no número de cópias de alelos no genoma (Copy Number Variation - CNV) e uma gama de variantes estruturais. Esses avanços permitem uma análise completa do genoma com boa resolução e um custo cada vez mais baixo para ambas as tecnologias. O presente trabalho tem como objetivo detectar variações genômicas em bovinos da raça Nelore usando dados de genotipagem e ressequenciamento. Utilizamos dados genotípicos de 1.709 animais machos da raça Nelore genotipados com um chip de alta densidade com 777.962 marcadores SNPs e oito animais fundadores dessa população foram genotipados e ressequenciados com cobertura mínima de 20X. Inicialmente, usamos os Missing Genotypes, marcadores que falham em toda a população, para avaliar se eles contêm informações biológicas relevantes. Investigamos 3.200 SNPs que falharam consistentemente na população. Descobrimos que existe um total de 3.300 novos SNPs em Nelore. A anotação gênica mostrou que 31% desses novos SNPs estão em regiões gênicas e esses genes podem ser de interesse para os programas de melhoramento de gado de acordo com a literatura especializada. Sugerimos que a metodologia dos Missing Genotypes pode ser aplicada em saúde humana como possíveis marcadores para doenças genéticas hereditárias, doenças raras e doenças provenientes de mutações somáticas como o câncer. Além disso, o estudo de CNV (Copy Number Variation) permitiu o desenvolvimento de um novo algoritmo para agrupar CNV provenientes de dados de genotipagem e/ou ressequenciamento em CNV Region (CNVR). O algoritmo foi implementado em um web server Java-Merging Copy Number Variants (JM-CNV). Esse possui interface amigável, é de livre acesso e, parametrizável de modo que outros pesquisadores possam adaptá-lo às suas necessidades. Além disso, o arquivo de saída produzido pode ser facimente carregado no Genome Browser, o que facilita a visualização e o processo de curadoria manual. Comparamos o JM-CNV com outros dois softwares, o HD-CNV e o CNVRuler, com o mesmo propósito descrito acima. O JM-CNV se mostrou mais rápido e mais eficiente em resolver o agrupamento de CNVR em regiões complexas. Para a detecção de CNVs em Nelore usamos o software PennCNV para os dados de genotipagem e o software LUMPY para dados de ressequenciamento. Identificamos 68.007 regiões candidatas à CNVs nos 29 cromossomos autossomos, as quais foram agrupadas em 7.319 regiões de CNVs (CNVR) pelo JM-CNV. Usando o software LUMPY e os oito animais ressequenciados, detectamos 13.122 CNVs, as quais foram agrupadas em 3.648 regiões de CNVs (CNVR) pelo JM-CNV. Os dados de ressequenciamento nos permitiu validar 909 CNVs detectadas na genotipagem e outras 111 foram confirmadas fazendo uso da literatura, perfazendo um total de 1.020 CNVs validadas, que possuem diversos genes e QTLs anotados. O nosso estudo enriquece o mapa de variações genômicas do genoma bovino, em especial para a raça Nelore e fornece uma série de informações que podem subsidiar futuras pesquisas de associação entre CNVs e caraterísticas de interesse dos programas de melhoramento bovino aBeef cattle aBioinformatics aComputer software aGenotype aHigh-throughput nucleotide sequencing aNucleotide sequences aGado de Corte aGenótipo aMarcador Molecular aBioinformática aBovino de corte aDNA copy number variations aSequenciamento de nucleotídeos em larga escala aVariações do número de cópias de DNA