Registro Completo |
Biblioteca(s): |
Embrapa Gado de Leite. |
Data corrente: |
25/04/2022 |
Data da última atualização: |
25/04/2022 |
Tipo da produção científica: |
Artigo em Periódico Indexado |
Autoria: |
LEAL, T. P.; FURLAN, V. C.; GOUVEIA, M. H.; DUARTE, J. M. S.; FONSECA, P. A. S.; TOU, R.; SCLIAR, M. de O.; ARAUJO, G. S. de; COSTA, L. F.; ZOLINI, C.; PEIXOTO, M. G. C. D.; CARVALHO, M. R. dos S.; LIMA-COSTA, M. F.; GILMAN, R. H.; TARAZONA-SANTOS, E.; RODRIGUES, M. R. |
Afiliação: |
THIAGO PEIXOTO LEAL, Universidade Federal de Minas Gerais; VINICIUS C. FURLAN, Universidade Federal de Minas Gerais; MATEUS HENRIQUE GOUVEIA, Universidade Federal de Minas Gerais; JULIA MARIA SARAIVA DUARTE, Universidade Federal de Minas Gerais; PABLO A. S. FONSECA, Universidade Federal de Minas Gerais; RAFAEL TOU, Universidade Federal de Minas Gerais; MARILIA DE OLIVEIRA SCLIAR, Universidade de São Paulo; GILDERLANIO SANTANA DE ARAUJO, Universidade Federal do Pará; LUCAS F. COSTA, Universidade Federal de Minas Gerais; CAMILA ZOLINI, Universidade Federal de Minas Gerais; MARIA GABRIELA CAMPOLINA D PEIXOTO, CNPGL; MARIA RAQUEL SANTOS CARVALHO, Universidade Federal de Minas Gerais; MARIA FERNANDA LIMA-COSTA, Fundação Oswaldo Cruz; ROBERT H. GILMAN, Universidad Peruana Cayetano Heredia; EDUARDO TARAZONA-SANTOS, Universidade Federal de Minas Gerais; MAÍRA RIBEIRO RODRIGUES, Universidade Federal de Minas Gerais. |
Título: |
NAToRA, a relatedness-pruning method to minimize the loss of dataset size in genetic and omics analyses. |
Ano de publicação: |
2022 |
Fonte/Imprenta: |
Computational and Structural Biotechnology Journal, v. 20, p. 1821-1828, 2022. |
DOI: |
https://doi.org/10.1016/j.csbj.2022.04.009 |
Idioma: |
Inglês |
Conteúdo: |
Genetic and omics analyses frequently require independent observations, which is not guaranteed in real datasets. When relatedness cannot be accounted for, solutions involve removing related individuals (or observations) and, consequently, a reduction of available data. We developed a network-based relatedness-pruning method that minimizes dataset reduction while removing unwanted relationships in a dataset. It uses node degree centrality metric to identify highly connected nodes (or individuals) and implements heuristics that approximate the minimal reduction of a dataset to allow its application to complex datasets. When compared with two other popular population genetics methodologies (PLINK and KING), NAToRA shows the best combination of removing all relatives while keeping the largest possible number of individuals in all datasets tested and also, with similar effects on the allele frequency spectrum and Principal Component Analysis than PLINK and KING. NAToRA is freely available, both as a standalone tool that can be easily incorporated as part of a pipeline, and as a graphical web tool that allows visualization of the relatedness networks. NAToRA also accepts a variety of relationship metrics as input, which facilitates its use. We also release a genealogies simulator software used for different tests performed in this study. |
Palavras-Chave: |
Complex network theory; Genealogies simulator; Genetic kinship; Genética de populações; Parentesco genético; Simulador de genealogias; Teoria de redes complexas. |
Thesagro: |
Genética. |
Thesaurus Nal: |
Population genetics. |
Categoria do assunto: |
X Pesquisa, Tecnologia e Engenharia |
Marc: |
null Download
Esconder MarcMostrar Marc Completo |
Registro original: |
Embrapa Gado de Leite (CNPGL) |
|