AD
Alex Diaz-Papkovich
Author with expertise in Genomic Studies and Association Analyses
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
8
(75% Open Access)
Cited by:
243
h-index:
9
/
i10-index:
9
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Revealing multi-scale population structure in large cohorts

Alex Diaz-Papkovich et al.Sep 23, 2018
Abstract Genetic structure in large cohorts results from technical, sampling and demographic variation. Visualisation is therefore a first step in most genomic analyses. However, existing data exploration methods struggle with unbalanced sampling and the many scales of population structure. We investigate an approach to dimension reduction of genomic data that combines principal components analysis (PCA) with uniform manifold approximation and projection (UMAP) to succinctly illustrate population structure in large cohorts and capture their relationships on local and global scales. Using data from large-scale genomic datasets, we demonstrate that PCA-UMAP effectively clusters closely related individuals while placing them in a global continuum of genetic variation. This approach reveals previously overlooked subpopulations within the American Hispanic population and fine-scale relationships between geography, genotypes, and phenotypes in the UK population. This opens new lines of investigation for demographic research and statistical genetics. Given its small computational cost, PCA-UMAP also provides a general-purpose approach to exploratory analysis in population-scale datasets. Author summary Because of geographic isolation, individuals tend to be more genetically related to people living nearby than to people living far. This is an example of population structure, a situation where a large population contains subgroups that share more than the average amount of DNA. This structure can tell us about human history, and it can also have a large effect on medical studies. We use a newly developed method (UMAP) to visualize population structure from three genomic datasets. Using genotype data alone, we reveal numerous subgroups related to ancestry and correlated with traits such as white blood cell count, height, and FEV1, a measure used to detect airway obstruction. We demonstrate that UMAP reveals previously unobserved patterns and fine-scale structure. We show that visualizations work especially well in large datasets containing populations with diverse backgrounds, which are rapidly becoming more common, and that unlike other visualization methods, we can preserve intuitive connections between populations that reflect their shared ancestries. The combination of these results and the effectiveness of the strategy on large and diverse datasets make this an important approach for exploratory analysis for geneticists studying ancestral events and phenotype distributions.
0
Citation24
0
Save
88

Conserved whole-brain spatiomolecular gradients shape adult brain functional organization

Jacob Vogel et al.Sep 18, 2022
Abstract Cortical arealization arises during neurodevelopment from the confluence of molecular gradients representing patterned expression of morphogens and transcription factors. However, how these gradients relate to adult brain function, and whether they are maintained in the adult brain, remains unknown. Here we uncover three axes of topographic variation in gene expression in the adult human brain that specifically capture previously identified rostral-caudal, dorsal-ventral and medial-lateral axes of early developmental patterning. The interaction of these spatiomolecular gradients i) accurately predicts the location of unseen brain tissue samples, ii) delineates known functional territories, and iii) explains the topographical variation of diverse cortical features. The spatiomolecular gradients are distinct from canonical cortical functional hierarchies differentiating primary sensory cortex from association cortex, but radiate in parallel with the axes traversed by local field potentials along the cortex. We replicate all three molecular gradients in three independent human datasets as well as two non-human primate datasets, and find that each gradient shows a distinct developmental trajectory across the lifespan. The gradients are composed of several well known morphogens (e.g., PAX6 and SIX3 ), and a small set of genes shared across gradients are strongly enriched for multiple diseases. Together, these results provide insight into the developmental sculpting of functionally distinct brain regions, governed by three robust transcriptomic axes embedded within brain parenchyma.
88
Citation11
0
Save
0

Deciphering the functional specialization of whole-brain spatiomolecular gradients in the adult brain

Jacob Vogel et al.Jun 11, 2024
Cortical arealization arises during neurodevelopment from the confluence of molecular gradients representing patterned expression of morphogens and transcription factors. However, whether similar gradients are maintained in the adult brain remains unknown. Here, we uncover three axes of topographic variation in gene expression in the adult human brain that specifically capture previously identified rostral-caudal, dorsal-ventral, and medial-lateral axes of early developmental patterning. The interaction of these spatiomolecular gradients i) accurately reconstructs the position of brain tissue samples, ii) delineates known functional territories, and iii) can model the topographical variation of diverse cortical features. The spatiomolecular gradients are distinct from canonical cortical axes differentiating the primary sensory cortex from the association cortex, but radiate in parallel with the axes traversed by local field potentials along the cortex. We replicate all three molecular gradients in three independent human datasets as well as two nonhuman primate datasets and find that each gradient shows a distinct developmental trajectory across the lifespan. The gradients are composed of several well-known transcription factors (e.g., PAX6 and SIX3 ), and a small set of genes shared across gradients are strongly enriched for multiple diseases. Together, these results provide insight into the developmental sculpting of functionally distinct brain regions, governed by three robust transcriptomic axes embedded within brain parenchyma.
0
Citation1
0
Save
70

On the Genes, Genealogies, and Geographies of Quebec

Luke Anderson-Trocmé et al.Jul 21, 2022
Abstract Population genetic models only provide coarse representations of real-world ancestry. We use a pedigree compiled from four million parish records and genotype data from 2,276 French and 20,451 French Canadian (FC) individuals, to finely model and trace FC ancestry through space and time. The loss of ancestral French population structure and the appearance of spatial and regional structure highlights a wide range of population expansion models. Geographic features shaped migrations throughout, and we find enrichments for migration, genetic and genealogical relatedness patterns within river networks across Quebec regions. Finally, we provide a freely accessible simulated whole-genome sequence dataset with spatiotemporal metadata for 1,426,749 individuals reflecting intricate FC population structure. Such realistic populations-scale simulations provide new opportunities to investigate population genetics at an unprecedented resolution. Lay Summary We all share common ancestors ranging from a couple generations ago to hundreds of thousands of years ago. The genetic differences between individuals today mostly depends on how closely related they are. The only problem is that the actual genealogies that relate all of us are often forgotten over time. Some geneticists have tried to come up with simple models of our shared ancestry but they don’t really explain the full, rich history of humanity. Our study uses a multi-institutional project in Quebec that has digitized parish records into a single unified genealogical database that dates back to the arrival of the first French settlers four hundred years ago. This genealogy traces the ancestry of millions of French-Canadian and we have used it to build a very high resolution genetic map. We used this genetic map to study in detail how certain historical events, and landscapes have influenced the genomes of French-Canadians today. One-Sentence Summary We present an accurate and high resolution spatiotemporal model of genetic variation in a founder population.
70
Citation1
0
Save
0

Recent fluctuations in Mexican American genomes have altered the genetic architecture of biomedical traits

Melissa Spear et al.Jan 14, 2020
People in the Americas represent a diverse group of populations with varying degrees of admixture among African, European, and Amerindigenous ancestries. In the United States, many populations with non-European ancestry remain understudied, and thus little is known about the genetic architecture of phenotypic variation in these populations. Using genome-wide genotype data from the Hispanic Community Health Study/Study of Latinos, we find that Amerindigenous ancestry has increased over time across Hispanic/Latino populations, particularly in Mexican Americans where Amerindigenous ancestry increased by an average of ∼20% over the 50-year period spanning 1940s-1990s. We find similar patterns across American cities, and replicate our observations in an independent sample of Mexican Americans. These dynamic ancestry patterns are a result of a complex interaction of several population and cultural factors, including strong ancestry-related assortative mating and subtle shifts in migration with differences in subcontinental Amerindigenous ancestry over time. These factors have shaped patterns of genetic variation, including an increase in runs of homozygosity in Amerindigenous ancestral tracts, and also influenced the genetic architecture of complex traits within the Mexican American population. We show for height, a trait correlated with ancestry, polygenic risk scores based on summary statistics from a European-based genome-wide association study perform poorly in Mexican Americans. Our findings reveal temporal changes in population structure within Hispanics/Latinos that may influence biomedical traits, demonstrating a crucial need to improve our understanding of the genetic diversity of admixed populations.