TB
Tom Booker
Author with expertise in Population Genetic Structure and Dynamics
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
16
(75% Open Access)
Cited by:
47
h-index:
12
/
i10-index:
14
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Understanding the factors that shape patterns of nucleotide diversity in the house mouse genome

Tom Booker et al.Mar 2, 2018
P
T
Abstract A major goal of population genetics has been to determine the extent to which selection at linked sites influences patterns of neutral nucleotide diversity in the genome. Multiple lines of evidence suggest that diversity is influenced by both positive and negative selection. For example, in many species there are troughs in diversity surrounding functional genomic elements, consistent with the action of either background selection (BGS) or selective sweeps. In this study, we investigated the causes of the diversity troughs that are observed in the wild house mouse genome. Using the unfolded site frequency spectrum (uSFS), we estimated the strength and frequencies of deleterious and advantageous mutations occurring in different functional elements in the genome. We then used these estimates to parameterize forward-in-time simulations of chromosomes, using realistic distributions of functional elements and recombination rate variation in order to determine if selection at linked sites can explain the observed patterns of nucleotide diversity. The simulations suggest that BGS alone cannot explain the dips in diversity around either exons or conserved non-coding elements (CNEs). A combination of BGS and selective sweeps, however, can explain the troughs in diversity around CNEs. This is not the case for protein-coding exons, where observed dips in diversity cannot be explained by parameter estimates obtained from the uSFS. We discuss the extent to which our results provide evidence of sweeps playing a role in shaping patterns of nucleotide diversity and the limitations of using the uSFS for obtaining inferences of the frequency and effects of advantageous mutations. Author Summary We present a study examining the causes of variation in nucleotide diversity across the mouse genome. The status of mice as a model organism in the life sciences makes them an excellent model system for studying molecular evolution in mammals. In our study, we analyse how natural selection acting on new mutations can affect levels of nucleotide diversity through the processes of background selection and selective sweeps. To perform our analyses, we first estimated the rate and strengths of selected mutations from a sample of wild mice and then use our estimates in realistic population genetic simulations. Analysing simulations, we find that both harmful and beneficial mutations are required to explain patterns of nucleotide diversity in regions of the genome close to gene regulatory elements. For protein-coding genes, however, our approach is not able to fully explain observed patterns and we think that this is because there are strongly advantageous mutations that occur in protein-coding genes that we were not able to detect.
0
Citation12
0
Save
0

How useful is genomic data for predicting maladaptation to future climate?

Brandon Lind et al.Feb 13, 2023
+8
P
R
B
Abstract Methods using genomic information to forecast potential population maladaptation to climate change are becoming increasingly common, yet the lack of model validation poses serious hurdles toward their incorporation into management and policy. Here, we compare the validation of maladaptation estimates derived from two methods – Gradient Forests (GF offset ) and the Risk Of Non-Adaptedness (RONA) – using exome capture pool-seq data from 35 to 39 populations across three conifer taxa: two Douglas-fir varieties and jack pine. We evaluate sensitivity of these algorithms to the source of input loci (markers selected from genotype-environment associations [GEA] or those selected at random). We validate these methods against two-year and 52-year growth and mortality measured in independent transplant experiments. Overall, we find that both methods often better predict transplant performance than climatic or geographic distances. We also find that GF offset and RONA models are surprisingly not improved using GEA candidates. Even with promising validation results, variation in model projections to future climates makes it difficult to identify the most maladapted populations using either method. Our work advances understanding of the sensitivity and applicability of these approaches, and we discuss recommendations for their future use.
0
Citation10
0
Save
0

Inferring the frequency spectrum of derived variants to quantify adaptive molecular evolution in protein-coding genes of Drosophila melanogaster

Peter Keightley et al.Feb 10, 2016
B
T
J
P
Many approaches for inferring adaptive molecular evolution analyze the unfolded site frequency spectrum (SFS), a vector of counts of sites with different numbers of copies of derived alleles in a sample of alleles from a population. Accurate inference of the high copy number elements of the SFS is difficult, however, because of misassignment of alleles as derived versus ancestral. This is a known problem with parsimony using outgroup species. Here, we show that the problem is particularly serious if there is variation in the substitution rate among sites brought about by variation in selective constraint levels. We present a new method for inferring the SFS using one or two outgroups, which attempts to overcome the problem of misassignment. We show that two outgroups are required for accurate estimation of the SFS if there is substantial variation in selective constraints, which is expected to be the case for nonsynonymous sites of protein-coding genes. We apply the method to estimate unfolded SFSs for synonymous and nonsynonymous sites from Phase 2 of the Drosophila Population Genomics Project. We use the unfolded spectra to estimate the frequency and strength of advantageous and deleterious mutations, and estimate that ~50% of amino acid substitutions are positively selected, but that less than 0.5% of new amino acid mutations are beneficial, with a scaled selection strength of Nes ≈ 12.
0
Citation5
0
Save
40

The WZA: A window-based method for characterizing genotype-environment association

Tom Booker et al.Jun 26, 2021
M
S
T
Abstract Genotype environment association (GEA) studies have the potential to elucidate the genetic basis of local adaptation in natural populations. Specifically, GEA approaches look for a correlation between allele frequencies and putatively selective features of the environment. Genetic markers with extreme evidence of correlation with the environment are presumed to be tagging the location of alleles that contribute to local adaptation. In this study, we propose a new method for GEA studies called the weighted-Z analysis (WZA) that combines information from closely linked sites into analysis windows in a way that was inspired by methods for calculating F ST . We analyze simulations modelling local adaptation to heterogeneous environments either using a GEA method that controls for population structure or an uncorrected approach. In the majority of cases we tested, the WZA either outperformed single-SNP based approaches or performed similarly. The WZA outperformed individual SNP approaches when the measured environment is not perfectly correlated with the true selection pressure or when a small number of individuals or demes was sampled. We apply the WZA to previously published data from lodgepole pine and identified candidate loci that were not found in the original study.
40
Citation5
0
Save
119

Genetic diversity loss in the Anthropocene

Moisés Expósito‐Alonso et al.Oct 15, 2021
+13
D
L
M
More species than ever before are at risk of extinction due to anthropogenic habitat loss and climate change. But even species that are not threatened have seen reductions in their populations and geographic ranges, likely impacting their genetic diversity. Although preserving genetic diversity is key to maintaining adaptability of species, we lack predictive tools and global estimates of genetic diversity loss across ecosystems. By bridging theories of biodiversity and population genetics, we introduce a mathematical framework to understand the loss of naturally occurring DNA mutations within decreasing habitat within a species. Analysing genome-wide variation data of 10,095 geo-referenced individuals from 20 plant and animal species, we show that genome-wide diversity follows a power law with geographic area (the mutations-area relationship), which can predict genetic diversity loss in spatial computer simulations of local population extinctions. Given pre-21 st century values of ecosystem transformations, we estimate that over 10% of genetic diversity may already be lost, surpassing the United Nations targets for genetic preservation. These estimated losses could rapidly accelerate with advancing climate change and habitat destruction, highlighting the need for forecasting tools that facilitate implementation of policies to protect genetic resources globally.
119
Citation4
0
Save
24

The genetics of assisted gene flow: immediate costs and long-term benefits

Jared Grummer et al.Apr 22, 2021
+3
R
T
J
ABSTRACT Plant and animal populations are facing several novel risks such as human-mediated habitat fragmentation and climate change that threaten their long-term productivity and persistence. With the genetic health of many populations deteriorating due to climate change outpacing physiological adaptation, human interventions in the form of assisted gene flow (AGF) may provide genetic variation to adapt populations to predicted climate change scenarios and result in more robust and productive populations. We ran genetic simulations to mimic a variety of AGF scenarios and measured their outcomes on population-level fitness to answer the question: in which circumstances is it worthwhile to perform AGF? Based on the parameters we explored, AGF may be harmful in certain situations over the short term (e.g., the first ∼10-20 generations), due to outbreeding depression and introducing deleterious genetic variation. Moreover, under many parameter sets, the benefits of AGF were relatively weak or took many generations to accrue. In general, when the adaptive trait is controlled by many loci of small effect, the benefits of assisted gene flow take much longer to realize–potentially too long for most climate-related management decisions. We also show that when translocation effort is divided across several generations and outbreeding depression is strong, the recipient population experiences a smaller decrease in fitness as compared to moving all individuals in a single effort. Importantly, in most cases, we show that the genomic integrity of the recipient population remains relatively intact following AGF; the amount of genetic material from the donor population typically ends up constituting no more of the recipient population’s genome than the fraction introduced. Our results will be useful for conservation practitioners and silviculturists, for instance, aiming to intervene and adaptively manage so that populations maintain a robust genetic health and maintain productivity into the future given anthropogenic climate change.
24
Citation4
0
Save
23

Selective sweeps influence diversity over large regions of the mouse genome

Tom Booker et al.Jun 10, 2021
+2
R
B
T
Abstract To what extent do substitutions in protein-coding versus gene-regulatory regions contribute to fitness change over time? Answering this question requires estimates of the extent of selection acting on beneficial mutations in the two classes of sites. New mutations that have advantageous or deleterious fitness effects can induce selective sweeps and background selection, respectively, causing variation in the level of neutral genetic diversity along the genome. In this study, we analyse the profiles of genetic variability around protein-coding and regulatory elements in the genomes of wild mice to estimate the parameters of positive selection. We find patterns of diversity consistent with the effects of selection at linked sites, which are similar across mouse taxa, despite differences in effective population size and demographic history. By fitting a model that combines the effects of selective sweeps and background selection, we estimate the strength of positive selection and the frequency of advantageous mutations. We find that strong positive selection is required to explain variation in genetic diversity across the murid genome. In particular, we estimate that beneficial mutations in protein-coding regions have stronger effects on fitness than do mutations in gene-regulatory regions, but that mutations in gene-regulatory regions are more common. Overall though, our parameter estimates suggest that the cumulative fitness changes brought about by beneficial mutations in protein-coding may be greater than those in gene-regulatory elements.
23
Citation3
0
Save
32

Mosaic haplotypes underlie repeated adaptation to whole genome duplication in Arabidopsis lyrata and Arabidopsis arenosa

Magdalena Bohutínská et al.Jan 13, 2023
+9
F
L
M
Abstract Polyploidy, the result of whole genome duplication (WGD), is widespread across the tree of life and is often associated with speciation or adaptability. It is thought that adaptation in autopolyploids (within-species polyploids) may be facilitated by increased access to genetic variation. This variation may be sourced from gene flow with sister diploids and new access to other tetraploid lineages, as well as from increased mutational targets provided by doubled DNA content. Here we deconstruct the origins of haplotype blocks displaying the strongest selection signals in established, successful autopolyploids, Arabidopsis lyrata and Arabidopsis arenosa . We see strong signatures of selection in 17 genes implied in meiosis, cell cycle, and transcription across all four autotetraploid lineages present in our expanded sampling of 983 sequenced genomes. Most prominent in our results is the finding that the tetraploid-characteristic haplotype blocks with the most robust signals of selection were completely absent in diploid sisters. In contrast, the fine-scaled variant mosaics in the tetraploids originated from highly diverse evolutionary sources. These include novel reassortments of trans-specific polymorphism from diploids, new mutations, and tetraploid-specific inter-species hybridization. We speculate that this broad-scale allele acquisition and re-shuffling enabled the autotetraploids to rapidly adapt to the challenges inherent to WGD, and may further promote their adaptation to environmental challenges. Lay summary Polyploidy, the result of whole genome duplication, is associated with speciation and adaptation. To fuel their often remarkable adaptations, polyploids may access and maintain adaptive alleles more readily than diploids. Here we identify repeated signals of selection on genes that are thought to mediate adaptation to whole genome duplication in two Arabidopsis species. We found that the tetraploid-characteristic haplotype blocks, found in genes exhibiting the most robust signals of selection, were never present in their diploid relatives. Instead, these blocks were made of mosaics forged from multiple allelic sources. We hypothesize that this increased variation helped polyploids to adapt to the process that caused this increase – genome duplication – and may also help them adapt to novel environments.
32
Citation3
0
Save
53

Using genome scans to identify genes used repeatedly for adaptation

Tom Booker et al.Mar 25, 2022
M
S
T
Abstract Adaptation occurring in similar genes or genomic regions in distinct lineages provides evolutionary biologists with a glimpse at the fundamental opportunities for and constraints to diversification. With the widespread availability of high throughput sequencing technologies and the development of population genetic methods to identify the genetic basis of adaptation, studies have begun to compare the evidence for adaptation at the molecular level among distinct lineages. However, methods to study repeated adaptation are often oriented towards genome-wide testing to identify a set of genes with signatures of repeated use, rather than evaluating the significance at the level of an individual gene. In this study, we propose PicMin , a novel statistical method derived from the theory of order statistics that can test for repeated molecular evolution to estimate significance at the level of an individual gene, using the results of genome scans. This method is generalizable to any number of lineages and indeed, statistical power to detect repeated adaptation increases with the number of lineages that have signals of repeated adaptation of a given gene in multiple lineages. An implementation of the method written for R can be downloaded from https://github.com/TBooker/PicMin .
53
Citation1
0
Save
1

Background selection under evolving recombination rates

Tom Booker et al.Dec 21, 2021
A
B
T
Abstract Background selection (BGS), the effect that purifying selection exerts on sites linked to deleterious alleles, is expected to be ubiquitous across eukaryotic genomes. The effects of BGS reflect the interplay of the rates and fitness effects of deleterious mutations with recombination. A fundamental assumption of BGS models is that recombination rates are invariant over time. However, in some lineages recombination rates evolve rapidly, violating this central assumption. Here, we investigate how recombination rate evolution affects genetic variation under BGS. We show that recombination rate evolution modifies the effects of BGS in a manner similar to a localised change in the effective population size, potentially leading to an underestimation of the genome-wide effects of selection. Furthermore, we find evidence that recombination rate evolution in the ancestors of modern house mice may have impacted inferences of the genome-wide effects of selection in that species.
Load More