MJ
Mackenzie Johnson
Author with expertise in RNA Sequencing Data Analysis
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
6
(83% Open Access)
Cited by:
4
h-index:
3
/
i10-index:
1
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
43

A computational exploration of resilience and evolvability of protein-protein interaction networks

Brennan Klein et al.Jul 2, 2020
+5
K
L
B
Abstract Protein-protein interaction (PPI) networks represent complex intra-cellular protein interactions, and the presence or absence of such interactions can lead to biological changes in an organism. Recent network-based approaches have shown that a phenotype’s PPI network’s resilience to environmental perturbations is related to its placement in the tree of life; though we still do not know how or why certain intra-cellular factors can bring about this resilience. Here, we explore the influence of gene expression and network properties on PPI networks’ resilience. We use publicly-available data of PPIs for E. coli, S. cerevisiae , and H. sapiens , where we compute changes in network resilience as new nodes (proteins) are added to the networks under three node addition mechanisms—random, degree-based, and gene-expression-based attachments. By calculating the resilience of the resulting networks, we estimate the effectiveness of these node addition mechanisms. We demonstrate that adding nodes with gene-expression-based preferential attachment (as opposed to random or degree-based) preserves and can increase the original resilience of PPI network in all three species, regardless of gene expression distribution or network structure. These findings introduce a general notion of prospective resilience , which highlights the key role of network structures in understanding the evolvability of phenotypic traits.
43
Citation3
0
Save
0

The battle of the sexes in humans is highly polygenic

Jared Cole et al.Jul 24, 2024
+5
M
C
J
Sex-differential selection (SDS), which occurs when the fitness effects of alleles differ between males and females, can have profound impacts on the maintenance of genetic variation, disease risk, and other key aspects of natural populations. Because the sexes mix their autosomal genomes each generation, quantifying SDS is not possible using conventional population genetic approaches. Here, we introduce a novel method that exploits subtle sex differences in haplotype frequencies resulting from SDS acting in the current generation. Using data from 300K individuals in the UK Biobank, we estimate the strength of SDS throughout the genome. While only a handful of loci under SDS are individually significant, we uncover polygenic signals of genome-wide SDS for both viability and fecundity. An interesting life-history tradeoff emerges: alleles that increase viability more in one sex increase fecundity more in the other sex. Lastly, we find evidence of SDS on fecundity acting on alleles affecting arm fat-free mass. Taken together, our findings connect the long-standing evidence of SDS acting on human phenotypes with its impact on the genome.
0
Citation1
0
Save
3

Growth-dependent gene expression variation influences the strength of codon usage biases

Mackenzie Johnson et al.Mar 15, 2023
+2
M
A
M
The most highly expressed genes in microbial genomes tend to use a limited set of synonymous codons, often referred to as "preferred codons." The existence of preferred codons is commonly attributed to selection pressures on various aspects of protein translation including accuracy and/or speed. However, gene expression is condition-dependent and even within single-celled organisms transcript and protein abundances can vary depending on a variety of environmental and other factors. Here, we show that growth rate-dependent expression variation is an important constraint that significantly influences the evolution of gene sequences. Using large-scale transcriptomic and proteomic data sets in Escherichia coli and Saccharomyces cerevisiae, we confirm that codon usage biases are strongly associated with gene expression but highlight that this relationship is most pronounced when gene expression measurements are taken during rapid growth conditions. Specifically, genes whose relative expression increases during periods of rapid growth have stronger codon usage biases than comparably expressed genes whose expression decreases during rapid growth conditions. These findings highlight that gene expression measured in any particular condition tells only part of the story regarding the forces shaping the evolution of microbial gene sequences. More generally, our results imply that microbial physiology during rapid growth is critical for explaining long-term translational constraints.
0

The many nuanced evolutionary consequences of duplicated genes

Ashley Teufel et al.Jul 10, 2018
+3
J
M
A
Gene duplication is seen as a major source of structural and functional divergence in genome evolution. Under the conventional models of sub- or neofunctionalizaton, functional changes arise in one of the duplicates after duplication. However, we suggest here that the presence of a duplicated gene can result in functional changes to its interacting partners. We explore this hypothesis by in-silico evolution of a heterodimer when one member of the interacting pair is duplicated. We examine how a range of selection pressures and protein structures leads to differential patterns of evolutionary divergence. We find that a surprising number of distinct evolutionary trajectories can be observed even in a simple three member system. Further, we observe that selection to correct dosage imbalance can affect the evolution of the initial function in several unexpected ways. For example, if a duplicate is under selective pressure to avoid binding its original binding partner, this can lead to changes in the binding interface of a non-duplicated interacting partner to exclude the duplicate. Hence, independent of the fate of the duplicate, its presence can impact how the original function operates. Additionally, we introduce a conceptual framework to describe how interacting partners cope with dosage imbalance after duplication. Contextualizing our results within this framework reveals that the evolutionary path taken by a duplicate's interacting partners is highly stochastic in nature. Consequently, the fate of duplicate genes may not only be controlled by their own ability to accumulate mutations but also by how interacting partners cope with them.
5

Recombination rate inference via deep learning is limited by sequence diversity

Mackenzie Johnson et al.Jul 2, 2022
C
M
Abstract A common inference task in population genetics is to estimate recombination rate from multiple sequence alignments. Traditionally, recombination rate estimators have been developed from biologically-informed, statistical models, but more recently deep learning models have been employed for this task. While deep learning approaches offer unique advantages, their performance is inconsistent across the range of potential recombination rates. Here, we generate and characterize data sets (genotype alignments with known recombination rates) for use by deep learning estimators and assess how their features limit estimator performance. We find that certain input parameter regimes produce genotype alignments with low sequence diversity, which are inherently information-limited. We next test how estimator performance is impacted by training and evaluating neural networks on data sets with varying degrees of diversity. The inclusion of genotype alignments with low diversity at high frequency results in considerable performance declines across two different network architectures. In aggregate, our results suggest that genotype alignments have inherent information limits when sequence diversity is low, and these limitations need to be considered both when training deep learning recombination rate estimators and when using them in inference applications.
0

Site-specific amino acid distributions follow a universal shape

Mackenzie Johnson et al.Aug 6, 2020
C
M
Abstract In many applications of evolutionary inference, a model of protein evolution needs to be fitted to the amino acid variation at individual sites in a multiple sequence alignment. Most existing models fall into one of two extremes: Either they provide a coarse-grained description that lacks biophysical realism (e.g. dN/dS models), or they require a large number of parameters to be fitted (e.g. mutation–selection models). Here, we ask whether a middle ground is possible: Can we obtain a realistic description of site-specific amino acid frequencies while severely restricting the number of free parameters in the model? We show that a distribution with a single free parameter can accurately capture the variation in amino acid frequency at most sites in an alignment, as long as we are willing to restrict our analysis to predicting amino acid frequencies by rank rather than by amino acid identity. This result holds equally well both in alignments of empirical protein sequences and of sequences evolved under a biophysically realistic all-atom force field. Our analysis reveals a near universal shape of the frequency distributions of amino acids. This insight has the potential to lead to new models of evolution that have both increased realism and a limited number of free parameters.