HM
Hanna Märkle
Author with expertise in Evolutionary Dynamics of Genetic Adaptation and Mutation
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
4
(50% Open Access)
Cited by:
1
h-index:
4
/
i10-index:
3
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

Inference of host-pathogen interaction matrices from genome-wide polymorphism data

Hanna Märkle et al.Jul 7, 2023
+6
M
S
H
Abstract Coevolution is defined as the evolutionary change in one antagonist (host) in response to changes in the other antagonist (pathogen). At the genetic level, these changes are determined by genotype x genotype (GxG) interactions. We build on a general theoretical model of a host-pathogen interaction to derive four indices to retrieve key features of GxG interactions. The four developed indices extract relevant information from polymorphism data of randomly sampled uninfected hosts as well as infected hosts and their respective pathogen strains. Using these indices as summary statistics in an Approximate Bayesian Computation method, we can show their power to discriminate between GxG interaction matrices. Second, we apply our ABC method to a SNP data set of 451 European humans and their infecting Hepatitis C Virus (HCV) strains supplemented by polymorphism data of 503 individuals from the 1,000 genomes project. As our indices encompass and extend previous natural co-GWAs we recover many of the associations previously reported for this dataset and infer their underlying interaction matrix. We reveal a new candidate gene for resistance to HCV in the human genome, and two groups of significant GxG associations exhibiting gene-for-gene interactions. We suggest that the inferred types of GxG interactions result from the recent expansion, adaptation and low prevalence of the HCV virus population in Europe. Significance statement Why are some host individuals susceptible/resistant to infection by certain pathogen genotypes and others not? Understanding the genetic characteristics of genes driving host-pathogen interactions is crucial to predict epidemics. We develop four indices based on a mathematical model and build a Bayesian statistical method computing these indices on full genome data of infected hosts and their infecting pathogen strains and data of non-infected hosts. We can pinpoint the genes underlying host-pathogen interactions and infer their characteristics. Applying our framework to data from European humans and the Hepatitis C virus, we discover a new potential resistance gene in humans and reveal how the virus has adapted in the last 150 years to match the genetic diversity of the European human population.
1
Citation1
0
Save
0

Cross-Species association statistics for genome-wide studies of host and parasite polymorphism data

Hanna Märkle et al.Aug 6, 2019
S
A
H
Uncovering the genes governing host-parasite coevolution is of importance for disease management in agriculture and human medicine. The availability of increasing amounts of host and parasite full genome-data in recent times allows to perform cross-species genome-wide association studies based on sampling of genomic data of infected hosts and their associated parasites strains. We aim to understand the statistical power of such approaches. We develop two indices, the cross species association (CSA) and the cross species prevalence (CSP), the latter additionally incorporating genomic data from uninfected hosts. For both indices, we derive genome-wide significance thresholds by computing their expected distribution over unlinked neutral loci, i.e. those not involved in determining the outcome of interaction. Using a population genetics and an epidemiological coevolutionary model, we demonstrate that the statistical power of these indices to pinpoint the interacting loci in full genome data varies over time. This is due to the underlying GxG interactions and the coevolutionary dynamics. Under trench-warfare dynamics, CSA and CSP are very accurate in finding out the loci under coevolution, while under arms-race dynamics the power is limited especially under a gene-for-gene interaction. Furthermore, we reveal that the combination of both indices across time samples can be used to estimate the asymmetry of the underlying infection matrix. Our results provide novel insights into the power and biological interpretation of cross-species association studies using samples from natural populations or controlled experiments.
0

Inference of coevolutionary dynamics and parameters from host and parasite polymorphism data of repeated experiments

Hanna Märkle et al.May 2, 2019
A
H
There is a long-standing interest in understanding host-parasite coevolutionary dynamics and associated fitness effects. Increasing amounts of genomic data for both interacting species offer a promising source to identify candidate loci and to infer the main parameters of the past coevolutionary history. However, so far no method exists to do so. By coupling a gene-for-gene model with coalescent simulations, we first show that three types of biological cost, resistance, infectivity and infection, define the allele frequencies at the internal equilibrium point of the coevolution model, which in return determine the strength of the selective signatures signatures at host and parasite loci. We apply an Approximate Bayesian Computation (ABC) approach on simulated datasets to infer these costs by jointly integrating host and parasite polymorphism data at the coevolving loci. To control for the effect of genetic drift on coevolutionary dynamics, we assume that 10 or 30 repetitions are available from controlled experiments or several natural populations. We study two scenarios: 1) the cost of infection and population sizes (host and parasite) are unknown while costs of infectivity and resistance are known, and 2) all three costs are unknown while populations sizes are known. Using the ABC model choice procedure, we show that for both scenarios, we can distinguish with high accuracy pairs of loci from host and parasite under coevolution from neutrally evolving loci, though the statistical power decreases with higher cost of infection. The accuracy of parameter inference is also very high under both scenarios especially when using both host and parasite data because parasite polymorphism data do inform on host costs and vice-versa. As the false positive rate to detect genes under coevolution is small, we suggest to use our method to identify host and parasite candidate loci for further functional studies.Author summary It is of importance for agriculture and medicine to understand host-parasite antagonistic coevolutionary dynamics and the deleterious associated fitness effects, as well as to reveal the genes underpinning these interactions. The increasing amount of genomic data for hosts and parasites offer a promising source to identify such candidate loci, but also to use statistical inference methods to reconstruct the past coevolutionary history. In our study we attempt to draw inference of the past coevolutionary history at key host and parasites loci using sequence data from several individuals and across several experimental replicates. We demonstrate that using a Bayesian statistical method, it is possible to estimate the parameters driving the interaction of hosts and parasites at these loci for thousands of generations. The main parameter that can be estimated is the fitness loss by hosts upon infection. Our method and results can be applied to experimental coevolution data with sequences at the key candidate loci providing enough repetitions and large enough population sizes. As a proof of principle, our results open the door to reconstruct past coevolutionary dynamics using sequence data of interacting species.
0

Inference of host-pathogen interaction matrices from genome-wide polymorphism data

Hanna Märkle et al.Aug 22, 2024
+20
L
S
H
Abstract Host-pathogen coevolution is defined as the reciprocal evolutionary changes in both species due to genotype x genotype (GxG) interactions at the genetic level determining the outcome and severity of infection. While co-analyses of host and pathogen genomes (co-GWAs) allow us to pinpoint the interacting genes, these do not reveal which host genotype(s) is/are resistant to which pathogen genotype(s). The knowledge of this so-called infection matrix is important for agriculture and medicine. Building on established theories of host-pathogen interactions, we here derive four novel indices capturing the characteristics of the infection matrix. These indices can be computed from full genome polymorphism data of randomly sampled uninfected hosts, as well as infected hosts and their pathogen strains. We use these indices in an Approximate Bayesian Computation method to pinpoint loci with relevant GxG interactions and to infer their underlying interaction matrix. In a combined SNP data set of 451 European humans and their infecting Hepatitis C Virus (HCV) strains and 503 uninfected individuals, we reveal a new human candidate gene for resistance to HCV and new virus mutations matching human genes. For two groups of significant human–HCV (GxG) associations, we infer a gene-for-gene infection matrix, which is commonly assumed to be typical of plant-pathogen interactions. Our model-based inference framework bridges theoretical models of GxG interactions with host and pathogen genomic data. It, therefore, paves the way for understanding the evolution of key GxG interactions underpinning HCV adaptation to the European human population after a recent expansion.