SA
Sarah Auburn
Author with expertise in Malaria
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
14
(71% Open Access)
Cited by:
1,309
h-index:
42
/
i10-index:
76
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Analysis of Plasmodium falciparum diversity in natural infections by deep sequencing

Magnus Manske et al.Jun 12, 2012
+52
S
O
M
Next-generation sequencing is used here to analyse Plasmodium falciparum genome variation directly from clinical blood samples, as well as cultured isolates, from Africa, Asia and Oceania. Resistance to the major antimalarial drug artemisinin is emerging in the Plasmodium falciparum parasite across Southeast Asia, and there is concern that the increased deployment of antimalarials in pursuit of disease eradication might simply lead to increased drug resistance. To monitor these risks it is important to survey the parasite population for genetic changes. Next-generation sequencing is used here to analyse P. falciparum genome variation directly from nearly 300 clinical blood samples, and from cultured isolates from Africa, Asia and Oceania. The authors use these data to analyse the diversity of the parasite population across different geographical locations, as well as within-host diversity at the level of the whole genome, and they show how this may be used to estimate inbreeding rates, which are important for the evolution of drug resistance. Malaria elimination strategies require surveillance of the parasite population for genetic changes that demand a public health response, such as new forms of drug resistance1,2. Here we describe methods for the large-scale analysis of genetic variation in Plasmodium falciparum by deep sequencing of parasite DNA obtained from the blood of patients with malaria, either directly or after short-term culture. Analysis of 86,158 exonic single nucleotide polymorphisms that passed genotyping quality control in 227 samples from Africa, Asia and Oceania provides genome-wide estimates of allele frequency distribution, population structure and linkage disequilibrium. By comparing the genetic diversity of individual infections with that of the local parasite population, we derive a metric of within-host diversity that is related to the level of inbreeding in the population. An open-access web application has been established for the exploration of regional differences in allele frequency and of highly differentiated loci in the P. falciparum genome.
0
Citation481
0
Save
0

Multiple populations of artemisinin-resistant Plasmodium falciparum in Cambodia

Olivo Miotto et al.Apr 28, 2013
+58
M
J
O
Dominic Kwiatkowski and colleagues report analysis of genetic variation in 826 Plasmodium falciparum samples collected from 10 locations in West Africa and southeast Asia. They characterize the population structure of this parasite in Cambodia and find evidence for multiple distinct subpopulations showing high levels of genetic differentiation and artemisinin resistance. We describe an analysis of genome variation in 825 P. falciparum samples from Asia and Africa that identifies an unusual pattern of parasite population structure at the epicenter of artemisinin resistance in western Cambodia. Within this relatively small geographic area, we have discovered several distinct but apparently sympatric parasite subpopulations with extremely high levels of genetic differentiation. Of particular interest are three subpopulations, all associated with clinical resistance to artemisinin, which have skewed allele frequency spectra and high levels of haplotype homozygosity, indicative of founder effects and recent population expansion. We provide a catalog of SNPs that show high levels of differentiation in the artemisinin-resistant subpopulations, including codon variants in transporter proteins and DNA mismatch repair proteins. These data provide a population-level genetic framework for investigating the biological origins of artemisinin resistance and for defining molecular markers to assist in its elimination.
0
Citation448
0
Save
0

Genome-wide and fine-resolution association analysis of malaria in West Africa

Muminatou Jallow et al.May 24, 2009
+78
K
Y
M
Dominic Kwiatkowski and colleagues of the MalariaGEN and the WTCCC consortiums report a genome-wide analysis of severe malaria in The Gambia. They provide guidance for design of GWAS in African populations, and demonstrate the usefulness of multipoint imputation based on population-specific sequencing data. We report a genome-wide association (GWA) study of severe malaria in The Gambia. The initial GWA scan included 2,500 children genotyped on the Affymetrix 500K GeneChip, and a replication study included 3,400 children. We used this to examine the performance of GWA methods in Africa. We found considerable population stratification, and also that signals of association at known malaria resistance loci were greatly attenuated owing to weak linkage disequilibrium (LD). To investigate possible solutions to the problem of low LD, we focused on the HbS locus, sequencing this region of the genome in 62 Gambian individuals and then using these data to conduct multipoint imputation in the GWA samples. This increased the signal of association, from P = 4 × 10−7 to P = 4 × 10−14, with the peak of the signal located precisely at the HbS causal variant. Our findings provide proof of principle that fine-resolution multipoint imputation, based on population-specific sequencing data, can substantially boost authentic GWA signals and enable fine mapping of causal variants in African populations.
0
Citation373
0
Save
0

A molecular barcode and online tool to identify and map imported infection with Plasmodium vivax

Hidayat Trimarsanto et al.Sep 24, 2019
+45
R
R
H
Abstract Imported cases present a considerable challenge to the elimination of malaria. Traditionally, patient travel history has been used to identify imported cases, but the long-latency liver stages confound this approach in Plasmodium vivax . Molecular tools to identify and map imported cases offer a more robust approach, that can be combined with drug resistance and other surveillance markers in high-throughput, population-based genotyping frameworks. Using a machine learning approach incorporating hierarchical FST (HFST) and decision tree (DT) analysis applied to 831 P. vivax genomes from 20 countries, we identified a 28-Single Nucleotide Polymorphism (SNP) barcode with high capacity to predict the country of origin. The Matthews correlation coefficient (MCC), which provides a measure of the quality of the classifications, ranging from −1 (total disagreement) to 1 (perfect prediction), exceeded 0.9 in 15 countries in cross-validation evaluations. When combined with an existing 37-SNP P. vivax barcode, the 65-SNP panel exhibits MCC scores exceeding 0.9 in 17 countries with up to 30% missing data. As a secondary objective, several genes were identified with moderate MCC scores (median MCC range from 0.54-0.68), amenable as markers for rapid testing using low-throughput genotyping approaches. A likelihood-based classifier framework was established, that supports analysis of missing data and polyclonal infections. To facilitate investigator-lead analyses, the likelihood framework is provided as a web-based, open-access platform (vivaxGEN-geo) to support the analysis and interpretation of data produced either at the 28-SNP core or full 65-SNP barcode. These tools can be used by malaria control programs to identify the main reservoirs of infection so that resources can be focused to where they are needed most.
0
Citation5
0
Save
0

A complexPlasmodium falciparumcryptotype circulating at low frequency across the African continent

Olivo Miotto et al.Jan 22, 2024
+35
L
A
O
ABSTRACT The population structure of the malaria parasite Plasmodium falciparum can reveal underlying demographic and adaptive evolutionary processes. Here, we analyse population structure in 4,376 P. falciparum genomes from 21 countries across Africa. We identified a strongly differentiated cluster of parasites, comprising ∼1.2% of samples analysed, geographically distributed over 13 countries across the continent. Members of this cluster, named AF1, carry a genetic background consisting of a large number of highly differentiated variants, rarely observed outside this cluster, at a multitude of genomic loci distributed across most chromosomes. At these loci, the AF1 haplotypes appear to have common ancestry, irrespective of the sampling location; outside the shared loci, however, AF1 members are genetically similar to their sympatric parasites. AF1 parasites sharing up to 23 genomic co-inherited regions were found in all major regions of Africa, at locations over 7,000 km apart. We coined the term cryptotype to describe a complex common background which is geographically widespread, but concealed by genomic regions of local origin. Most AF1 differentiated variants are functionally related, comprising structural variations and single nucleotide polymorphisms in components of the MSP1 complex and several other genes involved in interactions with red blood cells, including invasion and erythrocyte antigen export. We propose that AF1 parasites have adapted to some as yet unidentified evolutionary niche, by acquiring a complex compendium of interacting variants that rarely circulate separately in Africa. As the cryptotype spread across the continent, it appears to have been maintained mostly intact in spite of recombination events, suggesting a selective advantage. It is possible that other cryptotypes circulate in Africa, and new analysis methods may be needed to identify them.
0
Citation1
0
Save
0

Lineage-informative microhaplotypes for recurrence classification and spatio-temporal surveillance of Plasmodium vivax malaria parasites

Sasha Siegel et al.Aug 8, 2024
+20
R
H
S
Challenges in classifying recurrent Plasmodium vivax infections constrain surveillance of antimalarial efficacy and transmission. Recurrent infections may arise from activation of dormant liver stages (relapse), blood-stage treatment failure (recrudescence) or reinfection. Molecular inference of familial relatedness (identity-by-descent or IBD) can help resolve the probable origin of recurrences. As whole genome sequencing of P. vivax remains challenging, targeted genotyping methods are needed for scalability. We describe a P. vivax marker discovery framework to identify and select panels of microhaplotypes (multi-allelic markers within small, amplifiable segments of the genome) that can accurately capture IBD. We evaluate panels of 50-250 microhaplotypes discovered in a global set of 615 P. vivax genomes. A candidate global 100-microhaplotype panel exhibits high marker diversity in the Asia-Pacific, Latin America and horn of Africa (median H
0
Citation1
0
Save
0

Genomic epidemiology of Plasmodium knowlesi reveals putative genetic drivers of adaptation in Malaysia.

Jacob Westaway et al.Apr 15, 2024
+18
S
E
J
Abstract Sabah, Malaysia, has amongst the highest burden of human Plasmodium knowlesi infection in the country, associated with increasing encroachment on the parasite’s macaque host habitat. However, the genomic make-up of P. knowlesi in Sabah was previously poorly understood. To inform on local patterns of transmission and putative adaptive drivers, we conduct population-level genetic analyses of P. knowlesi human infections using 52 new whole genomes from Sabah, Malaysia, in combination with publicly available data. We identify the emergence of distinct geographical subpopulations within the macaque-associated clusters using IBD-based connectivity analysis. Secondly, we report on introgression events between the clusters, which may be linked to differentiation of the subpopulations, and that overlap genes critical for survival in human and mosquito hosts. Using village-level locations from P. knowlesi infections, we also identify associations between several introgressed regions and both intact forest perimeter-area ratio and mosquito vector habitat suitability. Our findings provide further evidence of the complex role of changing ecosystems and sympatric macaque hosts in Malaysia driving distinct genetic changes seen in P. knowlesi populations. Future expanded analyses of evolving P. knowlesi genetics and environmental drivers of transmission will be important to guide public health surveillance and control strategies. Author Summary The zoonotic P. knowlesi parasite is an emerging, yet understudied, cause of malaria in Southeast Asia. Sabah, Malaysia, has amongst the highest burden of human P. knowlesi infection in the country, however, the region is currently understudied. Thus, we produced a collection of high-quality P. knowlesi genomes from Sabah, and in combination with publicly available data, performed an extensive population genetics analysis. Our work contributes novel insights for Plasmodium knowlesi population genetics and genetic epidemiology.
0

Whole Genome Sequencing of Plasmodium vivax Isolates Reveals Frequent Sequence and Structural Polymorphisms in Erythrocyte Binding Genes

Anthony Ford et al.Mar 23, 2020
+12
J
B
A
Plasmodium vivax malaria is much less common in Africa than the rest of the world because the parasite relies primarily on the Duffy antigen/chemokine receptor ( DARC ) to invade human erythrocytes, and the majority of Africans are Duffy negative. Recently, there has been a dramatic increase in the reporting of P. vivax cases in Africa, with a high number of them being in Duffy negative individuals, potentially indicating P. vivax has evolved an alternative invasion mechanism that can overcome Duffy negativity. Here, we analyzed single nucleotide polymorphism (SNP) and copy number variation (CNV) in Whole Genome Sequence (WGS) data from 44 P. vivax samples isolated from symptomatic malaria patients in southwestern Ethiopia, where both Duffy positive and Duffy negative individuals are found. A total of 236,351 SNPs were detected, of which 21.9% was nonsynonymous and 78.1% was synonymous mutations. The largest number of SNPs were detected on chromosomes 9 (33,478 SNPs; 14% of total) and 10 (28,133 SNPs; 11.9%). There were particularly high levels of polymorphism in erythrocyte binding gene candidates including reticulocyte binding protein 2c ( RBP 2c), merozoite surface protein 1 ( MSP 1), and merozoite surface protein 3 ( MSP 3.5, MSP 3.85 and MSP 3.9). Thirteen genes related to immunogenicity and erythrocyte binding function were detected with significant signals of positive selection. Variation in gene copy number was also concentrated in genes involved in host-parasite interactions, including the expansion of the Duffy binding protein gene ( PvDBP ) on chromosome 6 and several PIR genes. Based on the phylogeny constructed from the whole genome sequences, the expansion of these genes was an independent process among the P. vivax lineages in Ethiopia. We further inferred transmission patterns of P. vivax infections among study sites and showed various levels of gene flow at a small geographical scale. The genomic features of P. vivax provided baseline data for future comparison with those in Duffy-negative individuals, and allowed us to develop a panel of informative Single Nucleotide Polymorphic markers diagnostic at a micro-geographical scale.
12

MinSNPs: an R package for derivation of resolution-optimised SNP sets from microbial genomic data

Kian Hoon et al.Jul 29, 2022
+2
S
D
K
2. Abstract Here we present the R package - MinSNPs. This is designed to assemble resolution optimised sets of single nucleotide polymorphisms (SNPs) from alignments such as genome wide orthologous SNP matrices. We also demonstrate a pipeline for assembling such matrices from multiple bio-projects, so as to facilitate SNP set derivation from globally representative data sets. MinSNPs can derive sets of SNPs optimised for discriminating any user-defined combination of sequences from all others. Alternatively, SNP sets may be optimised to discriminate all from all, i.e., to maximise diversity. MinSNPs encompasses functions that facilitate rapid and flexible SNP mining, and clear and comprehensive presentation of the results. The MinSNPs running time scales in a linear fashion with input data volume, and the numbers of SNPs and SNPs sets specified in the output. MinSNPs was tested using a previously reported orthologous SNP matrix of Staphylococcus aureus . and an orthologous SNP matrix of 3,279 genomes with 164,335 SNPs assembled from four S. aureus short read genomic data sets. MinSNPs demonstrated efficacy in deriving discriminatory SNP sets for potential surveillance targets and in identifying SNP sets optimised to discriminate isolates from different clonal complexes (CC). MinSNPs was also tested with a large Plasmodium vivax orthologous SNP matrix. A set of five SNPs was derived that reliably indicated the country of origin within 3 south-east Asian countries. In summary, we report the capacity to assemble comprehensive SNP matrices that effectively capture microbial genomic diversity, and to rapidly and flexibly mine these entities for optimised surveillance marker sets. 3. Impact statement We present the R package “MinSNPs”. This derives resolution optimised SNP sets from datasets of genome sequence variation. Such SNP sets can underpin targeted genetic analysis for high throughput surveillance of microbial variants of public health concern. MinSNPs supports considerable flexibility in search methods. The package allows non-specialist bioinformaticians to easily and quickly convert global scale data of intra-specific genomic variation into SNP sets precisely and efficiently directed towards many microbial genetic analysis tasks. 4. Data summary The source code for minSNPs is available from GitHub under MIT Licence (URLs – https://github.com/ludwigHoon/minSNPs and mirrored in https://cran.r-project.org/package=minSNPs ) Staphylococcus aureus (STARRS data set) Orthologous SNP Matrix; (URL - https://doi.org/10.1371/journal.pone.0245790.s005 ) Plasmodium vivax data set (VCF file); (URL - https://www.malariagen.net/resource/24 ) Staphylococcus aureus short read sequences (fastq) from bioprojects: PRJEB40888 (or STARRS)( https://www.ncbi.nlm.nih.gov/bioproject/PRJEB40888 ), PRJEB3174 ( https://www.ncbi.nlm.nih.gov/bioproject/PRJEB3174 ), PRJEB32286 ( https://www.ncbi.nlm.nih.gov/bioproject/PRJEB32286 ), and PRJNA400143 ( https://www.ncbi.nlm.nih.gov/bioproject/PRJNA400143 )
13

Multi-locus genotyping reveals established endemicity of a geographically distinct Plasmodium vivax population in Mauritania, West Africa

Hampaté Bâ et al.Sep 10, 2020
+10
A
D
H
Abstract Background Plasmodium vivax has been recently discovered as a significant cause of malaria in Mauritania, although very rare elsewhere in West Africa. It has not been known if this is a recently introduced or locally remnant parasite population, nor whether the genetic structure reflects epidemic or endemic transmission. Methodology / Principal Findings To investigate the P. vivax population genetic structure in Mauritania and compare with populations previously analysed elsewhere, multi-locus genotyping was undertaken on 100 clinical isolates, using a genome-wide panel of 38 single nucleotide polymorphisms (SNPs), plus seven SNPs in drug resistance genes. The Mauritanian P. vivax population is shown to be genetically diverse and divergent from populations elsewhere, indicated consistently by genetic distance matrix analysis, principal components analyses, and fixation indices. Only one isolate had a genotype clearly indicating recent importation, from a southeast Asian source. There was no linkage disequilibrium in the local parasite population, and only a small number of infections appeared to be closely genetically related, indicating that there is ongoing genetic recombination consistent with endemic transmission. The P. vivax diversity in a remote mining town was similar to that in the capital Nouakchott, with no indication of local substructure or of epidemic population structure. Drug resistance alleles were virtually absent in Mauritania, in contrast with P. vivax in other areas of the world. Conclusions / Significance The molecular epidemiology indicates that there is long-standing endemic transmission that will be very challenging to eliminate. The virtual absence of drug resistance alleles suggests that most infections have been untreated, and that this endemic infection has been more neglected in comparison to P. falciparum locally or to P. vivax elsewhere. Author Summary Plasmodium vivax is a widespread cause of malaria in Mauritania, in contrast to its rarity elsewhere throughout West Africa. To investigate whether the parasite may be recently introduced or epidemic, multi-locus genotyping was performed on 100 Mauritanian P. vivax malaria cases. Analysis of a genome-wide panel of single nucleotide polymorphisms showed the P. vivax population to be genetically diverse and divergent from populations elsewhere, indicating that there has been long-standing endemic transmission. Almost all infections appear to be locally acquired, with the exception of one that was presumably imported with a genotype similar to infections seen in Southeast Asia. The Mauritanian P. vivax population shows no linkage disequilibrium, and very few infections have closely related genotypes, indicating ongoing recombination. The parasite showed no indication of local substructure or epidemic population structure. Drug resistance alleles were virtually absent, suggesting that most infections have been untreated historically. The molecular epidemiology indicates that there has been long-standing endemic transmission of this neglected parasite that requires special attention for control.
Load More