A new version of ResearchHub is available.Try it now
MC
Marc Crepeau
Author with expertise in Insect Symbiosis and Microbial Interactions
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
12
(83% Open Access)
Cited by:
2,076
h-index:
25
/
i10-index:
32
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Decoding the massive genome of loblolly pine using haploid DNA and novel assembly strategies

David Neale et al.Jan 1, 2014
The size and complexity of conifer genomes has, until now, prevented full genome sequencing and assembly. The large research community and economic importance of loblolly pine, Pinus taeda L., made it an early candidate for reference sequence determination. We develop a novel strategy to sequence the genome of loblolly pine that combines unique aspects of pine reproductive biology and genome assembly methodology. We use a whole genome shotgun approach relying primarily on next generation sequence generated from a single haploid seed megagametophyte from a loblolly pine tree, 20-1010, that has been used in industrial forest tree breeding. The resulting sequence and assembly was used to generate a draft genome spanning 23.2 Gbp and containing 20.1 Gbp with an N50 scaffold size of 66.9 kbp, making it a significant improvement over available conifer genomes. The long scaffold lengths allow the annotation of 50,172 gene models with intron lengths averaging over 2.7 kbp and sometimes exceeding 100 kbp in length. Analysis of orthologous gene sets identifies gene families that may be unique to conifers. We further characterize and expand the existing repeat library based on the de novo analysis of the repetitive content, estimated to encompass 82% of the genome. In addition to its value as a resource for researchers and breeders, the loblolly pine genome sequence and assembly reported here demonstrates a novel approach to sequencing the large and complex genomes of this important group of plants that can now be widely applied.
0
Citation474
0
Save
0

Population Genomics of Sub-Saharan Drosophila melanogaster: African Diversity and Non-African Admixture

John Pool et al.Dec 20, 2012
Drosophila melanogaster has played a pivotal role in the development of modern population genetics. However, many basic questions regarding the demographic and adaptive history of this species remain unresolved. We report the genome sequencing of 139 wild-derived strains of D. melanogaster, representing 22 population samples from the sub-Saharan ancestral range of this species, along with one European population. Most genomes were sequenced above 25X depth from haploid embryos. Results indicated a pervasive influence of non-African admixture in many African populations, motivating the development and application of a novel admixture detection method. Admixture proportions varied among populations, with greater admixture in urban locations. Admixture levels also varied across the genome, with localized peaks and valleys suggestive of a non-neutral introgression process. Genomes from the same location differed starkly in ancestry, suggesting that isolation mechanisms may exist within African populations. After removing putatively admixed genomic segments, the greatest genetic diversity was observed in southern Africa (e.g. Zambia), while diversity in other populations was largely consistent with a geographic expansion from this potentially ancestral region. The European population showed different levels of diversity reduction on each chromosome arm, and some African populations displayed chromosome arm-specific diversity reductions. Inversions in the European sample were associated with strong elevations in diversity across chromosome arms. Genomic scans were conducted to identify loci that may represent targets of positive selection within an African population, between African populations, and between European and African populations. A disproportionate number of candidate selective sweep regions were located near genes with varied roles in gene regulation. Outliers for Europe-Africa FST were found to be enriched in genomic regions of locally elevated cosmopolitan admixture, possibly reflecting a role for some of these loci in driving the introgression of non-African alleles into African populations.
0
Citation358
0
Save
0

Sequencing and Assembly of the 22-Gb Loblolly Pine Genome

Aleksey Zimin et al.Mar 1, 2014
Conifers are the predominant gymnosperm. The size and complexity of their genomes has presented formidable technical challenges for whole-genome shotgun sequencing and assembly. We employed novel strategies that allowed us to determine the loblolly pine (Pinus taeda) reference genome sequence, the largest genome assembled to date. Most of the sequence data were derived from whole-genome shotgun sequencing of a single megagametophyte, the haploid tissue of a single pine seed. Although that constrained the quantity of available DNA, the resulting haploid sequence data were well-suited for assembly. The haploid sequence was augmented with multiple linking long-fragment mate pair libraries from the parental diploid DNA. For the longest fragments, we used novel fosmid DiTag libraries. Sequences from the linking libraries that did not match the megagametophyte were identified and removed. Assembly of the sequence data were aided by condensing the enormous number of paired-end reads into a much smaller set of longer "super-reads," rendering subsequent assembly with an overlap-based assembly algorithm computationally feasible. To further improve the contiguity and biological utility of the genome sequence, additional scaffolding methods utilizing independent genome and transcriptome assemblies were implemented. The combination of these strategies resulted in a draft genome sequence of 20.15 billion bases, with an N50 scaffold size of 66.9 kbp.
0
Citation316
0
Save
0

TheDrosophilaGenome Nexus: A Population Genomic Resource of 623Drosophila melanogasterGenomes, Including 197 from a Single Ancestral Range Population

Justin Lack et al.Jan 27, 2015
Abstract Hundreds of wild-derived Drosophila melanogaster genomes have been published, but rigorous comparisons across data sets are precluded by differences in alignment methodology. The most common approach to reference-based genome assembly is a single round of alignment followed by quality filtering and variant detection. We evaluated variations and extensions of this approach and settled on an assembly strategy that utilizes two alignment programs and incorporates both substitutions and short indels to construct an updated reference for a second round of mapping prior to final variant detection. Utilizing this approach, we reassembled published D. melanogaster population genomic data sets and added unpublished genomes from several sub-Saharan populations. Most notably, we present aligned data from phase 3 of the Drosophila Population Genomics Project (DPGP3), which provides 197 genomes from a single ancestral range population of D. melanogaster (from Zambia). The large sample size, high genetic diversity, and potentially simpler demographic history of the DPGP3 sample will make this a highly valuable resource for fundamental population genetic research. The complete set of assemblies described here, termed the Drosophila Genome Nexus, presently comprises 623 consistently aligned genomes and is publicly available in multiple formats with supporting documentation and bioinformatic tools. This resource will greatly facilitate population genomic analysis in this model species by reducing the methodological differences between data sets.
0
Citation296
0
Save
0

Sequence of the Sugar Pine Megagenome

Kristian Stevens et al.Oct 29, 2016
Abstract Until very recently, complete characterization of the megagenomes of conifers has remained elusive. The diploid genome of sugar pine (Pinus lambertiana Dougl.) has a highly repetitive, 31 billion bp genome. It is the largest genome sequenced and assembled to date, and the first from the subgenus Strobus, or white pines, a group that is notable for having the largest genomes among the pines. The genome represents a unique opportunity to investigate genome “obesity” in conifers and white pines. Comparative analysis of P. lambertiana and P. taeda L. reveals new insights on the conservation, age, and diversity of the highly abundant transposable elements, the primary factor determining genome size. Like most North American white pines, the principal pathogen of P. lambertiana is white pine blister rust (Cronartium ribicola J.C. Fischer ex Raben.). Identification of candidate genes for resistance to this pathogen is of great ecological importance. The genome sequence afforded us the opportunity to make substantial progress on locating the major dominant gene for simple resistance hypersensitive response, Cr1. We describe new markers and gene annotation that are both tightly linked to Cr1 in a mapping population, and associated with Cr1 in unrelated sugar pine individuals sampled throughout the species’ range, creating a solid foundation for future mapping. This genomic variation and annotated candidate genes characterized in our study of the Cr1 region are resources for future marker-assisted breeding efforts as well as for investigations of fundamental mechanisms of invasive disease and evolutionary response.
0
Citation223
0
Save
0
0

The walnut (Juglans regia) genome sequence reveals diversity in genes coding for the biosynthesis of non‐structural polyphenols

Pedro Martínez-García et al.May 4, 2016
The Persian walnut (Juglans regia L.), a diploid species native to the mountainous regions of Central Asia, is the major walnut species cultivated for nut production and is one of the most widespread tree nut species in the world. The high nutritional value of J. regia nuts is associated with a rich array of polyphenolic compounds, whose complete biosynthetic pathways are still unknown. A J. regia genome sequence was obtained from the cultivar 'Chandler' to discover target genes and additional unknown genes. The 667-Mbp genome was assembled using two different methods (SOAPdenovo2 and MaSuRCA), with an N50 scaffold size of 464 955 bp (based on a genome size of 606 Mbp), 221 640 contigs and a GC content of 37%. Annotation with MAKER-P and other genomic resources yielded 32 498 gene models. Previous studies in walnut relying on tissue-specific methods have only identified a single polyphenol oxidase (PPO) gene (JrPPO1). Enabled by the J. regia genome sequence, a second homolog of PPO (JrPPO2) was discovered. In addition, about 130 genes in the large gallate 1-β-glucosyltransferase (GGT) superfamily were detected. Specifically, two genes, JrGGT1 and JrGGT2, were significantly homologous to the GGT from Quercus robur (QrGGT), which is involved in the synthesis of 1-O-galloyl-β-d-glucose, a precursor for the synthesis of hydrolysable tannins. The reference genome for J. regia provides meaningful insight into the complex pathways required for the synthesis of polyphenols. The walnut genome sequence provides important tools and methods to accelerate breeding and to facilitate the genetic dissection of complex traits.
0
Citation200
0
Save
0

Selection of Sites for Field Trials of Genetically Engineered Mosquitoes with Gene Drive

Gregory Lanzaro et al.Apr 28, 2021
Abstract Novel malaria control strategies using genetically engineered mosquitoes (GEMs) are on the horizon. Population modification is one approach wherein mosquitoes are engineered with genes rendering them refractory to the malaria parasite coupled with a low-threshold, Cas9-based gene drive. When released into a wild vector population, GEMs preferentially transmit these beneficial genes to their offspring, ultimately modifying a vector population into a non-vector one. Deploying this technology awaits evaluation including ecologically contained field trials. Here, we consider a process for site selection, the first critical step in designing a trial. Our goal is to identify a site that maximizes prospects for success, minimizes risk, and serves as a fair, valid, and convincing test of efficacy and impacts of a GEM product intended for large-scale deployment in Africa. We base site selection on geographical, geological, and biological, rather than social or legal, criteria. We recognize the latter as critically important but not preeminent. We propose physical islands as being the best candidates for a GEM field trial and present an evaluation of 22 African islands. We consider geographic and genetic isolation, biological complexity, island size, topography, and identify two island groups that satisfy key criteria for ideal GEM field trial sites.
0
Citation2
0
Save
1

Genomic signatures of local adaptation in recent invasiveAedes aegyptipopulations in California

Shaghayegh Soudi et al.Dec 9, 2022
Abstract Background Rapid adaptation to new environments can facilitate species invasions and range expansions. Understanding the mechanisms of adaptation used by invasive disease vectors in new regions has key implications for mitigating the prevalence and spread of vector-borne disease, although they remain relatively unexplored. Results Here, we use whole-genome sequencing data from 103 Aedes aegypti mosquitoes collected from various sites in southern and central California to infer the genetic structure of invasive populations. We integrate genome data with 25 topo-climate variables to investigate genome-wide signals of local adaptation among populations. Patterns of population structure, as inferred using principle components and admixture analysis, were consistent with three genetic clusters, likely resulting from multiple independent introductions. Using various landscape genomics approaches, which all remove the confounding effects of shared ancestry on correlations between genetic and environmental variation, we identified 112 genes showing strong signals of local environmental adaptation associated with one or more topo-climate factors. Some of them have known effects in climate adaptation, such as heat-shock proteins, which shows selective sweep and recent positive selection acting on these genomic regions. Conclusions Our results provide a genome wide perspective on the distribution of adaptive loci and lay the foundation for future work to understand how environmental adaptation in Ae. aegypti impacts the arboviral disease landscape and how such adaptation could help or hinder efforts at population control.
1
Citation1
0
Save
0

Cas9/guide RNA-based gene-drive dynamics following introduction and introgression into diverse anopheline mosquito genetic backgrounds

Taylor Tushar et al.Nov 13, 2024
Abstract Background Novel technologies are needed to combat anopheline vectors of malaria parasites as the reductions in worldwide disease incidence has stalled in recent years. Gene drive-based approaches utilizing Cas9/guide RNA (gRNA) systems are being developed to suppress anopheline populations or modify them by increasing their refractoriness to the parasites. These systems rely on the successful cleavage of a chromosomal DNA target site followed by homology-directed repair (HDR) in germline cells to bias inheritance of the drive system. An optimal drive system should be highly efficient for HDR-mediated gene conversion with minimal error rates. A gene-drive system, AgNosCd-1, with these attributes has been developed in the Anopheles gambiae G3 strain and serves as a framework for further development of population modification strains. To validate AgNosCd-1 as a versatile platform, it must perform well in a variety of genetic backgrounds. Results We introduced or introgressed AgNosCd-1 into different genetic backgrounds, three in geographically-diverse Anopheles gambiae strains, and one each in an An. coluzzii and An. arabiensis strain. The overall drive inheritance, determined by presence of a dominant marker gene in the F2 hybrids, far exceeded Mendelian inheritance ratios in all genetic backgrounds that produced viable progeny. Haldane’s rule was confirmed for AgNosCd-1 introgression into the An. arabiensis Dongola strain and sterility of the F1 hybrid males prevented production of F2 hybrid offspring. Back-crosses of F1 hybrid females were not performed to keep the experimental design consistent across all the genetic backgrounds and to avoid maternally-generated mutant alleles that might confound the drive dynamics. DNA sequencing of the target site in F1 and F2 mosquitoes with exceptional phenotypes revealed drive system-generated mutations resulting from non-homologous end joining events (NHEJ), which formed at rates similar to AgNosCd-1 in the G3 genetic background and were generated via the same maternal-effect mechanism. Conclusions These findings support the conclusion that the AgNosCd-1 drive system is robust and has high drive inheritance and gene conversion efficiency accompanied by low NHEJ mutation rates in diverse An. gambiae s.l . laboratory strains.
Load More