CW
Cory Weller
Author with expertise in Genetic Architecture of Quantitative Traits
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
7
(71% Open Access)
Cited by:
6
h-index:
5
/
i10-index:
2
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Unique genetic signatures of local adaptation over space and time for diapause, an ecologically relevant complex trait, inDrosophila melanogaster

Priscilla Erickson et al.May 8, 2020
Abstract Organisms living in seasonally variable environments utilize cues such as light and temperature to induce plastic responses, enabling them to exploit favorable seasons and avoid unfavorable ones. Local adapation can result in variation in seasonal responses, but the genetic basis and evolutionary history of this variation remains elusive. Many insects, including Drosophila melanogaster, are able to undergo an arrest of reproductive development (diapause) in response to unfavorable conditions. In D. melanogaster , the ability to diapause is more common in high latitude populations, where flies endure harsher winters, and in the spring, reflecting differential survivorship of overwintering populations. Using a novel hybrid swarm-based genome wide association study, we examined the genetic basis and evolutionary history of ovarian diapause. We exposed outbred females to different temperatures and day lengths, characterized ovarian development for over 2800 flies, and reconstructed their complete, phased genomes. We found that diapause, scored at two different developmental cutoffs, has modest heritability, and we identified hundreds of SNPs associated with each of the two phenotypes. Alleles associated with one of the diapause phenotypes tend to be more common at higher latitudes, but these alleles do not show predictable seasonal variation. The collective signal of many small-effect, clinally varying SNPs can plausibly explain latitudinal variation in diapause seen in North America. Alleles associated with diapause are segregating at relatively high frequencies in Zambia, suggesting that variation in diapause relies on ancestral polymorphisms, and both pro- and anti-diapause alleles have experienced selection in North America. Finally, we utilized outdoor mesocosms to track diapause under natural conditions. We found that hybrid swarms reared outdoors evolved increased propensity for diapause in late fall, whereas indoor control populations experienced no such change. Our results indicate that diapause is a complex, quantitative trait with different evolutionary patterns across time and space. Author Summary Animals exhibit diverse strategies to cope with unfavorable conditions in temperate, seasonally varying environments. The model fly, Drosophila melanogaster , can enter a physiological state known as diapause under winter-like conditions. Diapause is characterized by an absence of egg maturation in females and is thought to conserve energy for survival during stressful times. The ability to diapause is more common in flies from higher latitudes and in offspring from flies that have recently overwintered. Therefore, diapause has been thought to be a recent adaptation to temperate climates. We identified hundreds of genetic variants that affect diapause and found that some vary predictably across latitudes in North America. We found little signal of repeated seasonality in diapause-associated genetic variants, but our populations evolved an increased ability to diapause in the winter when they were exposed to natural conditions. Combined, our results suggest that diapause-associated variants evolve differently across space and time. We find little evidence that diapause evolved recently in temperate environments; rather, SNPs associated with diapause tend to be quite common in Zambia, suggesting that diapause may promote survival under stresses other than cold. Our results provide future targets for research into the genetic underpinnings of this complex, ecologically relevant trait.
0
Citation4
0
Save
0

ProtPipe: A Multifunctional Data Analysis Pipeline for Proteomics and Peptidomics

Ziyi Li et al.Dec 13, 2023
Mass spectrometry (MS) is a technique widely employed for the identification and characterization of proteins, personalized medicine, systems biology and biomedical applications. By combining MS with different proteomics approaches such as immunopurification MS, immunopeptidomics, and total protein proteomics, researchers can gain insights into protein-protein interactions, immune responses, cellular processes, and disease mechanisms. The application of MS-based proteomics in these areas continues to advance our understanding of protein function, cellular signaling, and complex biological systems. Data analysis for mass spectrometry is a critical process that includes identifying and quantifying proteins and peptides and exploring biological functions for these proteins in downstream analysis. To address the complexities associated with MS data analysis, we developed ProtPipe to streamline and automate the processing and analysis of high-throughput proteomics and peptidomics datasets. The pipeline facilitates data quality control, sample filtering, and normalization, ensuring robust and reliable downstream analysis. ProtPipe provides downstream analysis including identifying differential abundance proteins and peptides, pathway enrichment analysis, protein-protein interaction analysis, and MHC1-peptide binding affinity. ProtPipe generates annotated tables and diagnostic visualizations from statistical postprocessing and computation of fold-changes across pairwise conditions, predefined in an experimental design. ProtPipe is well-documented open-source software and is available at https://github.com/NIH-CARD/ProtPipe , accompanied by a web interface.
0
Citation1
0
Save
22

Long-read genomes reveal pangenomic variation underlying yeast phenotypic diversity

Cory Weller et al.Nov 20, 2022
Abstract Understanding the genetic causes of trait variation is a primary goal of genetic research. One way that individuals can vary genetically is through the existence of variable pangenomic genes – genes that are only present in some individuals in a population. The presence or absence of entire genes could have large effects on trait variation. However, variable pangenomic genes can be missed in standard genotyping workflows, due to reliance on aligning short-read sequencing to reference genomes. A popular method for studying the genetic basis of trait variation is linkage mapping, which identifies quantitative trait loci (QTLs), regions of the genome that harbor causative genetic variants. Large-scale linkage mapping in the budding yeast Saccharomyces cerevisiae has found thousands of QTLs affecting myriad yeast phenotypes. To enable the resolution of QTLs caused by variable pangenomic genes, we used long-read sequencing to generate highly complete de novo assemblies of 16 diverse yeast isolates. With these assemblies we resolved growth QTLs to specific genes that are absent from the reference genome but present in the broader yeast population at appreciable frequency. Copies of genes also recombine onto chromosomes where they are absent in the reference genome, and we found that these copies generate additional QTLs whose resolution requires pangenome characterization. Our findings demonstrate the power of long-read sequencing to identify the genetic basis of trait variation.
22
Citation1
0
Save
0

Accurate, ultra-low coverage genome reconstruction and association studies in Hybrid Swarm mapping populations

Cory Weller et al.Jun 21, 2019
Genetic association mapping studies seek to uncover the link between genotype and phenotype, and often utilize inbred reference panels as a replicable source of genetic variation. However, inbred reference panels can differ substantially from wild populations in their genotypic distribution, and patterns of linkage-disequilibrium and nucleotide diversity. As a result, associations discovered using inbred reference panels may not reflect the genetic basis of phenotypic variation in natural populations. To address this problem, we evaluated a mapping population design where dozens to hundreds of inbred lines are outbred for few (e.g. five) generations, which we call the Hybrid Swarm. The Hybrid Swarm approach has likely remained underutilized relative to pre-sequenced inbred lines due to the costs of genome-wide genotyping. To reduce sequencing costs and make the Hybrid Swarm approach feasible, we developed a computational pipeline that reconstructs accurate whole genomes from ultra-low-coverage (0.05X) sequence data in Hybrid Swarm populations derived from ancestors with phased haplotypes. We compared the power and precision of GWAS using the Hybrid Swarm, inbred lines, recombinant inbred lines, and highly outbred populations across a range of allele frequencies and effect sizes, modeling genetic variation from the Drosophila Genetic Reference Panel as well as variation from neutral simulations. While inbred populations tended to perform best due to the intrinsic power benefits conferred by the lack of heterozygotes, association mapping with the Hybrid Swarm performed comparably to highly outbred (F50) populations and has higher precision than mapping with inbred lines. Taken together, our results demonstrate the feasibility of the Hybrid Swarm as a cost-effective method of fine-scale genetic mapping.
0

ProtPipe: A Multifunctional Data Analysis Pipeline for Proteomics and Peptidomics

Ziyi Li et al.Nov 22, 2024
Mass spectrometry (MS) is a technique widely employed for the identification and characterization of proteins, with personalized medicine, systems biology, and biomedical applications. The application of MS-based proteomics advances our understanding of protein function, cellular signaling, and complex biological systems. MS data analysis is a critical process that includes identifying and quantifying proteins and peptides and then exploring their biological functions in downstream analysis. To address the complexities associated with MS data analysis, we developed ProtPipe to streamline and automate the processing and analysis of high-throughput proteomics and peptidomics datasets with DIA-NN preinstalled. The pipeline facilitates data quality control, sample filtering, and normalization, ensuring robust and reliable downstream analyses. ProtPipe provides downstream analyses, including protein and peptide differential abundance identification, pathway enrichment analysis, protein-protein interaction analysis, and Major histocompatibility complex (MHC) -peptide binding affinity analysis. ProtPipe generates annotated tables and visualizations by performing statistical postprocessing and calculating fold changes between predefined pairwise conditions in an experimental design. It is an open-source, well-documented tool available online at https://github.com/NIH-CARD/ProtPipe, with a user-friendly web interface.
0

Comprehensive deletion scan of anti-CRISPR AcrIIA4 reveals essential and dispensable domains for Cas9 inhibition

Annette Iturralde et al.Nov 21, 2024
Delineating a protein's essential and dispensable domains provides critical insight into how it carries out its function. Here, we developed a high-throughput method to synthesize and test the functionality of all possible in-frame and continuous deletions in a gene of interest, enabling rapid and unbiased determination of protein domain importance. Our approach generates precise deletions using a CRISPR library framework that is free from constraints of gRNA target site availability and efficacy. We applied our method to AcrIIA4, a phage-encoded anti-CRISPR protein that robustly inhibits SpCas9. Extensive structural characterization has shown that AcrIIA4 physically occupies the DNA-binding interfaces of several SpCas9 domains; nonetheless, the importance of each AcrIIA4 interaction for SpCas9 inhibition is unknown. We used our approach to determine the essential and dispensable regions of AcrIIA4. Surprisingly, not all contacts with SpCas9 were required, and in particular, we found that the AcrIIA4 loop that inserts into SpCas9’s RuvC catalytic domain can be deleted. Our results show that AcrIIA4 inhibits SpCas9 primarily by blocking PAM binding and that its interaction with the SpCas9 catalytic domain is inessential.
0

Comprehensive deletion scan of anti-CRISPR AcrIIA4 reveals essential and dispensable domains for Cas9 inhibition

Annette Iturralde et al.Jul 9, 2024
Abstract Delineating a protein’s essential and dispensable domains provides critical insight into how it carries out its function. Here, we developed a high-throughput method to synthesize and test the functionality of all possible in-frame and continuous deletions in a gene of interest, enabling rapid and unbiased determination of protein domain importance. Our approach generates precise deletions using a CRISPR library framework that is free from constraints of gRNA target site availability and efficacy. We applied our method to AcrIIA4, a phage-encoded anti-CRISPR protein that robustly inhibits SpCas9. Extensive structural characterization has shown that AcrIIA4 physically occupies the DNA-binding interfaces of several SpCas9 domains; nonetheless, the importance of each AcrIIA4 interaction for SpCas9 inhibition is unknown. We used our approach to determine the essential and dispensable regions of AcrIIA4. Surprisingly, not all contacts with SpCas9 were required, and in particular, we found that the AcrIIA4 loop that inserts into SpCas9’s RuvC catalytic domain can be deleted. Our results show that AcrIIA4 inhibits SpCas9 primarily by blocking PAM binding, and that its interaction with the SpCas9 catalytic domain is inessential.