LC
Lorin Crawford
Author with expertise in Genetic Architecture of Quantitative Traits
Providence College, Brown University, Microsoft (United States)
+ 6 more
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
23
(78% Open Access)
Cited by:
34
h-index:
14
/
i10-index:
21
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
3

Convergent evolution of p38/MAPK activation in hormone resistant prostate cancer mediates pro-survival, immune evasive, and metastatic phenotypes

Kathryn Ware et al.Oct 24, 2023
+20
J
S
K
Summary Adaptation of cancer cells to targeted therapy follows ecological paradigms observed in natural populations that encounter resource depletion and changing environments, including activation of pro-survival mechanisms, migration to new locations, and escape of predation. We identified the p38 MAPK pathway as a common molecular driver of these three responses during the adaptation to hormone therapy resistance in prostate cancer. The p38 pathway is activated in therapy-resistant cells and mechanistically drives these three convergent responses through sustained AR activity, enhanced invasion and metastasis, and immune evasion. Targeting p38 signaling may represent a new therapeutic strategy to treat men with metastatic, hormone therapy-resistant prostate cancer.
64

Multi-scale Inference of Genetic Trait Architecture using Biologically Annotated Neural Networks

Pınar Demetçi et al.Oct 24, 2023
+3
G
W
P
Abstract In this article, we present Biologically Annotated Neural Networks (BANNs), a nonlinear probabilistic framework for association mapping in genome-wide association (GWA) studies. BANNs are feedforward models with partially connected architectures that are based on biological annotations. This setup yields a fully interpretable neural network where the input layer encodes SNP-level effects, and the hidden layer models the aggregated effects among SNP-sets. We treat the weights and connections of the network as random variables with prior distributions that reflect how genetic effects manifest at different genomic scales. The BANNs software uses variational inference to provide posterior summaries which allow researchers to simultaneously perform ( i ) mapping with SNPs and ( ii ) enrichment analyses with SNP-sets on complex traits. Through simulations, we show that our method improves upon state-of-the-art association mapping and enrichment approaches across a wide range of genetic architectures. We then further illustrate the benefits of BANNs by analyzing real GWA data assayed in approximately 2,000 heterogenous stock of mice from the Wellcome Trust Centre for Human Genetics and approximately 7,000 individuals from the Framingham Heart Study. Lastly, using a random subset of individuals of European ancestry from the UK Biobank, we show that BANNs is able to replicate known associations in high and low-density lipoprotein cholesterol content. Author Summary A common goal in genome-wide association (GWA) studies is to characterize the relationship between genotypic and phenotypic variation. Linear models are widely used tools in GWA analyses, in part, because they provide significance measures which detail how individual single nucleotide polymorphisms (SNPs) are statistically associated with a trait or disease of interest. However, traditional linear regression largely ignores non-additive genetic variation, and the univariate SNP-level mapping approach has been shown to be underpowered and challenging to interpret for certain trait architectures. While nonlinear methods such as neural networks are well known to account for complex data structures, these same algorithms have also been criticized as “black box” since they do not naturally carry out statistical hypothesis testing like classic linear models. This limitation has prevented nonlinear regression approaches from being used for association mapping tasks in GWA applications. Here, we present Biologically Annotated Neural Networks (BANNs): a flexible class of feedforward models with partially connected architectures that are based on biological annotations. The BANN framework uses approximate Bayesian inference to provide interpretable probabilistic summaries which can be used for simultaneous ( i ) mapping with SNPs and ( ii ) enrichment analyses with SNP-sets (e.g., genes or signaling pathways). We illustrate the benefits of our method over state-of-the-art approaches using extensive simulations. We also demonstrate the ability of BANNs to recover novel and previously discovered genomic associations using quantitative traits from the Wellcome Trust Centre for Human Genetics, the Framingham Heart Study, and the UK Biobank.
1

MegaLMM: Mega-scale linear mixed models for genomic predictions with thousands of traits

Daniel Runcie et al.Oct 24, 2023
L
H
J
D
ABSTRACT Large-scale phenotype data can enhance the power of genomic prediction in plant and animal breeding, as well as human genetics. However, the statistical foundation of multi-trait genomic prediction is based on the multivariate linear mixed effect model, a tool notorious for its fragility when applied to more than a handful of traits. We present MegaLMM , a statistical framework and associated software package for mixed model analyses of a virtually unlimited number of traits. Using three examples with real plant data, we show that MegaLMM can leverage thousands of traits at once to significantly improve genetic value prediction accuracy.
1
Citation5
0
Save
27

Leveraging the Genetic Correlation between Traits Improves the Detection of Epistasis in Genome-wide Association Studies

Julian Stamp et al.Oct 24, 2023
L
D
A
J
Abstract Epistasis, commonly defined as the interaction between genetic loci, is known to play an important role in the phenotypic variation of complex traits. As a result, many statistical methods have been developed to identify genetic variants that are involved in epistasis, and nearly all of these approaches carry out this task by focusing on analyzing one trait at a time. Previous studies have shown that jointly modeling multiple phenotypes can often dramatically increase statistical power for association mapping. In this study, we present the “multivariate MArginal ePIstasis Test” (mvMAPIT) — a multi-outcome generalization of a recently proposed epistatic detection method which seeks to detect marginal epistasis or the combined pairwise interaction effects between a given variant and all other variants. By searching for marginal epistatic effects, one can identify genetic variants that are involved in epistasis without the need to identify the exact partners with which the variants interact — thus, potentially alleviating much of the statistical and computational burden associated with conventional explicit search-based methods. Our proposed mvMAPIT builds upon this strategy by taking advantage of correlation structure between traits to improve the identification of variants involved in epistasis. We formulate mvMAPIT as a multivariate linear mixed model and develop a multi-trait variance component estimation algorithm for efficient parameter inference and P -value computation. Together with reasonable model approximations, our proposed approach is scalable to moderately sized GWA studies. With simulations, we illustrate the benefits of mvMAPIT over univariate (or single-trait) epistatic mapping strategies. We also apply mvMAPIT framework to protein sequence data from two broadly neutralizing anti-influenza antibodies and approximately 2,000 heterogenous stock of mice from the Wellcome Trust Centre for Human Genetics. The mvMAPIT R package can be downloaded at https://github.com/lcrawlab/mvMAPIT .
27
Citation4
0
Save
0

Discovering non-additive heritability using additive GWAS summary statistics

Samuel Smith et al.Sep 11, 2024
+4
D
G
S
LD score regression (LDSC) is a method to estimate narrow-sense heritability from genome-wide association study (GWAS) summary statistics alone, making it a fast and popular approach. In this work, we present interaction-LD score (i-LDSC) regression: an extension of the original LDSC framework that accounts for interactions between genetic variants. By studying a wide range of generative models in simulations, and by re-analyzing 25 well-studied quantitative phenotypes from 349,468 individuals in the UK Biobank and up to 159,095 individuals in BioBank Japan, we show that the inclusion of a cis -interaction score (i.e. interactions between a focal variant and proximal variants) recovers genetic variance that is not captured by LDSC. For each of the 25 traits analyzed in the UK Biobank and BioBank Japan, i-LDSC detects additional variation contributed by genetic interactions. The i-LDSC software and its application to these biobanks represent a step towards resolving further genetic contributions of sources of non-additive genetic effects to complex trait variation.
0
Paper
Citation2
0
Save
64

Accounting for statistical non-additive interactions enables the recovery of missing heritability from GWAS summary statistics

Samuel Smith et al.Oct 24, 2023
+4
D
G
S
Abstract LD score regression ( LDSC ) is a method to estimate narrow-sense heritability from genome-wide association study (GWAS) summary statistics alone, making it a fast and popular approach. In this work, we present interaction-LD score ( i-LDSC ) regression: an extension of the original LDSC framework that accounts for interactions between genetic variants. By studying a wide range of generative models in simulations, and by re-analyzing 25 well-studied quantitative phenotypes from 349,468 individuals in the UK Biobank and up to 159,095 individuals in BioBank Japan, we show that the inclusion of a cis -interaction score (i.e., interactions between a focal variant and proximal variants) recovers genetic variance that is not captured by LDSC . For each of the 25 traits analyzed in the UK Biobank and BioBank Japan, i-LDSC detects additional variation contributed by genetic interactions. The i-LDSC software and its application to these biobanks represent a step towards resolving further genetic contributions of sources of non-additive genetic effects to complex trait variation.
64
Citation2
0
Save
0

Natural variation in the regulation of neurodevelopmental genes modifies flight performance inDrosophila

Adam Spierer et al.Jun 3, 2024
+3
S
J
A
Abstract The winged insects of the order Diptera are colloquially named for their most recognizable phenotype: flight. These insects rely on flight for a number of important life history traits, like dispersal, foraging, and courtship. Despite the importance of flight, relatively little is known about the genetic architecture of variation for flight performance. Accordingly, we sought to uncover the genetic modifiers of flight using a measure of flies’ reaction and response to an abrupt drop in a vertical flight column. We conducted an association study using 197 of the Drosophila Genetic Reference Panel (DGRP) lines, and identified a combination of additive and marginal variants, epistatic interactions, whole genes, and enrichment across interaction networks. We functionally validated 13 of these candidate genes’ ( Adgf-A/Adgf-A2/CG32181, bru1, CadN, CG11073, CG15236, CG9766, CREG, Dscam4, form3, fry, Lasp/CG9692, Pde6, Snoo ) contribution to flight, two of which ( fry and Snoo ) also validate a whole gene analysis we introduce for the DGRP: PEGASUS_flies . Overall, our results suggest modifiers of muscle and wing morphology, and peripheral and central nervous system assembly and function are all important for flight performance. Additionally, we identified ppk23 , an Acid Sensing Ion Channel (ASIC) homolog, as an important hub for epistatic interactions. These results represent a snapshot of the genetic modifiers affecting drop-response flight performance in Drosophila , with implications for other insects. It also draws connections between genetic modifiers of performance and BMP signaling and ASICs as targets for treating neurodegeneration and neurodysfunction. Author summary Insect flight is a widely recognizable phenotype of winged insects, hence the name: flies. While fruit flies, or Drosophila melanogaster , are a genetically tractable model, flight performance is a highly integrative phenotype, making it challenging to comprehensively identify the genetic modifiers that contribute to its genetic architecture. Accordingly, we screened 197 Drosophila Genetic Reference Panel lines for their ability to react and respond to an abrupt drop. Using several computational tools, we successfully identified several additive, marginal, and epistatic variants, as well as whole genes and altered sub-networks of gene-gene and protein-protein interaction networks, demonstrating the benefits of using multiple methodologies to elucidate the genetic architecture of complex traits more generally. Many of these significant genes and variants mapped to regions of the genome that affect development of sensory and motor neurons, wing and muscle development, and regulation of transcription factors. We also introduce PEGASUS_flies, a Drosophila -adapted version of the PEGASUS platform first used in human studies, to infer gene-level significance of association based on the distribution of individual variant P -values. Our results contribute to the debate over the relative importance of individual, additive factors and epistatic, or higher order, interactions, in the mapping of genotype to phenotype.
0
Citation2
0
Save
60

Enrichment analyses identify shared associations for 25 quantitative traits in over 600,000 individuals from seven diverse ancestries

Samuel Smith et al.Oct 24, 2023
+12
W
S
S
Abstract Since 2005, genome-wide association (GWA) datasets have been largely biased toward sampling European ancestry individuals, and recent studies have shown that GWA results estimated from self-identified European individuals are not transferable to non-European individuals due to various confounding challenges. Here, we demonstrate that enrichment analyses which aggregate SNP-level association statistics at multiple genomic scales—from genes to genomic regions and pathways—have been underutilized in the GWA era and can generate biologically interpretable hypotheses regarding the genetic basis of complex trait architecture. We illustrate examples of the robust associations generated by enrichment analyses while studying 25 continuous traits assayed in 566,786 individuals from seven diverse self-identified human ancestries in the UK Biobank and the Biobank Japan, as well as 44,348 admixed individuals from the PAGE consortium including cohorts of African-American, Hispanic and Latin American, Native Hawaiian, and American Indian/Alaska Native individuals. We identify 1,000 gene-level associations that are genome-wide significant in at least two ancestry cohorts across these 25 traits, as well as highly conserved pathway associations with triglyceride levels in European, East Asian, and Native Hawaiian cohorts.
39

Randomized gates eliminate bias in sort-seq assays

Brian Trippe et al.Oct 24, 2023
+5
E
B
B
Sort-seq assays are a staple of the biological engineering toolkit, allowing researchers to profile many groups of cells based on any characteristic that can be tied to fluorescence. However, current approaches, which segregate cells into bins deterministically based on their measured fluorescence, introduce systematic bias. We describe a surprising result: one can obtain unbiased estimates by incorporating randomness into sorting. We validate this approach in simulation and experimentally, and describe extensions for both estimating group level variances and for using multi-bin sorters.
39
Paper
Citation1
0
Save
0

Scalable nonparametric clustering with unified marker gene selection for single-cell RNA-seq data

Chibuikem Nwizu et al.May 27, 2024
+7
M
M
C
Clustering is commonly used in single-cell RNA-sequencing (scRNA-seq) pipelines to characterize cellular heterogeneity. However, current methods face two main limitations. First, they require user-specified heuristics which add time and complexity to bioinformatic workflows; second, they rely on post-selective differential expression analyses to identify marker genes driving cluster differences, which has been shown to be subject to inflated false discovery rates. We address these challenges by introducing nonparametric clustering of single-cell populations (NCLUSION): an infinite mixture model that leverages Bayesian sparse priors to identify marker genes while simultaneously performing clustering on single-cell expression data. NCLUSION uses a scalable variational inference algorithm to perform these analyses on datasets with up to millions of cells. By analyzing publicly available scRNA-seq studies, we demonstrate that NCLUSION (i) matches the performance of other state-of-the-art clustering techniques with significantly reduced runtime and (ii) provides statistically robust and biologically relevant transcriptomic signatures for each of the clusters it identifies. Overall, NCLUSION represents a reliable hypothesis-generating tool for understanding patterns of expression variation present in single-cell populations.
Load More