MG
Mary Gordon
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
10
(70% Open Access)
Cited by:
551
h-index:
9
/
i10-index:
10
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

Tensor decomposition reveals coordinated multicellular patterns of transcriptional variation that distinguish and stratify disease individuals

Joseph Mitchel et al.Feb 18, 2022
Summary Tissue- and organism-level biological processes often involve coordinated action of multiple distinct cell types. Current computational methods for the analysis of single-cell RNA-sequencing (scRNA-seq) data, however, are not designed to capture co-variation of cell states across samples, in part due to the low number of biological samples in most scRNA-seq datasets. Recent advances in sample multiplexing have enabled population-scale scRNA-seq measurements of tens to hundreds of samples. To take advantage of such datasets, here we introduce a computational approach called single-cell Interpretable Tensor Decomposition (scITD). This method extracts “multicellular gene expression patterns” that capture how sample-specific expression states of a cell type are correlated with the expression states of other cell types. Such multicellular patterns can reveal molecular mechanisms underlying coordinated changes of different cell types within the tissue, and can be used to stratify individuals in a clinically-relevant and reproducible manner. We first validated the performance of scITD using in vitro experimental data and simulations. We then applied scITD to scRNA-seq data on peripheral blood mononuclear cells (PBMCs) from 115 patients with systemic lupus erythematosus and 56 healthy controls. We recapitulated a well-established pan-cell-type signature of interferon-signaling that was associated with the presence of anti-dsDNA autoantibodies and a disease activity index. We further identified a novel multicellular pattern linked to nephritis, which was characterized by an expansion of activated memory B cells along with helper T cell activation. Our approach also sheds light on ligand-receptor interactions potentially mediating these multicellular patterns. As validation, we demonstrated that these expression patterns also stratified donors from a pediatric SLE dataset by the same phenotypic attributes. Lastly, we found the interferon multicellular pattern and others to be conserved in a COVID-19 dataset, pointing to the presence of both general and disease-specific patterns of inter-individual immune variation. Overall, scITD is a flexible method for exploring co-variation of cell states in multi-sample single-cell datasets, which can yield new insights into complex non-cell-autonomous dependencies that define and stratify disease.
1
Citation17
0
Save
32

Fast and powerful statistical method for context-specific QTL mapping in multi-context genomic studies

Andrew Lu et al.Jun 18, 2021
Abstract Recent studies suggest that context-specific eQTLs underlie genetic risk factors for complex diseases. However, methods for identifying them are still nascent, limiting their comprehensive characterization and downstream interpretation of disease-associated variants. Here, we introduce FastGxC, a method to efficiently and powerfully map context-specific eQTLs by leveraging the correlation structure of multi-context studies. We first show via simulations that FastGxC is orders of magnitude more powerful and computationally efficient than previous approaches, making previously year-long computations possible in minutes. We next apply FastGxC to bulk multi-tissue and single-cell RNA-seq data sets to produce the most comprehensive tissue- and cell-type-specific eQTL maps to date. We then validate these maps by establishing that context-specific eQTLs are enriched in corresponding functional genomic annotations. Finally, we examine the relationship between context-specific eQTLs and human disease and show that FastGxC context-specific eQTLs provide a three-fold increase in precision to identify relevant tissues and cell types for GWAS variants than standard eQTLs. In summary, FastGxC enables the construction of context-specific eQTL maps that can be used to understand the context-specific gene regulatory mechanisms underlying complex human diseases.
32
Citation9
0
Save
1

Multi-context genetic modeling of transcriptional regulation resolves novel disease loci

Michael Thompson et al.Sep 23, 2021
Abstract A majority of the variants identified in genome-wide association studies fall in non-coding regions of the genome, indicating their mechanism of impact is mediated via gene expression. Leveraging this hypothesis, transcriptome-wide association studies (TWAS) have assisted in both the interpretation and discovery of additional genes associated with complex traits. However, existing methods for conducting TWAS do not take full advantage of the intra-individual correlation inherently present in multi-context expression studies and do not properly adjust for multiple testing across contexts. We developed CONTENT— a computationally efficient method with proper cross-context false discovery correction that leverages correlation structure across contexts to improve power and generate context-specific and context-shared components of expression. We applied CONTENT to bulk multi-tissue and single-cell RNA-seq data sets and show that CONTENT leads to a 42% (bulk) and 110% (single cell) increase in the number of genetically predicted genes relative to previous approaches. Interestingly, we find the context-specific component of expression comprises 30% of heritability in tissue-level bulk data and 75% in single-cell data, consistent with cell type heterogeneity in bulk tissue. In the context of TWAS, CONTENT increased the number of gene-phenotype associations discovered by over 47% relative to previous methods across 22 complex traits.
1
Citation3
0
Save
0

Genetic variants associated with cell-type-specific intra-individual gene expression variability reveal new mechanisms of genome regulation

Joseph Powell et al.May 7, 2024
Abstract Gene expression levels can vary substantially across cells, even in a seemingly homogeneous cell population. Identifying the relationships between genetic variation and gene expression is critical for understanding the mechanisms of genome regulation. However, the genetic control of gene expression variability among the cells within individuals has yet to be extensively examined. This is primarily due to the statistical challenges, such as the need for sufficiently powered cohorts and adjusting mean-variance dependence. Here, we introduce MEOTIVE (Mapping genetic Effects On inTra-Individual Variability of gene Expression), a novel statistical framework to identify genetic effects on the gene expression variability (sc-veQTL) accounting for the mean-variance dependence. Using single-cell RNA-seq data of 1.2 million peripheral blood mononuclear cells from 980 human donors, we identified 14 – 3,488 genes with significant sc-veQTLs (study-wide q -value < 0.05) across different blood cell types, 2,103 of which were shared across more than one cell type. We further detected 55 SNP-gene pairs (in 34 unique genes) by directly linking genetic variations with gene expression dispersion (sc-deQTL) regardless of mean-variance dependence, and these genes were enriched in biological processes relevant to immune response and viral infection. An example is rs1131017 ( p <9.08×10 −52 ), a sc-veQTL in the 5’UTR of RPS26 , which shows a ubiquitous dispersion effect across cell types, with higher dispersion levels associated with lower auto-immune disease risk, including rheumatoid arthritis and type 1 diabetes. Another example is LYZ , which is associated with antibacterial activity against bacterial species and was only detected with a monocyte-specific deQTL (rs1384) located at the 3’ UTR region ( p =1.48×10 −11 ) and replicated in an independent cohort. Our results demonstrate an efficient and robust statistical method to identify genetic effects on gene expression variability and how these associations and their involved pathways confer auto-immune disease risk. This analytical framework provides a new approach to unravelling the genetic regulation of gene expression at the single-cell resolution, advancing our understanding of complex biological processes.
0

Genetic determinants of co-accessible chromatin regions in T cell activation across humans

Rachel Gate et al.Dec 2, 2016
Abstract Over 90% of genetic variants associated with complex human traits map to non-coding regions, but little is understood about how they modulate gene regulation in health and disease. One possible mechanism is that genetic variants affect the activity of one or more cis-regulatory elements leading to gene expression variation in specific cell types. To identify such cases, we analyzed Assay for Transposase-Accessible Chromatin sequencing (ATAC-seq) and RNA-seq profiles from activated CD4+ T cells of up to 105 healthy donors. We found that regions of accessible chromatin (ATAC-peaks) are co-accessible at kilobase and megabase resolution, in patterns consistent with the 3D organization of chromosomes measured by in situ Hi-C in T cells. 15% of genetic variants located within ATAC-peaks affected the accessibility of the corresponding peak through disrupting binding sites for transcription factors important for T cell differentiation and activation. These ATAC quantitative trait nucleotides (ATAC-QTNs) have the largest effects on co-accessible peaks, are associated with gene expression from the same aliquot of cells, are rarely affecting core binding motifs, and are enriched for autoimmune disease variants. Our results provide insights into how natural genetic variants modulate cis-regulatory elements, in isolation or in concert, to influence gene expression in primary immune cells that play a key role in many human diseases.
1

Robust Sequence Determinants of α-Synuclein Toxicity in Yeast Implicate Membrane Binding

Robert Newberry et al.May 3, 2020
ABSTRACT Protein conformations are shaped by cellular environments, but how environmental changes alter the conformational landscapes of specific proteins in vivo remains largely uncharacterized, in part due to the challenge of probing protein structures in living cells. Here, we use deep mutational scanning to investigate how a toxic conformation of α-synuclein, a dynamic protein linked to Parkinson’s disease, responds to perturbations of cellular proteostasis. In the context of a course for graduate students in the UCSF Integrative Program in Quantitative Biology, we screened a comprehensive library of α-synuclein missense mutants in yeast cells treated with a variety of small molecules that perturb cellular processes linked to α-synuclein biology and pathobiology. We found that the conformation of α-synuclein previously shown to drive yeast toxicity—an extended, membrane-bound helix—is largely unaffected by these chemical perturbations, underscoring the importance of this conformational state as a driver of cellular toxicity. On the other hand, the chemical perturbations have a significant effect on the ability of mutations to suppress α-synuclein toxicity. Moreover, we find that sequence determinants of α-synuclein toxicity are well described by a simple structural model of the membrane-bound helix. This model predicts that α-synuclein penetrates the membrane to constant depth across its length but that membrane affinity decreases toward the C terminus, which is consistent with orthogonal biophysical measurements. Finally, we discuss how parallelized chemical genetics experiments can provide a robust framework for inquiry-based graduate coursework.