TS
Tommer Schwarz
Author with expertise in Genomic Studies and Association Analyses
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
8
(88% Open Access)
Cited by:
9
h-index:
7
/
i10-index:
7
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
23

H3k27ac-HiChIP in prostate cell lines identifies risk genes for prostate cancer susceptibility

Claudia Giambartolomei et al.Oct 25, 2020
+8
T
J
C
Abstract Genome-wide association studies (GWAS) have identified more than 140 prostate cancer (PrCa) risk regions which provide potential insights into causal mechanisms. Multiple lines of evidence show that a significant proportion of PrCa risk can be explained by germline causal variants that dysregulate nearby target genes in prostate-relevant tissues thus altering disease risk. The traditional approach to explore this hypothesis has been correlating GWAS variants with steady-state transcript levels, referred to as expression quantitative trait loci (eQTLs). In this work, we assess the utility of chromosome conformation capture (3C) coupled with immunoprecipitation (HiChIP) to identify target genes for PrCa GWAS risk loci. We find that interactome data confirms previously reported PrCa target genes identified through GWAS/eQTL overlap (e.g., MLPH ). Interestingly, HiChIP identified links between PrCa GWAS variants and genes well-known to play a role in prostate cancer biology (e.g., AR ) that are not detected by eQTL-based methods. We validate these findings through CRISPR interference (CRISPRi) perturbation of the variant-containing regulatory elements for NKX3-1 and AR in the LNCaP cell line. Our results demonstrate that looping data harbor additional information beyond eQTLs and expand the number of PrCa GWAS loci that can be linked to candidate susceptibility genes.
23
Citation4
0
Save
0

Leveraging eQTLs to identify individual-level tissue of interest for a complex trait

Arunabha Majumdar et al.Jun 19, 2019
+5
N
C
A
Abstract Genetic predisposition for complex traits often acts through multiple tissues at different time points during development. As a simple example, the genetic predisposition for obesity could be manifested either through inherited variants that control metabolism through regulation of genes expressed in the brain, or that control fat storage through dysregulation of genes expressed in adipose tissue, or both. Here we describe a statistical approach that leverages tissue-specific expression quantitative trait loci (eQTLs) corresponding to tissue-specific genes to prioritize a relevant tissue underlying the genetic predisposition of a given individual for a complex trait. Unlike existing approaches that prioritize relevant tissues for the trait in the population, our approach probabilistically quantifies the tissue-wise genetic contribution to the trait for a given individual. We hypothesize that for a subgroup of individuals the genetic contribution to the trait can be mediated primarily through a specific tissue. Through simulations using the UK Biobank, we show that our approach can predict the relevant tissue accurately and can cluster individuals according to their tissue-specific genetic architecture. We analyze body mass index (BMI) and waist to hip ratio adjusted for BMI (WHRadjBMI) in the UK Biobank to identify subgroups of individuals whose genetic predisposition act primarily through brain versus adipose tissue, and adipose versus muscle tissue, respectively. Notably, we find that these individuals have specific phenotypic features beyond BMI and WHRadjBMI that distinguish them from random individuals in the data, suggesting biological effects of tissue-specific genetic contribution for these traits.
0
Citation3
0
Save
56

Powerful eQTL mapping through low coverage RNA sequencing

Tommer Schwarz et al.Aug 9, 2021
+7
K
T
T
ABSTRACT Mapping genetic variants that regulate gene expression (eQTL mapping) in large-scale RNA sequencing (RNA-seq) studies is often employed to understand functional consequences of regulatory variants. However, the high cost of RNA-Seq limits sample size, sequencing depth, and therefore, discovery power. In this work, we demonstrate that, given a fixed budget, eQTL discovery power can be increased by lowering the sequencing depth per sample and increasing the number of individuals sequenced in the assay. We perform RNA-Seq of whole blood tissue across 1490 individuals at low-coverage (5.9 million reads/sample) and show that the effective power is higher than that of an RNA-Seq study of 570 individuals at high-coverage (13.9 million reads/sample). Next, we leverage synthetic datasets derived from real RNA-Seq data to explore the interplay of coverage and number individuals in eQTL studies, and show that a 10-fold reduction in coverage leads to only a 2.5-fold reduction in statistical power. Our study suggests that lowering coverage while increasing the number of individuals is an effective approach to increase discovery power in RNA-Seq studies.
56
Citation2
0
Save
34

Genetic determinants of chromatin reveal prostate cancer risk mediated by context-dependent gene regulation

Sylvan Baca et al.May 11, 2021
+18
S
C
S
Abstract Methods that link genetic variation to steady-state gene expression levels, such as expression quantitative trait loci (eQTLs), are widely used to functionally annotate trait-associated variants, but they are limited in identifying context-dependent effects on transcription. To address this challenge, we developed the cistrome-wide association study (CWAS), a framework for nominating variants that impact traits through their effects on chromatin state. CWAS associates the genetic determinants of cistromes ( e.g. , the genome-wide profiles of transcription factor binding sites or histone modifications) with traits using summary statistics from genome-wide association studies (GWAS). We performed CWASs of prostate cancer and androgen-related traits, using a reference panel of 307 prostate cistromes from 165 individuals. CWAS nominated susceptibility regulatory elements or androgen receptor (AR) binding sites at 52 out of 98 known prostate cancer GWAS loci and implicated an additional 17 novel loci. We functionally validated a subset of our results using CRISPRi and in vitro reporter assays. At 28 of the 52 risk loci, CWAS identified regulatory mechanisms that are not observable via eQTLs, implicating genes with complex or context-specific regulation that are overlooked by current approaches that relying on steady-state transcript measurements. CWAS genes include transcription factors that govern prostate development such as NKX3-1 , HOXB13 , GATA2 , and KLF5 . Moreover, CWAS boosts discovery power in modestly sized GWAS, identifying novel genetic associations mediated through AR binding for androgen-related phenotypes, including resistance to prostate cancer therapy. CWAS is a powerful and biologically interpretable paradigm for studying variants that influence traits by affecting context-dependent transcriptional regulation.
1

Germline determinants of the prostate tumor genome

Kathleen Houlahan et al.Nov 17, 2022
+38
E
J
K
Abstract A person’s germline genome strongly influences their risk of developing cancer. Yet the molecular mechanisms linking the host genome to the specific somatic molecular phenotypes of individual cancers are largely unknown. We quantified the relationships between germline polymorphisms and somatic mutational features in prostate cancer. Across 1,991 prostate tumors, we identified 23 co-occurring germline and somatic events in close 2D or 3D spatial genomic proximity, affecting 10 cancer driver genes. These driver quantitative trait loci (dQTLs) overlap active regulatory regions, and shape the tumor epigenome, transcriptome and proteome. Some dQTLs are active in multiple cancer types, and information content analyses imply hundreds of undiscovered dQTLs. Specific dQTLs explain at least 16.7% ancestry-biases in rates of TMPRSS2-ERG gene fusions and 67.3% of ancestry-biases in rates of FOXA1 point mutations. These data reveal extensive influences of common germline variation on somatic mutational landscapes.
1

Cell type deconvolution of bulk blood RNA-Seq to reveal biological insights of neuropsychiatric disorders

Toni Boltz et al.May 25, 2023
+9
M
T
T
Genome-wide association studies (GWAS) have uncovered susceptibility loci associated with psychiatric disorders like bipolar disorder (BP) and schizophrenia (SCZ). However, most of these loci are in non-coding regions of the genome with unknown causal mechanisms of the link between genetic variation and disease risk. Expression quantitative trait loci (eQTL) analysis of bulk tissue is a common approach to decipher underlying mechanisms, though this can obscure cell-type specific signals thus masking trait-relevant mechanisms. While single-cell sequencing can be prohibitively expensive in large cohorts, computationally inferred cell type proportions and cell type gene expression estimates have the potential to overcome these problems and advance mechanistic studies. Using bulk RNA-Seq from 1,730 samples derived from whole blood in a cohort ascertained for individuals with BP and SCZ this study estimated cell type proportions and their relation with disease status and medication. We found between 2,875 and 4,629 eGenes for each cell type, including 1,211 eGenes that are not found using bulk expression alone. We performed a colocalization test between cell type eQTLs and various traits and identified hundreds of associations between cell type eQTLs and GWAS loci that are not detected in bulk eQTLs. Finally, we investigated the effects of lithium use on cell type expression regulation and found examples of genes that are differentially regulated dependent on lithium use. Our study suggests that computational methods can be applied to large bulk RNA-Seq datasets of non-brain tissue to identify disease-relevant, cell type specific biology of psychiatric disorders and psychiatric medication.
0

Optimal design of single-cell RNA sequencing experiments for cell-type-specific eQTL analysis

Igor Mandric et al.Sep 12, 2019
+5
A
T
I
Single-cell RNA-sequencing (scRNA-Seq) is a compelling approach to simultaneously measure cellular composition and state which is impossible with bulk profiling approaches. However, it has not yet become a widely used tool in population-scale analyses, due to its prohibitively high cost. Here we show that given the same budget, the statistical power of cell-type-specific expression quantitative trait loci (eQTL) mapping can be increased through low-coverage per-cell sequencing of more samples rather than high-coverage sequencing of fewer samples. We also show that multiple experimental designs with different numbers of samples, cells per sample and reads per cell could have similar statistical power, and choosing an appropriate design can yield large cost savings especially when multiplexed workflows are considered. Finally, we provide a practical approach on selecting cost-effective designs for maximizing cell-type-specific eQTL power.
1

Optimized high-throughput screening of non-coding variants identified from genome-wide association studies

Tunç Morova et al.Mar 12, 2022
+10
C
Y
T
Abstract The vast majority of disease-associated single nucleotide polymorphisms identified from genome-wide association study (GWAS) are localized in non-coding regions. A significant fraction of these variants impact transcription factors binding to enhancer elements and alter gene expression. To functionally interrogate the activity of such variants we developed snpSTARRseq, a high-throughput experimental method that can interrogate the functional impact of hundreds to thousands of non-coding variants on enhancer activity. snpSTARRseq dramatically improves signal-to-noise by utilizing a novel sequencing and bioinformatic approach that increases both insert size and number of variants tested per loci. Using this strategy, we interrogated 70 of 140 known prostate cancer (PCa) risk-associated loci and demonstrated that 26 (37%) of them harbor 36 SNPs that significantly altered enhancer activity. Combining these results with chromosomal looping data we could identify interacting genes and provide a mechanism of action for 20 PCa GWAS risk regions. When benchmarked to orthogonal methods, snpSTARRseq showed a strong correlation with in vivo experimental allelic-imbalance studies whereas there was no correlation with predictive in silico approaches. Overall, snpSTARRseq provides an integrated experimental and computational framework to functionally test non-coding genetic variants.