SY
Seyhan Yazar
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
13
(54% Open Access)
Cited by:
2,126
h-index:
39
/
i10-index:
74
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Large-scale cis- and trans-eQTL analyses identify thousands of genetic loci and polygenic scores that regulate blood gene expression

Urmo Võsa et al.Sep 1, 2021
Trait-associated genetic variants affect complex phenotypes primarily via regulatory mechanisms on the transcriptome. To investigate the genetics of gene expression, we performed cis- and trans-expression quantitative trait locus (eQTL) analyses using blood-derived expression from 31,684 individuals through the eQTLGen Consortium. We detected cis-eQTL for 88% of genes, and these were replicable in numerous tissues. Distal trans-eQTL (detected for 37% of 10,317 trait-associated variants tested) showed lower replication rates, partially due to low replication power and confounding by cell type composition. However, replication analyses in single-cell RNA-seq data prioritized intracellular trans-eQTL. Trans-eQTL exerted their effects via several mechanisms, primarily through regulation by transcription factors. Expression of 13% of the genes correlated with polygenic scores for 1,263 phenotypes, pinpointing potential drivers for those traits. In summary, this work represents a large eQTL resource, and its results serve as a starting point for in-depth interpretation of complex phenotypes. Analyses of expression profiles from whole blood of 31,684 individuals identify cis-expression quantitative trait loci (eQTL) effects for 88% of genes and trans-eQTL effects for 37% of trait-associated variants.
0
Citation851
0
Save
13

Pitfalls and opportunities for applying PEER factors in single-cell eQTL analyses

Anke Xue et al.Aug 2, 2022
Abstract Using latent variables in gene expression data can help correct spurious correlations due to unobserved confounders and increase statistical power for expression Quantitative Trait Loci (eQTL) detection. Probabilistic Estimation of Expression Residuals (PEER) is a widely used statistical method that has been developed to remove unwanted variation and improve eQTL discovery power in bulk RNA-seq analysis. However, its performance has not been largely evaluated in single-cell eQTL data analysis, where it is becoming a commonly used technique. Potential challenges arise due to the structure of single-cell data, including sparsity, skewness, and mean-variance relationship. Here, we show by a series of analyses that this method requires additional quality control and data transformation steps on the pseudo-bulk matrix to obtain valid PEER factors. By using a population-scale single-cell cohort (OneK1K, N = 982), we found that generating PEER factors without further QC or transformation on the pseudo-bulk matrix could result in inferred factors that are highly correlated (Pearson’s correlation r = 0.626∼0.997). Similar spurious correlations were also found in PEER factors inferred from an independent dataset (induced pluripotent stem cells, N = 31). Optimization of the strategy for generating PEER factors and incorporating the improved PEER factors in the eQTL association model can identify 9.0∼23.1% more eQTLs or 1.7%∼13.3% more eGenes. Sensitivity analysis showed that the pattern of change between the number of eGenes detected and PEER factors fitted varied significantly for different cell types. In addition, using highly variable genes (e.g., top 2000) to generate PEER factors could achieve similar eGenes discovery power as using all genes but save considerable computational resources (∼6.2-fold faster). We provide diagnostic guidelines to improve the robustness and avoid potential pitfalls when generating PEER factors for single-cell eQTL association analyses.
13
Citation1
0
Save
1

Clonal dynamics of SARS-CoV-2-specific T cells in children and adults with COVID-19

Weng Khoo et al.Feb 1, 2022
SUMMARY Children infected with severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2) develop less severe coronavirus disease 2019 (COVID-19) than adults. The mechanisms for the age-specific differences and the implications for infection-induced immunity are beginning to be uncovered. We show by longitudinal multimodal analysis that SARS-CoV-2 leaves a small footprint in the circulating T cell compartment in children with mild/asymptomatic COVID-19 compared to adult household contacts with the same disease severity who had more evidence of systemic T cell interferon activation, cytotoxicity and exhaustion. Children harbored diverse polyclonal SARS-CoV- 2-specific naïve T cells whereas adults harbored clonally expanded SARS-CoV-2-specific memory T cells. More naïve interferon-activated CD4 + T cells were recruited into the memory compartment and recovery was associated with the development of robust CD4 + memory T cell responses in adults but not children. These data suggest that rapid clearance of SARS-CoV-2 in children may compromise their cellular immunity and ability to resist reinfection. HIGHLIGHTS Children have diverse polyclonal SARS-CoV-2-specific naïve T cells Adults have clonally expanded exhausted SARS-CoV-2-specific memory T cells Interferon-activated naïve T cells differentiate into memory T cells in adults but not children Adults but not children develop robust memory T cell responses to SARS-CoV-2
1
Citation1
0
Save
0

Identifying genetic variants that influence the abundance of cell states in single-cell data

Laurie Rumker et al.Jan 1, 2023
To understand genetic mechanisms driving disease, it is essential but difficult to map how risk alleles affect the composition of cells present in the body. Single-cell profiling quantifies granular information about tissues, but variant-associated cell states may reflect diverse combinations of the profiled cell features that are challenging to predefine. We introduce GeNA (Genotype-Neighborhood Associations), a statistical tool to identify cell state abundance quantitative trait loci (csaQTLs) in high-dimensional single-cell datasets. Instead of testing associations to predefined cell states, GeNA flexibly identifies the cell states whose abundance is most associated with genetic variants. In a genome-wide survey of scRNA-seq peripheral blood profiling from 969 individuals, GeNA identifies five independent loci associated with shifts in the relative abundance of immune cell states. For example, rs3003-T (p=1.96x10-11) associates with increased abundance of NK cells expressing TNF-α response programs. This csaQTL colocalizes with increased risk for psoriasis, an autoimmune disease that responds to anti-TNF treatments. Flexibly characterizing csaQTLs for granular cell states may help illuminate how genetic background alters cellular composition to confer disease risk.
Load More