YL
Yun Li
Author with expertise in Clustered Regularly Interspaced Short Palindromic Repeats and CRISPR-associated proteins
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
10
(90% Open Access)
Cited by:
11
h-index:
14
/
i10-index:
18
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Transcriptome-wide association analysis of 211 neuroimaging traits identifies new genes for brain structures and yields insights into the gene-level pleiotropy with other complex traits

Bingxin Zhao et al.Nov 15, 2019
+5
Y
Y
B
Abstract Structural and microstructural variations of human brain are heritable and highly polygenic traits, with hundreds of associated genes founded in recent genome-wide association studies (GWAS). Using gene expression data, transcriptome-wide association studies (TWAS) can prioritize these GWAS findings and also identify novel gene-trait associations. Here we performed TWAS analysis of 211 structural neuroimaging phenotypes in a discovery-validation analysis of six datasets. Using a cross-tissue approach, TWAS discovered 204 associated genes (86 new) exceeding Bonferroni significance threshold of 1.37*10 −8 (adjusted for testing multiple phenotypes) in the UK Biobank (UKB) cohort, and validated 18 TWAS or previous GWAS-detected genes. The TWAS-significant genes of brain structures had been linked to a wide range of complex traits in different domains. Additional TWAS analysis of 11 cognitive and mental health traits detected 69 overlapping significant genes with brain structures, further characterizing the genetic overlaps among these brain-related traits. Through TWAS gene-based polygenic risk scores (PRS) prediction, we found that TWAS PRS gained substantial power in association analysis compared to conventional variant-based PRS, and up to 6.97% of phenotypic variance (p-value=7.56*10 −31 ) in testing datasets can be explained by UKB TWAS-derived PRS. In conclusion, our study illustrates that TWAS can be a powerful supplement to traditional GWAS in imaging genetics studies for gene discovery-validation, genetic co-architecture analysis, and polygenic risk prediction.
0
Citation5
0
Save
1

Functional characterization of gene regulatory elements and neuropsychiatric disease-associated risk loci in iPSCs and iPSC-derived neurons

Xiaoyu Yang et al.Aug 30, 2023
+15
L
X
X
Abstract Genome-wide association studies (GWAS) have identified thousands of non-coding variants that contribute to psychiatric disease risks, likely by perturbing cis -regulatory elements (CREs). However, our ability to interpret and explore their mechanisms of action is hampered by a lack of annotation of functional CREs (fCREs) in neural cell types. Here, through genome-scale CRISPR screens of 22,000 candidate CREs (cCREs) in human induced pluripotent stem cells (iPSCs) undergoing differentiation to excitatory neurons, we identify 2,847 and 5,540 fCREs essential for iPSC fitness and neuronal differentiation, respectively. These fCREs display dynamic epigenomic features and exhibit increased numbers and genomic spans of chromatin interactions following terminal neuronal differentiation. Furthermore, fCREs essential for neuronal differentiation show significantly greater enrichment of genetic heritability for neurodevelopmental diseases including schizophrenia (SCZ), attention deficit hyperactivity disorder (ADHD), and autism spectrum disorders (ASD) than cCREs. Using high-throughput prime editing screens we experimentally confirm 45 SCZ risk variants that act by affecting the function of fCREs. The extensive and in-depth functional annotation of cCREs in neuronal types therefore provides a crucial resource for interpreting non-coding risk variants of neuropsychiatric disorders.
1
Citation2
0
Save
67

MRLocus: identifying causal genes mediating a trait through Bayesian estimation of allelic heterogeneity

Anqi Zhu et al.Aug 14, 2020
+5
E
N
A
Abstract Expression quantitative trait loci (eQTL) studies are used to understand the regulatory function of non-coding genome-wide association study (GWAS) risk loci, but colocalization alone does not demonstrate a causal relationship of gene expression affecting a trait. Evidence for mediation, that perturbation of gene expression in a given tissue or developmental context will induce a change in the downstream GWAS trait, can be provided by two-sample Mendelian Randomization (MR). Here, we introduce a new statistical method, MRLocus, for Bayesian estimation of the gene-to-trait effect from eQTL and GWAS summary data for loci displaying allelic heterogeneity, that is, containing multiple LD-independent eQTLs. MRLocus makes use of a colocalization step applied to each eQTL, followed by an MR analysis step across eQTLs. Additionally, our method involves estimation of allelic heterogeneity through a dispersion parameter, indicating variable mediation effects from each individual eQTL on the downstream trait. Our method is evaluated against state-of-the-art methods for estimation of the gene-to-trait mediation effect, using an existing simulation framework. In simulation, MRLocus often has the highest accuracy among competing methods, and in each case provides more accurate estimation of uncertainty as assessed through interval coverage. MRLocus is then applied to five causal candidate genes for mediation of particular GWAS traits, where gene-to-trait effects are concordant with those previously reported. We find that MRLocus’ estimation of the causal effect across eQTLs within a locus provides useful information for determining how perturbation of gene expression or individual regulatory elements will affect downstream traits. The MRLocus method is implemented as an R package available at https://mikelove.github.io/mrlocus .
67
Citation1
0
Save
0

Genetic polymorphisms of Leukocyte Immunoglobulin-Like Receptor B3 (LILRB3) gene in African American kidney transplant recipients are associated with post-transplant graft failure

Zeguo Sun et al.Feb 23, 2024
+41
S
Y
Z
Abstract Background African American (AA) kidney transplant recipients exhibit a higher rate of graft loss compared to other racial and ethnic populations, highlighting the need to identify causative factors underlying this disparity. Method We analyzed RNA sequences of pretransplant whole blood from subjects followed in three kidney transplant cohorts to identify single nucleotide polymorphisms (SNPs) associated with death censored graft loss (DCGL). We employed a meta-analysis to uncover key transcriptional signatures and pathways associated with the identified SNPs and used single cell RNA to define cellular specificity. We characterized SNP functions using in vitro immunological and survival assays and tested for associations between the identified SNPs and other immune-related diseases using a ∼30,100 subject, electronic health record (EHR)-linked database. Results We uncovered a cluster of four consecutive missense SNPs in the Leukocyte Immunoglobulin-Like Receptor B3 ( LILRB3 , a negative immune response regulator) gene that strongly associated with DCGL. This LILRB3 -4SNPs cluster encodes missense mutations at amino acids 617-618 proximal to a SHP-1/2 phosphatase-binding ITIM motif. LILRB3 -4SNPs is specifically enriched within subjects of AA ancestry (8.6% prevalence vs 2.3% in Hispanic and 0.1% in European populations), is not linked to APOL1 G1/G2 alleles, and exhibited a strong association with DCGL. Analysis of PBMC and transplant biopsies from recipients with LILRB3 -4SNPs showed evidence of enhanced adaptive immune responsiveness and ferroptosis-associated death in monocytes. Overexpression of the variant allele in THP-1 cells (macrophage line) induced augmented inflammation and ferroptosis, which were attenuated by a ferroptosis inhibitor, verifying a causal link. The LILRB3 -4SNPs also associated with multiple systemic and organ-specific immune-related diseases in AAs, consistent with conferring a broadly relevant immune function. Conclusion the LILRB3 -4SNPs represent a functionally important, distinct genetic risk factor for kidney transplant outcome and development/severity of other immune-related diseases in patients of AA ancestry. Pharmacological targeting of ferroptosis should be tested to prevent or treat these disease processes in AA recipients carrying LILRB3 -4SNPs.
0
Citation1
0
Save
61

Parallel Characterization of cis-Regulatory Elements for Multiple Genes Using CRISPRpath

W Greenleaf et al.Feb 19, 2021
+20
B
X
W
Abstract Current pooled CRISPR screens for cis -regulatory elements (CREs) can only accommodate one gene based on its expression level. Here, we describe CRISPRpath, a scalable screening strategy for parallelly characterizing CREs of genes linked to the same biological pathway and converging phenotypes. We demonstrate the ability of CRISPRpath for simultaneously identifying functional enhancers of six genes in the 6-thioguanine-induced DNA mismatch repair pathway using both CRISPR interference (CRISPRi) and CRISPR nuclease (CRISPRn) approaches. 60% of the identified enhancers are known promoters with distinct epigenomic features compared to other active promoters, including increased chromatin accessibility and interactivity. Furthermore, by imposing different levels of selection pressure, CRISPRpath can distinguish enhancers exerting strong impact on gene expression from those exerting weak impact. Our results offer a nuanced view of cis -regulation and demonstrate that CRISPRpath can be leveraged for understanding the complex gene regulatory program beyond transcriptional output at scale.
61
Citation1
0
Save
3

Comprehensive identification of fetal cis-regulatory elements in the human genome by single-cell multi-omics analysis

Hao Yu et al.Nov 3, 2021
+8
Y
Y
H
Abstract The regulatory programs driving early organogenesis in human is complex and still poorly understood. We performed parallel profiling of gene expression and chromatin accessibility to 28 human fetal tissue samples representing 14 organs in the first trimester. Collectively, we have generated 415,793 single-cell profiles. By integration analysis of transcriptome and chromatin accessibility, we detected 225 distinct cell types and 848,475 candidate accessible cis-regulatory elements (aCREs). By linking regulatory elements to their putative target genes, we identified not only 108,699 enhancers, but also 23,392 silencers elements. We uncovered thousands of genes regulated by both enhancers and silencers in an organ or cell-type-specific manner. Furthermore, our unique approach revealed a substantial proportion of distal DNA elements are transcribed CREs (tCREs), which show both open chromatin signal and transcription initiation activity of non-coding transcript. The landscape of fetal cis-regulatory elements facilitates the interpretation of the genetic variant of complex disease and infer the cell type of origin for cancer. Overall, our data provide a comprehensive map of the fetal cis-regulatory elements at single-cell resolution and a valuable resource for future study of human development and disease.
3
Citation1
0
Save
0

HUGIn: Hi-C Unifying Genomic Interrogator

Joshua Martin et al.Mar 16, 2017
+6
A
M
J
Motivation: High throughput chromatin conformation capture (3C) technologies, such as Hi-C and ChIA-PET, have the potential to elucidate the functional roles of non-coding variants. However, most of published genome-wide unbiased chromatin organization studies have used cultured cell lines, limiting their generalizability. Results: We developed a web browser, HUGIn, to visualize Hi-C data generated from 21 human primary tissues and cell liens. HUGIn enables assessment of chromatin contacts both constitutive across and specific to tissue(s) and/or cell line(s) at any genomic loci, including GWAS SNPs, eQTLs and cis-regulatory elements, facilitating the understanding of both GWAS and eQTLs results and functional genomics data.
1

High throughput PRIME editing screens identify functional DNA variants in the human genome

Yin Shen et al.Jul 12, 2023
+9
J
H
Y
Abstract Despite tremendous progress in detecting DNA variants associated with human disease, interpreting their functional impact in a high-throughput and base-pair resolution manner remains challenging. Here, we develop a novel pooled prime editing screen method, PRIME, which can be applied to characterize thousands of coding and non-coding variants in a single experiment with high reproducibility. To showcase its applications, we first identified essential nucleotides for a 716 bp MYC enhancer via PRIME-mediated saturation mutagenesis. Next, we applied PRIME to functionally characterize 1,304 non-coding variants associated with breast cancer and 3,699 variants from ClinVar. We discovered that 103 non-coding variants and 156 variants of uncertain significance are functional via affecting cell fitness. Collectively, we demonstrate PRIME capable of characterizing genetic variants at base-pair resolution and scale, advancing accurate genome annotation for disease risk prediction, diagnosis, and therapeutic target identification.
1

Long-read sequencing reveals extensive DNA methylations in human gut phagenome contributed by prevalently phage-encoded methyltransferases

Chuqing Sun et al.May 22, 2023
+10
M
J
C
Abstract DNA methylation is essential for the survival of bacteriophages (phages), yet, we know little about the methylation of their genomes. Here, we analyze the DNA methylation patterns of 8,848 metagenome-assembled high-quality phages across 104 fecal samples using single-molecule real-time (SMRT) sequencing. We show that 97.60% of gut phages could be methylated, and reveal factors that correlate with methylation densities. Phages having higher methylation densities are more prevent, suggesting putative viability advantages of the DNA methylation. Strikingly, more than a third of the phages encode their own DNA methyltransferases (MTases). More MTase copies are associated with increased genome methylation densities, methylation motifs, and higher prevalence of certain phage groups. Most MTases are closely homologous to gut bacterium-encoded ones, likely exchanged during phage-bacterium interactions, and could be used to accurately predict phage-host relationships. Taken together, our results suggest that the gut DNA phages universally use DNA methylation to escape from host defense systems with significant contribution from phage-encoded MTases.
0

MAST-Decon: Smooth Cell-type Deconvolution Method for Spatial Transcriptomics Data

Tianyou Luo et al.May 13, 2024
+4
H
J
T
A bstract Spatial transcriptomics (ST) technologies have gained increasing popularity due to their ability to provide positional context of gene expressions in a tissue. One major limitation of current commercially available ST methods such as the 10X Genomics Visium platform is the lack of single cell resolution. Cell type deconvolution for ST data is critical in order to fully reveal underlying biological mechanisms. Existing ST data deconvolution methods share two common limitations: first, few of them utilize spatial neighborhood information. Existing methods such as RCTD and SPOTlight intrinsically treat each spatial spot as independent of neighboring spots, although we anticipate nearby spots to share similar cell type compositions based on clinical evidence of tissue structures. Such limitation could be amplified when sequencing depths at single spots are relatively low so that borrowing information from neighboring spots is necessary in order to obtain reliable deconvolution results. Second, although Visium data provide us with a histological image which could add additional information regarding spot heterogeneity, most existing methods do not utilize this H&E image. To solve these two limitations, we developed Multiscale Adaptive ST Deconvolution (MAST-Decon), a smooth deconvolution method for ST data. MAST-Decon uses a weighted likelihood approach and incorporates both gene expression data, spatial neighborhood information and H&E image features by constructing different kernel functions to obtain a smooth deconvolution result. We showcased the strength of MAST-Decon through simulations based on real data, including a single-cell dataset of mouse brain primary visual cortex, and real-world Visium datasets to demonstrate its robust and superior performance compared with other state-of-the-art methods.