YC
Yidong Chen
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
14
(57% Open Access)
Cited by:
9
h-index:
77
/
i10-index:
244
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

BATF3-dependent induction of IL-27 in B cells bridges the innate and adaptive stages of the antibody response

Hui Yan et al.Jun 26, 2020
Abstract B cells are exposed to innate and T cell stimuli during the antibody response, although whether and how they functionally integrate such signals are unclear. Here we have identified IL-27 as the cytokine specifically produced by murine B cells upon sequential stimulation by TLR ligands and then CD154 and IL-21, the hallmark factors of T follicular helper cells, and during the T-dependent antibody response to a conjugated hapten or virus infection. B-cell Il27p28 transcription is concomitant with increased locus accessibility and depends on newly induced BATF3 transcription factor. IL-27-producing B cells are inefficient in antibody secretion, but cooperate with IFNγ to promote proliferation, survival, class-switching and plasma cell differentiation of CD40-activated B cells, leading to optimal IgG2a and IgG1 responses. Overall, IL-27-producing B cells function as “helper” B cells that integrate the innate and adaptive stages of the antibody response. One-sentence summary B cells integrate innate TLR and adaptive CD40 signals to induce BATF3 transcription factor for production of IL-27, which together with INFg optimizes antibody responses.
1
Citation3
0
Save
0

Predicting sites of epitranscriptome modifications using unsupervised representation learning based on generative adversarial networks

Sirajul Salekin et al.Apr 29, 2020
ABSTRACT Epitranscriptome is an exciting area that studies different types of modifications in transcripts and the prediction of such modification sites from the transcript sequence is of significant interest. However, the scarcity of positive sites for most modifications imposes critical challenges for training robust algorithms. To circumvent this problem, we propose MR-GAN, a generative adversarial network (GAN) based model, which is trained in an unsupervised fashion on the entire pre-mRNA sequences to learn a low dimensional embedding of transcriptomic sequences. MR-GAN was then applied to extract embeddings of the sequences in a training dataset we created for eight epitranscriptome modifications, including m 6 A, m 1 A, m 1 G, m 2 G, m 5 C, m 5 U, 2′- O -Me, Pseudouridine (Ψ) and Dihydrouridine (D), of which the positive samples are very limited. Prediction models were trained based on the embeddings extracted by MR-GAN. We compared the prediction performance with the one-hot encoding of the training sequences and SRAMP, a state-of-the-art m 6 A site prediction algorithm and demonstrated that the learned embeddings outperform one-hot encoding by a significant margin for up to 15% improvement. Using MR-GAN, we also investigated the sequence motifs for each modification type and uncovered known motifs as well as new motifs not possible with sequences directly. The results demonstrated that transcriptome features extracted using unsupervised learning could lead to high precision for predicting multiple types of epitranscriptome modifications, even when the data size is small and extremely imbalanced.
0
Citation1
0
Save
3

Understanding Painful versus Non-Painful Dental Pain in Male and Female Patients: A Transcriptomic Analysis of Human Biopsies

Badar Patel et al.Jan 27, 2023
Abstract Dental pain from apical periodontitis is an infection induced-orofacial pain condition that presents with diversity in pain phenotypes among patients. While 60% of patients with a full-blown disease present with the hallmark symptom of mechanical allodynia, nearly 40% of patients experience no pain. Furthermore, a sexual dichotomy exists, with females exhibiting lower mechanical thresholds under basal and diseased states. Finally, the prevalence of post-treatment pain refractory to commonly used analgesics ranges from 7-19% (~2 million patients), which warrants a thorough investigation of the cellular changes occurring in different patient cohorts. We, therefore, conducted a transcriptomic assessment of periapical biopsies (peripheral diseased tissue) from patients with persistent apical periodontitis. Surgical biopsies from symptomatic male (SM), asymptomatic male (AM), symptomatic female (SF), and asymptomatic female (AF) patients were collected and processed for bulk RNA sequencing. Using strict selection criteria, our study found several unique differentially regulated genes (DEGs) between symptomatic and asymptomatic patients, as well as novel candidate genes between sexes within the same pain group. Specifically, we found the role of cells of the innate and adaptive immune system in mediating nociception in symptomatic patients and the role of genes involved in tissue homeostasis in potentially inhibiting nociception in asymptomatic patients. Furthermore, sex-related differences appear to be tightly regulated by macrophage activity, its secretome, and/or migration. Collectively, we present, for the first time, a comprehensive assessment of peripherally diseased human tissue after a microbial insult and shed important insights into the regulation of the trigeminal system in female and male patients. Summary Clinical diversity paves the way for translational research. We conducted a comprehensive transcriptomic assessment of peripherally diseased human tissue from patients with apical periodontitis to understand better clinical diversity observed in pain phenotypes between patients as well as perform in-depth analyses of sex-related dimorphism in patients with apical periodontitis.
0

An ancestral informative marker panel design for individual ancestry estimation of Hispanic population using whole exome sequencing data

Li-Ju Wang et al.May 31, 2019
Background: Europeans and American Indians were major genetic ancestry of Hispanics in the U.S. In those ancestral groups, it has markedly different incidence rates and outcomes in many types of cancers. Therefore, the genetic admixture may cause biased genetic association study with cancer susceptibility variants specifically in Hispanics. The incidence rate and genetic mutational pattern of liver cancer have been shown substantial disparity between Hispanic, Asian and non-Hispanic white populations. Currently, ancestry informative marker (AIM) panels have been widely utilized with up to a few hundred ancestry-informative single nucleotide polymorphisms (SNPs) to infer ancestry admixture. Notably, current available AIMs are predominantly located in intron and intergenic regions, while the whole exome sequencing (WES) protocols commonly used in translational research and clinical practice do not contain these markers, thus, the challenge to accurately determine a patient′s admixture proportion without subject to additional DNA testing. Methods: Here we designed a bioinformatics pipeline to obtain an AIM panel. The panel infers 3-way genetic admixture from three distinct continental populations (African (AFR), European (EUR), and East Asian (EAS)) constraint within evolutionary-conserved exome regions. Briefly, we extract ~1 million exonic SNPs from all individuals of three populations in the 1000 Genomes Project. Then, the SNPs were trimmed by their linkage disequilibrium (LD), restricted to biallelic variants only, and assembled as an AIM panel with the top ancestral informativeness statistics based on the In-statistic. The selected AIM panel was applied to training dataset and clinical dataset. Finally, The ancestral proportions of each individual was estimated by STRUCTURE. Results: In this study, the optimally selected AIM panel with 250 markers, or the UT-AIM250 panel, was performed with better accuracy as one of the published AIM panels when we tested with 3 ancestral populations (Accuracy: 0.995 ± 0.012 for AFR, 0.997 ± 0.007 for EUR, and 0.994 ± 0.012 for EAS). We demonstrated the utility of UT-AIM250 panel on the admixed American (AMR) of the 1000 Genomes Project and obtained similar results (AFR: 0.085 ± 0.098; EUR: 0.665 ± 0.182; and EAS 0.250 ± 0.205) to previously published AIM panels (Phillips-AIM34: AFR: 0.096 ± 0.127, EUR: 0.575 ± 0.29; and EAS: 0.330 ± 0.315; Wei-AIM278: AFR: 0.070 ± 0.096, EUR: 0.537 ± 0.267, and EAS: 0.393 ± 0.300) with no significant difference (Pearson correlation, P < 10-50, n = 347 samples). Subsequently, we applied UT-AIM250 panel to clinical datasets of self-reported Hispanic patients in South Texas with hepatocellular carcinoma (26 patients). Our estimated admixture proportions from adjacent non-cancer liver tissue data of Hispanics in South Texas is (AFR: 0.065 ± 0.043; EUR: 0.594 ± 0.150; and EAS: 0.341 ± 0.160), with smaller variation due to its unique Texan/Mexican American population in South Texas. Similar admixture proportion from the corresponding tumor tissue we also obtained. In addition, we estimated admixture proportions of entire TCGA-LIHC samples (376 patients) using UT-AIM250 panel. We demonstrated that our AIM panel estimate consistent admixture proportions from DNAs derived from tumor and normal tissues, and 2 possible incorrect reported race/ethnicity, and/or provide race/ethnicity determination if necessary. Conclusions: Taken together, we demonstrated the feasibility of using evolutionary-conserved exome regions to distinguish genetic ancestry descendants based on 3 continental-ancestry proportion, provided a robust and reliable control for sample collection or patient stratification for genetic analysis. R implementation of UT-AIM250 is available at https://github.com/chenlabgccri/UT-AIM250 .
6

Sex-dependent Differences in the Genomic Profile of Lingual Sensory Neurons in Naïve and Tongue-Tumor Bearing Mice

Tarek Ibrahim et al.Jan 17, 2023
Abstract Mechanisms of sex-dependent orofacial pain are widely understudied. A significant gap in knowledge exists about comprehensive regulation of tissue-specific trigeminal sensory neurons in diseased state of both sexes. Using RNA sequencing of FACS sorted retro-labeled sensory neurons innervating tongue tissue, we determined changes in transcriptomic profiles in males and female mice under naïve as well as tongue-tumor bearing conditions Our data revealed the following interesting findings: 1) Tongue tissue of female mice was innervated with higher number of trigeminal neurons compared to males; 2) Naïve female neurons innervating the tongue exclusively expressed immune cell markers such as Csf1R, C1qa and others, that weren’t expressed in males. This was validated by Immunohistochemistry. 4) Accordingly, immune cell markers such as Csf1 exclusively sensitized TRPV1 responses in female TG neurons. 3) Male neurons were more tightly regulated than female neurons upon tumor growth and very few differentially expressed genes (DEGs) overlapped between the sexes, 5) Male DEGs contained higher number of transcription factors whereas female DEGs contained higher number of enzymes, cytokines and chemokines. Collectively, this is the first study to characterize the effect of sex as well as of tongue-tumor on global gene expression, pathways and molecular function of tongue-innervating sensory neurons.
0

Differential expression analysis of RNA sequencing data by incorporating non-exonic mapped reads

Hung-I Chen et al.Mar 7, 2015
Background RNA sequencing (RNA-seq) is a powerful tool for genome-wide expression profiling of biological samples with the advantage of high-throughput and high resolution. There are many existing algorithms nowadays for quantifying expression levels and detecting differential gene expression, but none of them takes the misaligned reads that are mapped to non-exonic regions into account. We developed a novel algorithm, XBSeq, where a statistical model was established based on the assumption that observed signals are the convolution of true expression signals and sequencing noises. The mapped reads in non-exonic regions are considered as sequencing noises, which follows a Poisson distribution. Given measureable observed and noise signals from RNA-seq data, true expression signals, assuming governed by the negative binomial distribution, can be delineated and thus the accurate detection of differential expressed genes. Results We implemented our novel XBSeq algorithm and evaluated it by using a set of simulated expression datasets under different conditions, using a combination of negative binomial and Poisson distributions with parameters derived from real RNA-seq data. We compared the performance of our method with other commonly used differential expression analysis algorithms. We also evaluated the changes in true and false positive rates with variations in biological replicates, differential fold changes, and expression levels in non-exonic regions. We also tested the algorithm on a set of real RNA-seq data where the common and different detection results from different algorithms were reported. Conclusions In this paper, we proposed a novel XBSeq, a differential expression analysis algorithm for RNA-seq data that takes non-exonic mapped reads into consideration. When background noise is at baseline level, the performance of XBSeq and DESeq are mostly equivalent. However, our method surpasses DESeq and other algorithms with the increase of non-exonic mapped reads. Only in very low read count condition XBSeq had a slightly higher false discovery rate, which may be improved by adjusting the background noise effect in this situation. Taken together, by considering non-exonic mapped reads, XBSeq can provide accurate expression measurement and thus detect differential expressed genes even in noisy conditions.
0

Global analysis of N6-methyladenosine functions and its disease association using deep learning and network-based methods

Songyao Zhang et al.Nov 4, 2018
N6-methyladenosine (m6A) is the most abundant methylation, existing in >25% of human mRNAs. Exciting recent discoveries indicate the close involvement of m6A in regulating many different aspects of mRNA metabolism and diseases like cancer. However, our current knowledge about how m6A levels are controlled and whether and how regulation of m6A levels of a specific gene can play a role in cancer and other diseases is mostly elusive. We propose in this paper a computational scheme for predicting m6A-regulated genes and m6A-associated disease, which includes Deep-m6A, the first model for detecting condition-specific m6A sites from MeRIP-Seq data with a single base resolution using deep learning and a new network-based pipeline that prioritizes functional significant m6A genes and its associated diseases using the Protein-Protein Interaction (PPI) and gene-disease heterogeneous networks. We applied Deep-m6A and this pipeline to 75 MeRIP-seq human samples, which produced a compact set of 709 functionally significant m6A-regulated genes and nine functionally enriched subnetworks. The functional enrichment analysis of these genes and networks reveal that m6A targets key genes of many critical biological processes including transcription, cell organization and transport, and cell proliferation and cancer-related pathways such as Wnt pathway. The m6A-associated disease analysis prioritized five significantly associated diseases including leukemia and renal cell carcinoma. These results demonstrate the power of our proposed computational scheme and provide new leads for understanding m6A regulatory functions and its roles in diseases.
Load More