CC
Chih‐Yu Chen
Author with expertise in Regulation of Chromatin Structure and Function
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
8
(50% Open Access)
Cited by:
1,731
h-index:
26
/
i10-index:
40
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

JASPAR 2016: a major expansion and update of the open-access database of transcription factor binding profiles

Anthony Mathelier et al.Nov 3, 2015
JASPAR (http://jaspar.genereg.net) is an open-access database storing curated, non-redundant transcription factor (TF) binding profiles representing transcription factor binding preferences as position frequency matrices for multiple species in six taxonomic groups. For this 2016 release, we expanded the JASPAR CORE collection with 494 new TF binding profiles (315 in vertebrates, 11 in nematodes, 3 in insects, 1 in fungi and 164 in plants) and updated 59 profiles (58 in vertebrates and 1 in fungi). The introduced profiles represent an 83% expansion and 10% update when compared to the previous release. We updated the structural annotation of the TF DNA binding domains (DBDs) following a published hierarchical structural classification. In addition, we introduced 130 transcription factor flexible models trained on ChIP-seq data for vertebrates, which capture dinucleotide dependencies within TF binding sites. This new JASPAR release is accompanied by a new web tool to infer JASPAR TF binding profiles recognized by a given TF protein sequence. Moreover, we provide the users with a Ruby module complementing the JASPAR API to ease programmatic access and use of the JASPAR collection of profiles. Finally, we provide the JASPAR2016 R/Bioconductor data package with the data of this release.
0
Citation965
0
Save
0

A comparative study of the gut microbiota in immune-mediated inflammatory diseases—does a common dysbiosis exist?

Jessica Forbes et al.Dec 1, 2018
Immune-mediated inflammatory disease (IMID) represents a substantial health concern. It is widely recognized that IMID patients are at a higher risk for developing secondary inflammation-related conditions. While an ambiguous etiology is common to all IMIDs, in recent years, considerable knowledge has emerged regarding the plausible role of the gut microbiome in IMIDs. This study used 16S rRNA gene amplicon sequencing to compare the gut microbiota of patients with Crohn's disease (CD; N = 20), ulcerative colitis (UC; N = 19), multiple sclerosis (MS; N = 19), and rheumatoid arthritis (RA; N = 21) versus healthy controls (HC; N = 23). Biological replicates were collected from participants within a 2-month interval. This study aimed to identify common (or unique) taxonomic biomarkers of IMIDs using both differential abundance testing and a machine learning approach.Significant microbial community differences between cohorts were observed (pseudo F = 4.56; p = 0.01). Richness and diversity were significantly different between cohorts (pFDR < 0.001) and were lowest in CD while highest in HC. Abundances of Actinomyces, Eggerthella, Clostridium III, Faecalicoccus, and Streptococcus (pFDR < 0.001) were significantly higher in all disease cohorts relative to HC, whereas significantly lower abundances were observed for Gemmiger, Lachnospira, and Sporobacter (pFDR < 0.001). Several taxa were found to be differentially abundant in IMIDs versus HC including significantly higher abundances of Intestinibacter in CD, Bifidobacterium in UC, and unclassified Erysipelotrichaceae in MS and significantly lower abundances of Coprococcus in CD, Dialister in MS, and Roseburia in RA. A machine learning approach to classify disease versus HC was highest for CD (AUC = 0.93 and AUC = 0.95 for OTU and genus features, respectively) followed by MS, RA, and UC. Gemmiger and Faecalicoccus were identified as important features for classification of subjects to CD and HC. In general, features identified by differential abundance testing were consistent with machine learning feature importance.This study identified several gut microbial taxa with differential abundance patterns common to IMIDs. We also found differentially abundant taxa between IMIDs. These taxa may serve as biomarkers for the detection and diagnosis of IMIDs and suggest there may be a common component to IMID etiology.
0
Citation327
0
Save
0

Deep Feature Selection: Theory and Application to Identify Enhancers and Promoters

Yifeng Li et al.Jan 22, 2016
Sparse linear models approximate target variable(s) by a sparse linear combination of input variables. Since they are simple, fast, and able to select features, they are widely used in classification and regression. Essentially they are shallow feed-forward neural networks that have three limitations: (1) incompatibility to model nonlinearity of features, (2) inability to learn high-level features, and (3) unnatural extensions to select features in a multiclass case. Deep neural networks are models structured by multiple hidden layers with nonlinear activation functions. Compared with linear models, they have two distinctive strengths: the capability to (1) model complex systems with nonlinear structures and (2) learn high-level representation of features. Deep learning has been applied in many large and complex systems where deep models significantly outperform shallow ones. However, feature selection at the input level, which is very helpful to understand the nature of a complex system, is still not well studied. In genome research, the cis-regulatory elements in noncoding DNA sequences play a key role in the expression of genes. Since the activity of regulatory elements involves highly interactive factors, a deep tool is strongly needed to discover informative features. In order to address the above limitations of shallow and deep models for selecting features of a complex system, we propose a deep feature selection (DFS) model that (1) takes advantages of deep structures to model nonlinearity and (2) conveniently selects a subset of features right at the input level for multiclass data. Simulation experiments convince us that this model is able to correctly identify both linear and nonlinear features. We applied this model to the identification of active enhancers and promoters by integrating multiple sources of genomic information. Results show that our model outperforms elastic net in terms of size of discriminative feature subset and classification accuracy.
0
Citation186
0
Save
1

Validation and Establishment of a SARS-CoV-2 Lentivirus Surrogate Neutralization Assay as a pre-screening tool for the Plaque Reduction Neutralization Test

John Merluza et al.Sep 14, 2022
Abstract Neutralization assays are important in understanding and quantifying neutralizing antibody responses towards SARS-CoV-2. The SARS-CoV-2 Lentivirus Surrogate Neutralization Assay (SCLSNA) can be used in biosafety level 2 (BSL-2) laboratories and has been shown to be a reliable, alternative approach to the plaque reduction neutralization test (PRNT). In this study, we optimized and validated the SCLSNA to assess its ability as a comparator and pre-screening method to support the PRNT. Comparability between the PRNT and SCLSNA was determined through clinical sensitivity and specificity evaluations. Clinical sensitivity and specificity produced acceptable results with 100% (95% CI: 94-100) specificity and 100% (95% CI: 94-100) sensitivity against ancestral Wuhan spike pseudotyped lentivirus. The sensitivity and specificity against B.1.1.7 spike pseudotyped lentivirus resulted in 88.3% (95% CI: 77.8 to 94.2) and 100% (95% CI: 94-100), respectively. Assay precision measuring intra-assay variability produced acceptable results for High (1:≥ 640 PRNT 50 ), Mid (1:160 PRNT 50 ) and Low (1:40 PRNT 50 ) antibody titer concentration ranges based on the PRNT 50 , with %CV of 14.21, 12.47, and 13.28 respectively. Intermediate precision indicated acceptable ranges for the High and Mid concentrations, with %CV of 15.52 and 16.09, respectively. However, the Low concentration did not meet the acceptance criteria with a %CV of 26.42. Acceptable ranges were found in the robustness evaluation for both intra-assay and inter-assay variability. In summary, the validation parameters tested met the acceptance criteria, making the SCLSNA method fit for its intended purpose, which can be used to support the PRNT.
1
Citation1
0
Save
0

A role for YY1 in sex-biased transcription revealed through X-linked promoter activity and allelic binding analyses

Chih‐Yu Chen et al.Mar 21, 2016
Sex differences in susceptibility and progression have been reported in numerous diseases. Female cells have two copies of the X chromosome with X-chromosome inactivation imparting mono-allelic gene silencing for dosage compensation. Such differences in transcriptional status between the copies in female and copy numbers between sexes pose a challenge to genomic data analyses of the X. A subset of genes, named escapees, escape silencing and are transcribed bi-allelically resulting in sexual dimorphism. Here we conducted analyses of the sexes using human datasets to gain perspectives in such regulation. We first identified transcription start sites of escapees (escTSSs) based on higher transcription levels in female cells using FANTOM5 Cap Analysis of Gene Expression data. Greater similarity of DNA methylation levels between the sexes was found to be consistent with bi-allelic activity at these escTSSs. The significant over-representations of YY1 transcription factor binding motif and ChIP-seq peaks around escTSSs highlighted its positive association with escapees. Furthermore, YY1 occupancy is significantly biased towards the inactive X (Xi) at long non-coding RNA loci that are frequent contacts of previously reported Xi-specific superloops in female GM12878 cells. Aside from revealing the unique properties of the X as reflected by genomic datasets, our study elucidated the importance of YY1 on transcriptional activity on Xi in general through sequence-specific binding, and its involvement at anchor regions of Xi-specific chromatin superloops.