LS
Leming Shi
Author with expertise in Analysis of Gene Interaction Networks
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
10
(60% Open Access)
Cited by:
2,463
h-index:
47
/
i10-index:
89
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

The concordance between RNA-seq and microarray data depends on chemical treatment and transcript abundance

Charles Wang et al.Aug 21, 2014
A comparison of RNA-seq and microarray data from samples treated with diverse drugs highlights a dependency of cross-platform concordance on treatment effect. The concordance of RNA-sequencing (RNA-seq) with microarrays for genome-wide analysis of differential gene expression has not been rigorously assessed using a range of chemical treatment conditions. Here we use a comprehensive study design to generate Illumina RNA-seq and Affymetrix microarray data from the same liver samples of rats exposed in triplicate to varying degrees of perturbation by 27 chemicals representing multiple modes of action (MOAs). The cross-platform concordance in terms of differentially expressed genes (DEGs) or enriched pathways is linearly correlated with treatment effect size (R2≈0.8). Furthermore, the concordance is also affected by transcript abundance and biological complexity of the MOA. RNA-seq outperforms microarray (93% versus 75%) in DEG verification as assessed by quantitative PCR, with the gain mainly due to its improved accuracy for low-abundance transcripts. Nonetheless, classifiers to predict MOAs perform similarly when developed using data from either platform. Therefore, the endpoint studied and its biological complexity, transcript abundance and the genomic application are important factors in transcriptomic research and for clinical and regulatory decision making.
0
Citation475
0
Save
0

Structure−Activity Relationships for a Large Diverse Set of Natural, Synthetic, and Environmental Estrogens

Hong Fang et al.Feb 10, 2001
Understanding structural requirements for a chemical to exhibit estrogen receptor (ER) binding has been important in various fields. This knowledge has been directly and indirectly applied to design drugs for human estrogen replacement therapy, and to identify estrogenic endocrine disruptors. This paper reports structure−activity relationships (SARs) based on a total of 230 chemicals, including both natural and xenoestrogens. Activities were generated using a validated ER competitive binding assay, which covers a 106-fold range. This study is focused on identification of structural commonalities among diverse ER ligands. It provides an overall picture of how xenoestrogens structurally resemble endogenous 17β-estradiol (E2) and the synthetic estrogen diethylstilbestrol (DES). On the basis of SAR analysis, five distinguishing criteria were found to be essential for xenoestrogen activity, using E2 as a template: (1) H-bonding ability of the phenolic ring mimicking the 3-OH, (2) H-bond donor mimicking the17β-OH and O−O distance between 3- and 17β-OH, (3) precise steric hydrophobic centers mimicking steric 7α- and 11β-substituents, (4) hydrophobicity, and (5) a ring structure. The 3-position H-bonding ability of phenols is a significant requirement for ER binding. This contributes as both a H-bond donor and acceptor, although predominantly as a donor. However, the 17β-OH contributes as a H-bond donor only. The precise space (the size and orientation) of steric hydrophobic bulk groups is as important as a 17β-OH. Where a direct comparison can be made, strong estrogens tend to be more hydrophobic. A rigid ring structure favors ER binding. The knowledge derived from this study is rationalized into a set of hierarchical rules that will be useful in guidance for identification of potential estrogens.
0
Citation455
0
Save
0

A comparison of batch effect removal methods for enhancement of prediction performance using MAQC-II microarray gene expression data

Jie Luo et al.Jul 30, 2010
Batch effects are the systematic non-biological differences between batches (groups) of samples in microarray experiments due to various causes such as differences in sample preparation and hybridization protocols. Previous work focused mainly on the development of methods for effective batch effects removal. However, their impact on cross-batch prediction performance, which is one of the most important goals in microarray-based applications, has not been addressed. This paper uses a broad selection of data sets from the Microarray Quality Control Phase II (MAQC-II) effort, generated on three microarray platforms with different causes of batch effects to assess the efficacy of their removal. Two data sets from cross-tissue and cross-platform experiments are also included. Of the 120 cases studied using Support vector machines (SVM) and K nearest neighbors (KNN) as classifiers and Matthews correlation coefficient (MCC) as performance metric, we find that Ratio-G, Ratio-A, EJLR, mean-centering and standardization methods perform better or equivalent to no batch effect removal in 89, 85, 83, 79 and 75% of the cases, respectively, suggesting that the application of these methods is generally advisable and ratio-based methods are preferred.
1

The Quartet Data Portal: integration of community-wide resources for multiomics quality control

Jingcheng Yang et al.Sep 28, 2022
Abstract The implementation of quality control for multiomic data requires the widespread use of well-characterized reference materials, reference datasets, and related resources. The Quartet Data Portal was built to facilitate community access to such rich resources established in the Quartet Project. A convenient platform is provided for users to request the DNA, RNA, protein, and metabolite reference materials, as well as multi-level datasets generated across omics, platforms, labs, protocols, and batches. Interactive visualization tools are offered to assist users to gain a quick understanding of the reference datasets. Crucially, the Quartet Data Portal continuously collects, evaluates, and integrates the community-generated data of the distributed Quartet multiomic reference materials. In addition, the portal provides analysis pipelines to assess the quality of user-submitted multiomic data. Furthermore, the reference datasets, performance metrics, and analysis pipelines will be improved through periodic review and integration of multiomic data submitted by the community. Effective integration of the evolving technologies via active interactions with the community will help ensure the reliability of multiomics-based biological discoveries. The Quartet Data Portal is accessible at https://chinese-quartet.org . Graphical Abstract
1
Citation9
0
Save
1

Correcting batch effects in large-scale multiomic studies using a reference-material-based ratio method

Ying Yu et al.Oct 21, 2022
Abstract Batch effects are notorious technical variations that are common in multiomic data and may result in misleading outcomes. With the era of big data, tackling batch effects in multiomic integration is urgently needed. As part of the Quartet Project for quality control and data integration of multiomic profiling, we comprehensively assess the performances of seven batch-effect correction algorithms (BECAs) for mitigating the negative impact of batch effects in multiomic datasets, including transcriptomics, proteomics, and metabolomics. Performances are evaluated based on accuracy of identifying differentially expressed features, robustness of predictive models, and the ability of accurately clustering cross-batch samples into their biological sample groups. Ratio-based method is more effective and widely applicable than others, especially in cases when batch effects are highly confounded with biological factors of interests. We further provide practical guidelines for the implementation of ratio-based method using universal reference materials profiled with study samples. Our findings show the promise for eliminating batch effects and enhancing data integration in increasingly large-scale, cross-batch multiomic studies.