RC
Robert Clarke
Author with expertise in Microarray Data Analysis and Gene Expression Profiling
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
11
(55% Open Access)
Cited by:
10
h-index:
64
/
i10-index:
220
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
27

DDN2.0: R and Python packages for differential dependency network analysis of biological systems

Bai Zhang et al.Apr 11, 2021
Summary Data-driven differential dependency network analysis identifies in a complex and often unknown overall molecular circuitry a network of differentially connected molecular entities (pairwise selective coupling or uncoupling depending on the specific phenotypes or experimental conditions) (Herrington, et al. 2018; Zhang, et al., 2009; Zhang and Wang, 2010; Zhang, et al., 2016). Such differential dependency networks are typically used to assist in the inference of potential key pathways. Based on our previously developed Differential Dependency Network (DDN) method, we report here the fully implemented R and Python software tool packages for public use. The DDN2.0 algorithm uses a fused Lasso model and block-wise coordinate descent to estimate both the common and differential edges of dependency networks. The identified DDN can help to provide plausible interpretation of data, gain new insight of disease biology, and generate novel hypotheses for further validation and investigations. To address the imbalanced sample group problem, we propose a sample-size normalized formulation to correct systematic bias. To address high computational complexity, we propose four strategies to accelerate DDN2.0 learning. The experimental results show that new DDN2.0+ learning speed with combined four accelerating strategies is hundreds of times faster than that of DDN2.0 algorithm on medium-sized data (Fu, 2019). To detect intra-omics and inter-omics network rewiring, we propose multiDDN using a multi-layer signaling model to integrate multi-omics data. The simulation study shows that the multiDDN method can achieve higher accuracy of detecting network rewiring (Fu, 2019).
1

Determining molecular archetype composition and expression from bulk tissues with unsupervised deconvolution

Wu Chao et al.Jul 13, 2021
Complex tissues are composite ecological systems whose components interact with each other to create a unique physiological or pathophysiological state distinct from that found in other tissue microenvironments. To explore this ground yet dynamic state, molecular profiling of bulk tissues and mathematical deconvolution can be jointly used to characterize heterogeneity as an aggregate of molecularly distinct tissue or cell subtypes. We first introduce an efficient and fully unsupervised deconvolution method, namely the Convex Analysis of Mixtures – CAM3.0, that may aid biologists to confirm existing or generate novel scientific hypotheses about complex tissues in many biomedical contexts. We then evaluate the CAM3.0 functional pipelines using both simulations and benchmark data. We also report diverse case studies on bulk tissues with unknown number, proportion and expression patterns of the molecular archetypes. Importantly, these preliminary results support the concept that expression patterns of molecular archetypes often reflect the interactive not individual contributions of many known or novel cell types, and unsupervised deconvolution would be more powerful in uncovering novel multicellular or subcellular archetypes.
1
Citation1
0
Save
0

Data-driven detection of subtype-specific and differentially expressed genes

Lulu Chen et al.Jan 11, 2019
Tissue or cell subtype-specific and differentially-expressed genes (SDEGs) are defined as being differentially expressed in a particular tissue or cell subtype among multiple subtypes. Detecting SDEGs plays a critical rolse in molecularly characterizing and identifying tissue or cell subtypes, and facilitating supervised deconvolution of complex tissues. Unfortunately, classic differential analysis assumes a convenient null hypothesis and associated test statistic that is subtype-non-specific and thus, resulting in a high false positive rate and/or lower detection power with respect to particular subtypes. Here we introduce One-Versus-Everyone Fold Change (OVE-FC) test for detecting SDEGs. To assess the statistical significance of such test, we also propose the scaled test statistic OVE-sFC together with a mixture null distribution model and a tailored permutation scheme. Validated with realistic synthetic data sets on both type 1 error and detection power, OVE-FC/sFC test applied to two benchmark gene expression data sets detects many known and de novo SDEGs. Subsequent supervised deconvolution results, obtained using the SDEGs detected by OVE-FC/sFC test, showed superior performance in deconvolution accuracy when compared with popular peer methods.
0
Citation1
0
Save
6

swCAM: estimation of subtype-specific expressions in individual samples with unsupervised sample-wise deconvolution

Lulu Chen et al.Jan 5, 2021
Abstract Motivation Complex biological tissues are often a heterogeneous mixture of several molecularly distinct cell or tissue subtypes. Both subtype compositions and expressions in individual samples can vary across different biological states or conditions. Computational deconvolution aims to dissect patterns of bulk gene expression data into subtype compositions and subtype-specific expressions. Typically, existing deconvolution methods can only estimate averaged subtype-specific expressions in a population, while detecting differential expressions or co-expression networks in particular subtypes requires unique subtype expression estimates in individual samples. Different from population-level deconvolution, however, individual-level deconvolution is mathematically an underdetermined problem because there are more variables than observations. Results We report a sample-wise Convex Analysis of Mixtures (swCAM) method that can estimate subtype proportions and subtype-specific expressions in individual samples from bulk tissue transcriptomes. We extend our previous CAM framework to include a new term accounting for between-sample variations and formulate swCAM as a nuclear-norm and ℓ 2,1 -norm regularized matrix factorization problem. We determine hyperparameter values using a cross-validation scheme with random entry exclusion and obtain a swCAM solution using an efficient alternating direction method of multipliers. The swCAM is implemented in open-source R scripts. Experimental results on realistic simulation data show that swCAM can accurately estimate subtype-specific expressions in individual samples and successfully extract co-expression networks in particular subtypes that are otherwise unobtainable using bulk expression data. Application of swCAM to bulk-tissue data of 320 samples from bipolar disorder patients and controls identified changes in cell proportions, expression and coexpression modules in patient neurons. Mitochondria related genes showed significant changes suggesting an important role of energy dysregulation in bipolar disorder. Availability and implementation The R Scripts of swCAM is freely available at https://github.com/Lululuella/swCAM . A user’s guide and a vignette are provided. Contact yuewang@vt.edu Supplementary information Supplementary data are available at Bioinformatics online.
1

ABDS: tool suite for analyzing biologically diverse samples

Dongping Du et al.Jul 5, 2023
Analytics tools are essential to identify informative molecular features about different phenotypic groups. Among the most fundamental tasks are missing value imputation, signature gene detection, and expression pattern visualization. However, most commonly used analytics tools may be problematic for characterizing biologically diverse samples when either signature genes possess uneven missing rates across different groups yet involving complex missing mechanisms, or multiple biological groups are simultaneously compared and visualized.We develop ABDS tool suite tailored specifically to analyzing biologically diverse samples. Mechanism-integrated group-wise imputation is developed to recruit signature genes involving informative missingness, cosine-based one-sample test is extended to detect enumerated signature genes, and unified heatmap is designed to comparably display complex expression patterns. We discuss the methodological principles and demonstrate the conceptual advantages of the three software tools. We also showcase the biomedical applications of these individual tools. Implemented in open-source R scripts, ABDS tool suite complements rather than replaces the existing tools and will allow biologists to more accurately detect interpretable molecular signals among diverse phenotypic samples.The R Scripts of ABDS tool suite is freely available at https://github.com/niccolodpdu/ABDS.
0

SLCs contribute to endocrine resistance in breast cancer: role of SLC7A5 (LAT1)

Catherine Sevigny et al.Feb 21, 2019
Resistance to endocrine therapies remains a major challenge to the successful management of patients with estrogen receptor-positive (ER+) breast cancers. Central to the development of resistance is the adaptive reprogramming of cellular metabolism in response to treatment. Solute carriers (SLCs) play a key role in metabolic reprogramming by transporting sugars, amino acids, and other nutrients and regulating their abundance within the cell and its subcellular organelles. We found 109 SLC mRNAs to be differentially expressed between endocrine sensitive and resistant breast cancer cells. In univariate analyses, 55 of these SLCs were associated with poor outcome in ER+ breast cancer patients. Data from TMT and SILAC studies then led us to focus on SLC7A5 (LAT1). In complex with SLC3A2 (CD98), LAT1 is the primary transporter of large, neutral amino acids including leucine and tyrosine. LAT1 expression is estrogen-regulated in endocrine sensitive cells but this regulation is lost in resistant cells. Pharmacologic inhibition or genetic depletion of LAT1 each suppressed growth in two models of endocrine resistant breast cancer. Autophagy was activated with LAT1 inhibition, but cells failed to degrade p62 showing that flux was blocked. Overexpression of the LAT1 cDNA increased protein synthesis and high LAT1 expression correlated with poor disease-free survival in ER+ breast cancer patients. This study uncovers a novel LAT1 mediated adaptive response that contributes to the development of endocrine resistance. Blocking LAT1 function may offer a new avenue for effective therapeutic intervention against endocrine resistant ER+ breast cancers.
Load More