LY
Laurent Younes
Author with expertise in Comprehensive Integration of Single-Cell Transcriptomic Data
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
9
(78% Open Access)
Cited by:
1,512
h-index:
53
/
i10-index:
112
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
4

Longitudinal changes in brain metabolites in healthy subjects and patients with first episode psychosis (FEP): a 7-Tesla MRS study

Min Wang et al.Aug 26, 2020
+9
N
P
M
Abstract Objective 7 Tesla (T) longitudinal magnetic resonance spectroscopy (MRS) offers a precise measurment of metabolic levels in human brain via a non-invasive approach. Studying longitudinal changes in neurometabolites could help identify trait and state markers for diseases and understand inconsistent findings from different researchers due to differences in the age of study participants and duration of illness. This study is the first to report novel longitudinal patterns in young adulthood from both physiological and pathological viewpoints using 7T MRS. Methods Utilizing a four-year longitudinal cohort with 38 first episode psychosis (FEP) patients (onset within 2 years) and 48 healthy controls (HC), the authors examined the annual percentage changes of 9 neurometabolites in 5 brain regions. Results Both FEP patients and HC subjects were found to have significant longitudinal reductions in glutamate (Glu) in the anterior cingulate cortex (ACC). Only FEP patients were found to have a significant decrease over time in γ-aminobutyric acid (GABA), N-acetyl aspartate (NAA), myo-inositol (mI), and total choline (tCho: phosphocholine plus glycerophosphocholine) in the ACC. Uniquely, glutathione (GSH) was found to have a near zero annual percentage change in both FEP patients and HC subjects in all 5 brain regions over a four-year timespan in young adulthood. Conclusions GSH could be a trait marker for diagnostic applications at least in young adulthood. Glu, GABA, NAA, mI, and tCho in the ACC are associated with the patient’s status and could be state markers for mechanistic studies of psychotic disorders, including those for progressive pathological changes and medication effects in young adulthood.
4
Citation9
0
Save
1

Using Biological Constraints to Improve Prediction in Precision Oncology

Mohamed Omar et al.May 27, 2021
+7
T
L
M
Summary Many gene signatures have been developed by applying machine learning (ML) on omics profiles, however, their clinical utility is often hindered by limited interpretability and unstable performance in different datasets. Here, we show the importance of embedding prior biological knowledge in the decision rules yielded by ML approaches to build robust classifiers. We tested this by applying different ML algorithms on gene expression data to predict three difficult cancer phenotypes: bladder cancer progression to muscle invasive disease; response to neoadjuvant chemotherapy in triple-negative breast cancer, and prostate cancer metastatic progression. We developed two sets of classifiers: mechanistic , by restricting the training process to features capturing a specific biological mechanism; and agnostic , in which the training didn’t use any a priori biological information. Mechanistic models had a similar or better performance to their agnostic counterparts in the testing data, with enhanced stability, robustness, and interpretability. Our findings support the use of biological constraints to develop robust and interpretable gene signatures with high translational potential. Motivation Omics -based gene signatures often suffer from overfitting and reduced performance when tested on independent data. This usually results from the discrepancy between the high number of features compared to the much smaller number of samples used in the training process, which results in the machine learning algorithm perfectly fitting the training data with a subsequent deterioration in performance in independent cohorts. We introduce a mechanistic framework to mitigate overfitting and improve interpretability by constraining the training process to simple rank-based decision rules recapitulating relevant, cancer-related, biological mechanisms. Our approach aims at reducing the number of training variables to a pre-defined set of biologically important features in the form of gene pairs. The classification mechanism depends entirely on the relative ordering of these pairs, making it robust to data preprocessing techniques, improving the overall interpretability of the resulting models with significant translational implications. Most importantly, these pairs are configured in such a way that the decision rules resulting from the genes relative order embed and recapitulate specific biological mechanism, inherently enhancing the classifiers interpretability.
5

A Universal Method for Crossing Molecular and Atlas Modalities using Simplex-Based Image Varifolds and Quadratic Programming

Kaitlin Stouffer et al.Mar 29, 2023
+7
L
A
K
Abstract This paper explicates a solution to the problem of building correspondences between molecular-scale transcriptomics and tissue-scale atlases. The central model represents spatial transcriptomics as generalized functions encoding molecular position and high-dimensional transcriptomic-based (gene, cell type) identity. We map onto low-dimensional atlas ontologies by modeling each atlas compartment as a homogeneous random field with unknown transcriptomic feature distribution. The algorithm presented solves simultaneously for the minimizing geodesic diffeomorphism of coordinates and latent atlas transcriptomic feature fractions by alternating LDDMM optimization for coordinate transformations and quadratic programming for the latent transcriptomic variables. We demonstrate the universality of the algorithm in mapping tissue atlases to gene-based and cell-based MERFISH datasets as well as to other tissue scale atlases. The joint estimation of diffeomorphisms and latent feature distributions allows integration of diverse molecular and cellular datasets into a single coordinate system and creates an avenue of comparison amongst atlas ontologies for continued future development.
5
Citation1
0
Save
5

Efficient Representations of Tumor Diversity with Paired DNA-RNA Aberrations

Qian Ke et al.Apr 25, 2020
+2
L
W
Q
Abstract Cancer cells display massive dysregulation of key regulatory pathways due to now well-catalogued mutations and other DNA-related aberrations. Moreover, enormous heterogeneity has been commonly observed in the identity, frequency and location of these aberrations across individuals with the same cancer type or subtype, and this variation naturally propagates to the transcriptome, resulting in myriad types of dysregulated gene expression programs. Many have argued that a more integrative and quantitative analysis of heterogeneity of DNA and RNA molecular profiles may be necessary for designing more systematic explorations of alternative therapies and improving predictive accuracy. We introduce a representation of multi- omics profiles which is sufficiently rich to account for observed heterogeneity and support the construction of quantitative, integrated, metrics of variation. Starting from the network of interactions existing in Reactome, we build a library of “paired DNA-RNA aberrations” that represent prototypical and recurrent patterns of dysregulation in cancer; each two-gene “Source-Target Pair” (STP) consists of a “source” regulatory gene and a “target” gene whose expression is plausibly “controlled” by the source gene. The STP is then “aberrant” in a joint DNA-RNA profile if the source gene is DNA-aberrant ( e.g. , mutated, deleted, or duplicated), and the downstream target gene is “RNA-aberrant”, meaning its expression level is outside the normal, baseline range. With M STPs, each sample profile has exactly one of the 2 M possible configurations. We concentrate on subsets of STPs, and the corresponding reduced configurations, by selecting tissue-dependent minimal coverings, defined as the smallest family of STPs with the property that every sample in the considered population displays at least one aberrant STP within that family. These minimal coverings can be computed with integer programming. Given such a covering, a natural measure of cross-sample diversity is the extent to which the particular aberrant STPs composing a covering vary from sample to sample; this variability is captured by the entropy of the distribution over configurations. We apply this program to data from TCGA for six distinct tumor types (breast, prostate, lung, colon, liver, and kidney cancer). This enables an efficient simplification of the complex landscape observed in cancer populations, resulting in the identification of novel signatures of molecular alterations which are not detected with frequency-based criteria. Estimates of cancer heterogeneity across tumor phenotypes reveals a stable pattern: entropy increases with disease severity. This framework is then well-suited to accommodate the expanding complexity of cancer genomes and epigenomes emerging from large consortia projects. Author Summary A large variety of genomic and transcriptomic aberrations are observed in cancer cells, and their identity, location, and frequency can be highly indicative of the particular subtype or molecular phenotype, and thereby inform treatment options. However, elucidating this association between sets of aberrations and subtypes of cancer is severely impeded by considerable diversity in the set of aberrations across samples from the same population. Most attempts at analyzing tumor heterogeneity have dealt with either the genome or transcriptome in isolation. Here we present a novel, multi-omics approach for quantifying heterogeneity by determining a small set of paired DNA-RNA aberrations that incorporates potential downstream effects on gene expression. We apply integer programming to identify a small set of paired aberrations such that at least one among them is present in every sample of a given cancer population. The resulting “coverings” are analyzed for six cancer cohorts from the Cancer Genome Atlas, and facilitate introducing an information-theoretic measure of heterogeneity. Our results identify many known facets of tumorigenesis as well as suggest potential novel genes and interactions of interest. Data Availability Statement RNA-Seq data, somatic mutation data and copy number data for The Cancer Genome Atlas were obtained through the Xena Cancer Genome Browser database ( https://xenabrowser.net ) from individual cancer type cohorts. Computational functionality for the optimization procedure is provided at https://github.com/wikum/lpcover and the code for the analysis in the manuscript is provided at https://github.com/wikum/CoveringAnalysis . Processed data in the form of TAB delimited files, and selected tissue-level coverings (in excel format) are provided as additional supplementary material and are also available from the Marchionni laboratory website ( http://marchionnilab.org/signatures.html )
5
Citation1
0
Save
1

CellCover Defines Conserved Cell Types and Temporal Progression in scRNA-seq Data across Mammalian Neocortical Development

Lanlan Ji et al.Apr 7, 2023
+4
S
A
L
Definition of cell classes across the tissues of living organisms is central in the analysis of growing atlases of single-cell RNA sequencing (scRNA-seq) data across biomedicine. Marker genes for cell classes are most often defined by differential expression (DE) methods that serially assess individual genes across landscapes of diverse cells. This serial approach has been extremely useful, but is limited because it ignores possible redundancy or complementarity across genes that can only be captured by analyzing multiple genes simultaneously. We aim to identify discriminating panels of genes. To efficiently explore the vast space of possible marker panels, leverage the large number of cells often sequenced, and overcome zero-inflation in scRNA-seq data, we propose viewing gene panel selection as a variation of the "minimal set-covering problem" in combinatorial optimization. We show that this new method, CellCover, captures cell-class-specific signals in the developing mouse neocortex that are distinct from those defined by DE methods. Transfer learning experiments across mouse, primate, and human data demonstrate that CellCover identifies markers of conserved cell classes in neurogenesis, as well as temporal progression in both progenitors and neurons. Exploring markers of human outer radial glia (oRG, or basal RG) across mammals, we show that transcriptomic elements of this key cell type in the expansion of the human cortex appeared in gliogenic precursors of the rodent before the full program emerged in the primate lineage. We have assembled the public datasets we use in this report at NeMO analytics where the expression of individual genes {NeMO Individual Genes} and marker gene panels can be freely explored {NeMO: Telley 3 Sets Covering Panels}, {NeMO: Telley 12 Sets Covering Panels}, and {NeMO: Sorted Brain Cell Covering Panels}. CellCover is available in {CellCover R} and {CellCover Python}.
1
Citation1
0
Save
3

Human olfactory neuronal cells through nasal biopsy: molecular characterization and utility in brain science

Kun Yang et al.Sep 24, 2022
+13
A
K
K
ABSTRACT Biopsy is crucial in clinical medicine to obtain tissues and cells that directly reflect the pathological changes of each disease. However, the brain is an exception due to ethical and practical challenges. Nasal biopsy, which captures the olfactory neuronal epithelium, has been considered as an alternative method of obtaining neuronal cells from living patients. Multiple groups have enriched olfactory neuronal cells (ONCs) from biopsied nasal tissue. ONCs can be obtained from repeated biopsies in a longitudinal study, providing mechanistic insight associated with dynamic changes along the disease trajectory and treatment response. Nevertheless, molecular characterization of biopsied nasal cells/tissue has been insufficient. Taking advantage of recent advances in next-generation sequencing technologies at the single-cell resolution and related rich public databases, we aimed to define the neuronal characteristics, homogeneity, and utility of ONCs. We applied single-cell and bulk RNA sequencing for ONCs, analyzing and comparing the data with multiple public datasets. We observed that the molecular signatures of ONCs are similar to those of neurons, distinct from major glial cells. The signatures of ONCs resemble those of developing neurons and share features of excitatory neurons in the prefrontal and cingulate cortex. The high homogeneity of ONCs is advantageous in pharmacological, functional, and protein studies. Accordingly, we provide two proof-of-concept examples for functional and protein studies, solidifying the utility of ONCs in studying objective biomarkers and molecular mechanisms for brain disorders. The ONCs may also be useful in the studies for the olfactory epithelium impairment and the resultant mental dysfunction elicited by SARS-CoV-2. SIGNIFICANCE STATEMENT To study dynamic changes and underlying mechanisms along disease trajectory and treatment response in neuropsychiatric disorders, olfactory neuronal cells (ONCs) enriched from biopsied nasal tissue may provide a crucial tool. Because ONCs can be obtained from repeated biopsies in a longitudinal study, this tool has been believed to be useful and complementary to postmortem brains and induced pluripotent stem cell-derived neurons. Nevertheless, molecular characterization of biopsied nasal cells/tissue has been insufficient, which hampers a broader use of this resource. Taking advantage of recent advances in next-generation sequencing technologies at the single-cell resolution and related rich public databases, the present study defines ONCs’ neuronal characteristics, homogeneity, and unique utility for the first time.
0

Statistical analysis of the effect of socio-political factors on individual life satisfaction

Alaa Itani et al.Aug 24, 2024
A
L
I
A
Abstract Life satisfaction refers to an individual’s cognitive evaluation of the quality of their life. The aim of the present study is to develop the current understanding of how perceived corruption, attitudes toward migration, perceived security, and strength of national identity influence life satisfaction. Additionally, the study examines how demographic variables of relationship status, social class, sex, religious affiliation, and country impact life satisfaction in the provided cultural context. Ordinal logistic regression analysis, Confirmatory Factor Analysis, and Structural Equation Modeling are used to analyze data from the World Values Survey. Findings from the analyses indicate that perceived corruption, perceived security, and strength of national identity have a significant impact on life satisfaction, whereas migration has an indirect effect on life satisfaction through perceived security. The present research can develop our current understanding of life satisfaction from a socio-political perspective.
0

Identifying Changepoints in Biomarkers During the Preclinical Phase of AD

Laurent Younes et al.Dec 31, 2018
+3
A
M
L
Objective: Several models have been proposed for the evolution of Alzheimer's disease (AD) biomarkers. The aim of this study was to identify changepoints in a range of biomarkers during the preclinical phase of AD. Methods: We examined nine measures based on cerebrospinal fluid (CSF), magnetic resonance imaging (MRI) and cognitive testing, obtained from 306 cognitively normal individuals, a subset of whom subsequently progressed to the symptomatic phase of AD. A changepoint model was used to determine which of the measures had a significant change in slope in relation to clinical symptom onset. Results: All nine measures had significant changepoints, all of which preceded symptom onset, however the timing of these changepoints varied considerably. A single measure, CSF-tau, had an early changepoint (40 years prior to symptom onset). A group of measures, including the remaining CSF measures (CSF-Abeta and phosphorylated tau) and all cognitive tests had changepoints 10-15 years prior to symptom onset. A second group is formed by medial temporal lobe shape composite measures, with a five-year time difference between the right and left side (respectively nine and three years prior to symptom onset). Conclusions: These findings highlight the long period of time prior to symptom onset during which AD pathology is accumulating in the brain. There are several significant findings, including the early changes in cognition and the laterality of the MRI findings. Additional work is needed to clarify their significance.