ML
Mickaël Leclercq
Author with expertise in Microbial Identification and Diagnosis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
10
(60% Open Access)
Cited by:
365
h-index:
17
/
i10-index:
21
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

An atlas of over 90,000 conserved noncoding sequences provides insight into crucifer regulatory regions

Annabelle Haudry et al.Jun 30, 2013
+26
E
A
A
Despite the central importance of noncoding DNA to gene regulation and evolution, understanding of the extent of selection on plant noncoding DNA remains limited compared to that of other organisms. Here we report sequencing of genomes from three Brassicaceae species (Leavenworthia alabamica, Sisymbrium irio and Aethionema arabicum) and their joint analysis with six previously sequenced crucifer genomes. Conservation across orthologous bases suggests that at least 17% of the Arabidopsis thaliana genome is under selection, with nearly one-quarter of the sequence under selection lying outside of coding regions. Much of this sequence can be localized to approximately 90,000 conserved noncoding sequences (CNSs) that show evidence of transcriptional and post-transcriptional regulation. Population genomics analyses of two crucifer species, A. thaliana and Capsella grandiflora, confirm that most of the identified CNSs are evolving under medium to strong purifying selection. Overall, these CNSs highlight both similarities and several key differences between the regulatory DNA of plants and other species.
0
Citation365
0
Save
0

Fast and accurate bacterial species identification in biological samples using LC-MS/MS mass spectrometry and machine learning

Florence Roux‐Dalvai et al.May 10, 2019
+10
M
C
F
The identification of microbial species in biological samples is essential to many applications in health, food safety and environment. MALDI-TOF MS technology has become a tool of choice for microbial identification but it has several drawbacks including: it requires a long step of bacterial culture prior to analysis (24h), it has a low specificity and is not quantitative. We have developed a new strategy for identifying bacterial species in biological samples using specific LC-MS/MS peptidic signatures. In the first training step, deep proteome coverage of bacteria of interest is obtained in Data Independent Acquisition (DIA) mode, followed by the use of machine learning to define the peptides the most susceptible to distinguish each bacterial species from the others. Then, in the second step, this peptidic signature is monitored in biological samples using targeted proteomics. This method, which allows the bacterial identification from clinical specimens in less than 4h, has been applied to fifteen species representing 84% of all Urinary Tract Infections (UTI). More than 31000 peptides in 200 samples have been quantified by DIA and analyzed by machine learning to determine an 82 peptides signature and build prediction models able to classify the fifteen bacterial species. This peptidic signature was validated for its use in routine conditions using Parallel Reaction Monitoring on a capillary flow chromatography coupled to a Thermo Scientific™ Q Exactive HF-X instrument. Linearity and reproducibility of the method were demonstrated as well as its accuracy on donor specimens. Within 4h and without bacterial culture, our method was able to predict the predominant bacteria infecting a sample in 97% of cases and 100% above the 1x105 CFU/mL threshold commonly used by clinical laboratories. This work demonstrates the efficiency of our method for the rapid and specific identification of the bacterial species causing UTI and could be extended in the future to other biological specimens and to bacteria having specific virulence or resistance factors.
0

Sparse and geometry-aware generalisation of the mutual information for joint discriminative clustering and feature selection

Louis Ohl et al.Jul 17, 2024
+3
C
P
L
0

LC-SRM combined with machine learning enables fast identification and quantification of bacterial pathogens in urinary tract infections

Clarisse Gotti et al.Aug 1, 2024
+8
È
F
C
Urinary tract infections (UTIs) are a worldwide health problem. Fast and accurate detection of bacterial infection is essential to provide appropriate antibiotherapy to patients and to avoid the emergence of drug-resistant pathogens. While the gold standard requires 24h to 48h of bacteria culture prior MALDI-TOF species identification, we propose a culture-free workflow, enabling a bacterial identification and quantification in less than 4 hours using 1mL of urine. After a rapid and automatable sample preparation, a signature of 82 bacterial peptides, defined by machine learning, was monitored in LC-MS, to distinguish the 15 species causing 84% of the UTIs. The combination of the sensitivity of the SRM mode on a triple quadrupole TSQ Altis instrument and the robustness of capillary flow enabled us to analyze up to 75 samples per day, with 99.2% accuracy on bacterial inoculations of healthy urines. We have also shown our method can be used to quantify the spread of the infection, from 8x10
0

Target repositioning using multi-layer networks and machine learning: The case of prostate cancer

Milan Picard et al.Dec 1, 2024
+4
A
M
M
The discovery of novel therapeutic targets, defined as proteins which drugs can interact with to induce therapeutic benefits, typically represent the first and most important step of drug discovery. One solution for target discovery is target repositioning, a strategy which relies on the repurposing of known targets for new diseases, leading to new treatments, less side effects and potential drug synergies. Biological networks have emerged as powerful tools for integrating heterogeneous data and facilitating the prediction of biological or therapeutic properties. Consequently, they are widely employed to predict new therapeutic targets by characterizing potential candidates, often based on their interactions within a Protein-Protein Interaction (PPI) network, and their proximity to genes associated with the disease. However, over-reliance on PPI networks and the assumption that potential targets are necessarily near known genes can introduce biases that may limit the effectiveness of these methods. This study addresses these limitations in two ways. First, by exploiting a multi-layer network which incorporates additional information such as gene regulation, metabolite interactions, metabolic pathways, and several disease signatures such as Differentially Expressed Genes, mutated genes, Copy Number Alteration, and structural variants. Second, by extracting relevant features from the network using several approaches including proximity to disease-associated genes, but also unbiased approaches such as propagation-based methods, topological metrics, and module detection algorithms. Using prostate cancer as a case study, the best features were identified and utilized to train machine learning algorithms to predict 5 novel promising therapeutic targets for prostate cancer: IGF2R, C5AR, RAB7, SETD2 and NPBWR1.
0

LC-SRM combined with machine learning enables fast identification and quantification of bacterial pathogens in urinary tract infections

Clarisse Gotti et al.Jun 1, 2024
+8
È
F
C
ABSTRACT Urinary tract infections (UTIs) are a worldwide health problem. Fast and accurate detection of bacterial infection is essential to provide appropriate antibiotherapy to patients and to avoid the emergence of drug-resistant pathogens. While the gold standard requires 24h to 48h of bacteria culture prior MALDI-TOF species identification, we propose a culture-free workflow, enabling a bacterial identification and quantification in less than 4 hours using 1mL of urine. After a rapid and automatable sample preparation, a signature of 82 bacterial peptides, defined by machine learning, was monitored in LC-MS, to distinguish the 15 species causing 84% of the UTIs. The combination of the sensitivity of the SRM mode on a triple quadrupole TSQ Altis instrument and the robustness of capillary flow enabled us to analyze up to 75 samples per day, with 99.2% accuracy on bacterial inoculations of healthy urines. We have also shown our method can be used to quantify the spread of the infection, from 8×10 4 to 3×10 7 CFU/mL. Finally, the workflow was validated on 45 inoculated urines and on 84 UTI-positive urine from patients, with respectively 93.3% and 87.1% of agreement with the culture-MALDI procedure at a level above 1×10 5 CFU/mL corresponding to an infection requiring antibiotherapy. HIGHLIGHTS – LC-MS-SRM and machine learning to identify and quantify bacterial species of UTI – Fast sample preparation without bacterial culture and high-throughput MS analysis – Accurate quantification through calibration curves for 15 species of UTIs – Validation on inoculations (93% accuracy) and on patients specimens (87% accuracy)
0

Male sex chromosomal complement exacerbates the pathogenicity of Th17 cells in a chronic model of CNS autoimmunity

Prenitha Doss et al.May 19, 2019
+9
A
J
P
Sex differences in the incidence and severity of multiple sclerosis (MS) have long been recognized. However, the underlying cellular and molecular mechanisms for why male sex is associated with more aggressive and debilitating disease remain poorly defined. Using an T cell adoptive transfer model of chronic EAE, we find that male Th17 cells induced disease of increased severity relative to female Th17 cells, irrespective of whether transferred to male or female recipients. Throughout the disease course, a greater frequency of male Th17 cells produced the heterodox cytokine IFNγ, a hallmark of pathogenic Th17 responses. Intriguingly, sex chromosomal complement, and not hormones, were responsible for the increased pathogenicity of male Th17 cells and an X-linked immune regulator, Jarid1c , was downregulated in both pathogenic male Th17 and CD4+ T cells from men with MS. Together, our data indicate that male sex critical regulates Th17 cell plasticity and pathogenicity via sex chromosomal complement.
1

BioDiscViz : a visualization support and consensus signature selector for BioDiscML results

Sophiane Bouirdene et al.Oct 7, 2022
+2
L
M
S
Abstract Machine learning (ML) algorithms are powerful tools to find complex patterns and biomarker signatures where conventional statistical methods may fail to identify them. While the ML field made significant progress, state of the art methodologies to build efficient and non-overfitting models are not always applied in the litterature. To this purpose, automatic programs, such as BioDiscML, have been designed to identify biomarker signatures and correlated features while escaping overfitting using multiple evaluation strategies, such as cross validation, bootstrapping and repeated holdout. To further improve BioDiscML and reach a broader audience, better visualization support and flexibility in choosing the best models and signatures are needed. Thus, to provide researchers with an easily accessible and usable tool for in depth investigation of the results from BioDiscML outputs, we developed a visual interaction tool called BioDiscViz. This tool provides summaries, tables and graphics, in the form of Principal Component Analysis (PCA) plots, heatmaps and boxplots for the best model and the correlated features. Furthermore, this tool also provides visual support to extract a consensus signature from BioDiscML models using a combination of filters. BioDiscViz will be a great visual support for research implying machine learning, hence new opportunities in this field by opening it to a broader community.
0

WMP: A novel comprehensive wheat miRNA database, including related bioinformatics software

Mohamed Remita et al.Aug 18, 2015
+5
Z
É
M
MicroRNAs (miRNAs) are emerging as important post-transcriptional regulators that may regulate key plant genes responsible for agronomic traits such as grain yield and stress tolerance. Several studies identified species and clades specific miRNA families associated with plant stress regulated genes. Here, we propose a novel resource that provides data related to the expression of abiotic stress responsive miRNAs in wheat, one of the most important staple food crops. This database allows the query of small RNA libraries, including in silico predicted wheat miRNA sequences and the expression profiles of small RNAs identified from those libraries. Our database also provides a direct access to online miRNA prediction software tuned to de novo miRNA detection in wheat, in monocotyledon clades, as well as in other plant species. These data and software will facilitate multiple comparative analyses and reproducible studies on small RNAs and miRNA families in plants. Our web-portal is available at: http://wheat.bioinfo.uqam.ca.
0

A Machine Learning Approach to Identify Key Residues Involved in Protein–Protein Interactions Exemplified with SARS-CoV-2 Variants

Léopold Quitté et al.Jun 13, 2024
+3
J
M
L
Human infection with the coronavirus disease 2019 (COVID-19) is mediated by the binding of the spike protein of the severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2) to the human angiotensin-converting enzyme 2 (ACE2). The frequent mutations in the receptor-binding domain (RBD) of the spike protein induced the emergence of variants with increased contagion and can hinder vaccine efficiency. Hence, it is crucial to better understand the binding mechanisms of variant RBDs to human ACE2 and develop efficient methods to characterize this interaction. In this work, we present an approach that uses machine learning to analyze the molecular dynamics simulations of RBD variant trajectories bound to ACE2. Along with the binding free energy calculation, this method was used to characterize the major differences in ACE2-binding capacity of three SARS-CoV-2 RBD variants—namely the original Wuhan strain, Omicron BA.1, and the more recent Omicron BA.5 sublineages. Our analyses assessed the differences in binding free energy and shed light on how it affects the infectious rates of different variants. Furthermore, this approach successfully characterized key binding interactions and could be deployed as an efficient tool to predict different binding inhibitors to pave the way for new preventive and therapeutic strategies.