AM
Alice Mouton
Author with expertise in RNA Sequencing Data Analysis
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
7
(57% Open Access)
Cited by:
1
h-index:
11
/
i10-index:
11
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
30

Systematic evaluation of transcriptomics-based deconvolution methods and references using thousands of clinical samples

Brian Nadel et al.Mar 10, 2021
Abstract Estimating cell type composition of blood and tissue samples is a biological challenge relevant in both laboratory studies and clinical care. In recent years, a number of computational tools have been developed to estimate cell type abundance using gene expression data. While these tools use a variety of approaches, they all leverage expression profiles from purified cell types to evaluate the cell type composition within samples. In this study, we compare ten deconvolution tools and evaluate their performance while using each of eleven separate reference profiles. Specifically, we have run deconvolution tools on over 4,000 samples with known cell type proportions, spanning both immune and stromal cell types. Twelve of these represent in vitro synthetic mixtures and 300 represent in silico synthetic mixtures prepared using single cell data. A final 3,728 clinical samples have been collected from the Framingham Cohort, for which cell populations have been quantified using electrical impedance cell counting. When tools are applied to the Framingham dataset, the tool EPIC produces the highest correlation while GEDIT produces the lowest error. The best tool for other datasets is varied, but CIBERSORT and GEDIT most consistently produce accurate results. In terms of reference choice, we find that the Human Primary Cell Atlas (HPCA) and references published by the EPIC authors produce accurate results for the largest number of tools and datasets. When applying deconvolution to blood samples, the leukocyte reference matrix LM22 is also a suitable choice, usually (but not always) outperforming HPCA and EPIC. Running time varies substantially across tools. For as many as 5052 samples, SaVanT and dtangle reliably finish in under one minute, while slower tools may require up to two hours. However, when using custom references, CIBERSORT can run very slowly, taking over 24 hours to complete for large datasets. We conclude that combining the best tools with optimal reference datasets can provide significant gains in accuracy when carrying out deconvolution tasks.
30
Citation1
0
Save
0

Teaching transposon classification as a means to crowd source the curation of repeat annotation - a tardigrade perspective

Valentina Peona et al.Jan 1, 2023
The advancement of sequencing technologies results in the rapid release of hundreds of new genome assemblies a year providing unprecedented resources for the study of genome evolution. Within this context, the significance of in-depth analyses of repetitive elements, transposable elements (TEs) in particular, is increasingly recognized in understanding genome evolution. Despite the plethora of available bioinformatic tools for identifying and annotating TEs, the phylogenetic distance of the target species from a curated and classified database of repetitive element sequences constrains any automated annotation effort. Manual curation of raw repeat libraries is deemed essential due to the frequent incompleteness of automatically generated consensus sequences. However, manual curation and classification are time-consuming processes that offer limited short-term academic rewards and are typically confined to a few research groups where methods are taught through hands-on experience. Crowd sourcing efforts could offer a significant opportunity to bridge the gap between learning the methods of curation effectively and empowering the scientific community with high-quality, reusable repeat libraries. Here, we present an example of such crowd sourcing effort developed through both in-person and online courses built around a collaborative peer-reviewed teaching process that can be used as teaching reference guide for similar projects. The collaborative manual curation of TEs from two tardigrade species, for which there were no TE libraries available, resulted in the successful characterization of hundreds of new and diverse TEs: A hidden treasure awaits discovery within non-model organisms.
0

Genetic and anatomical determinants of olfaction in dogs and wild canids

Alice Mouton et al.Apr 16, 2024
Abstract Understanding the anatomical and genetic basis of complex phenotypic traits has long been a challenge for biological research. Domestic dogs offer a compelling model as they demonstrate more phenotypic variation than any other vertebrate species. Dogs have been intensely selected for specific traits and abilities, directly or indirectly, over the past 15,000 years since their initial domestication from the gray wolf. Because olfaction plays a central role in critical tasks, such as the detection of drugs, diseases, and explosives, as well as human rescue, we compared relative olfactory capacity across dog breeds and assessed changes to the canine olfactory system resulting from domestication. We conducted a cross-disciplinary survey of olfactory anatomy, olfactory receptor (OR) gene variation, and OR gene expression in domestic dogs. Through comparisons to their closest wild canid relatives, the gray wolf and coyote, we show that domestic dogs might have lost functional OR genes commensurate with a documented reduction in nasal morphology during domestication. Critically, within domestic dogs alone, we found no genetic or morphological profile shared among functional or genealogical breed groupings, such as scent hounds, that might indicate evidence of any human-directed selection for enhanced olfaction. Instead, our results suggest that superior scent detection dogs likely owe their success to advantageous behavioral traits and training rather than an “olfactory edge” provided by morphology or genes.
0

Haplotype-resolved genome and population genomics of the threatened garden dormouse in Europe

Paige Byerly et al.Feb 22, 2024
Genomic resources are important for evaluating genetic diversity and supporting conservation efforts. The garden dormouse (Eliomys quercinus) is a small rodent that has experienced one of the most severe modern population declines in Europe. We present a high-quality haplotype-resolved reference genome for the garden dormouse, and combine comprehensive short and long-read transcriptomics datasets with homology-based methods to generate a highly complete gene annotation. Demographic history analysis of the genome revealed a sharp population decline since the last interglacial, indicating an association between colder climates and population declines prior to anthropogenic influence. Using our genome and genetic data from 100 individuals, largely sampled in a citizen-science project across the contemporary range, we conducted the first population genomic analysis for this species. We found clear evidence for population structure across the species core Central European range. Notably, our data shows that the Alpine population, characterized by strong differentiation and reduced genetic diversity, is reproductively isolated from other regions and likely represents a differentiated evolutionary significant unit (ESU). The predominantly declining Eastern European populations also show signs of recent isolation, a pattern consistent with a range expansion from Western to Eastern Europe during the Holocene, leaving relict populations now facing local extinction. Overall, our findings suggest that garden dormouse conservation may be enhanced in Europe through designation of ESUs.
0

Haplotype-resolved genome and population genomics of the threatened garden dormouse in Europe

Paige Byerly et al.Nov 14, 2024
Genomic resources are important for evaluating genetic diversity and supporting conservation efforts. The garden dormouse ( Eliomys quercinus ) is a small rodent that has experienced one of the most severe modern population declines in Europe. We present a high-quality haplotype-resolved reference genome for the garden dormouse, and combine comprehensive short and long-read transcriptomics data sets with homology-based methods to generate a highly complete gene annotation. Demographic history analysis of the genome reveal a sharp population decline since the last interglacial, indicating an association between colder climates and population declines before anthropogenic influence. Using our genome and genetic data from 100 individuals, largely sampled in a citizen-science project across the contemporary range, we conduct the first population genomic analysis for this species. We find clear evidence for population structure across the species’ core Central European range. Notably, our data show that the Alpine population, characterized by strong differentiation and reduced genetic diversity, is reproductively isolated from other regions and likely represents a differentiated evolutionary significant unit (ESU). The predominantly declining Eastern European populations also show signs of recent isolation, a pattern consistent with a range expansion from Western to Eastern Europe during the Holocene, leaving relict populations now facing local extinction. Overall, our findings suggest that garden dormouse conservation may be enhanced in Europe through the designation of ESUs.