RL
Ryan Layer
Author with expertise in RNA Sequencing Data Analysis
University of Colorado Boulder, University of Utah, Star Center
+ 4 more
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
21
(52% Open Access)
Cited by:
75
h-index:
25
/
i10-index:
32
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
335

A complete reference genome improves analysis of human genetic variation

Sergey Aganezov et al.Oct 24, 2023
+30
D
S
S
Abstract Compared to its predecessors, the Telomere-to-Telomere CHM13 genome adds nearly 200 Mbp of sequence, corrects thousands of structural errors, and unlocks the most complex regions of the human genome to clinical and functional study. Here we demonstrate how the new reference universally improves read mapping and variant calling for 3,202 and 17 globally diverse samples sequenced with short and long reads, respectively. We identify hundreds of thousands of novel variants per sample—a new frontier for evolutionary and biomedical discovery. Simultaneously, the new reference eliminates tens of thousands of spurious variants per sample, including up to 12-fold reduction of false positives in 269 medically relevant genes. The vast improvement in variant discovery coupled with population and functional genomic resources position T2T-CHM13 to replace GRCh38 as the prevailing reference for human genetics. One Sentence Summary The T2T-CHM13 reference genome universally improves the analysis of human genetic variation.
0

Mapping and characterization of structural variation in 17,795 human genomes

Haley Abel et al.Sep 14, 2024
+97
A
D
H
1

Learning What a Good Structural Variant Looks Like

Murad Chowdhury et al.Oct 24, 2023
R
M
Abstract Structural variations (SVs) are an important class of genetic mutations, yet SV detectors still suffer from high false-positive rates. In many cases, humans can quickly determine whether a putative SV is real by merely looking at a visualization of the SV’s coverage profile. To that end, we developed Samplot-ML, a convolutional neural network (CNN) trained to genotype genomic deletions using Samplot visualizations that incorporate various forms of evidence such as genome coverage, discordant pairs, and split reads. Using Samplot-ML, we were able to reduce false positives by 47% while keeping 97% of true positives on average across several test samples.
2

Samplot: A Platform for Structural Variant Visual Validation and Automated Filtering

Jonathan Belyeu et al.Dec 29, 2020
+4
J
M
J
Abstract Visual validation is an essential step to minimize false positive predictions resulting from structural variant (SV) detection. We present Samplot, a tool for quickly creating images that display the read depth and sequence alignments necessary to adjudicate purported SVs across multiple samples and sequencing technologies, including short, long, and phased reads. These simple images can be rapidly reviewed to curate large SV call sets. Samplot is easily applicable to many biological problems such as prioritization of potentially causal variants in disease studies, family-based analysis of inherited variation, or de novo SV review. Samplot also includes a trained machine learning package that dramatically decreases the number of false positives without human review. Samplot is available via the conda package manager or at https://github.com/ryanlayer/samplot . Contact Ryan Layer, Ph.D., Assistant Professor, University of Colorado Boulder, ryan.layer@colorado.edu .
81

The structural variation landscape in 492 Atlantic salmon genomes

Alicia Bertolotti et al.Oct 24, 2023
+20
M
R
A
Abstract Structural variants (SVs) are a major source of genetic and phenotypic variation, but remain challenging to accurately type and are hence poorly characterized in most species. We present an approach for reliable SV discovery in non-model species using whole genome sequencing and report 15,483 high-confidence SVs in 492 Atlantic salmon ( Salmo salar L.) sampled from a broad phylogeographic distribution. These SVs recover population genetic structure with high resolution, include an active DNA transposon, widely affect functional features, and overlap more duplicated genes retained from an ancestral salmonid autotetraploidization event than expected. Changes in SV allele frequency between wild and farmed fish indicate polygenic selection on behavioural traits during domestication, targeting brain-expressed synaptic networks linked to neurological disorders in humans. This study offers novel insights into the role of SVs in genome evolution and the genetic architecture of domestication traits, along with resources supporting reliable SV discovery in non-model species.
81
Paper
Citation2
0
Save
1

Embracing firefly flash pattern variability with data-driven species classification

Owen Martin et al.Oct 24, 2023
+5
R
C
O
Abstract Many nocturnally active fireflies use precisely timed bioluminescent patterns to identify mates, making them especially vulnerable to light pollution. As urbanization continues to brighten the night sky, firefly populations are under constant stress, and close to half of the species are now threatened. Ensuring the survival of firefly biodiversity depends on a large-scale conservation effort to monitor and protect thousands of populations. While species can be identified by their flash patterns, current methods require expert measurement and manual classification and are infeasible given the number and geographic distribution of fireflies. Here we present the application of a recurrent neural network (RNN) for accurate automated firefly flash pattern classification. Using recordings from commodity cameras, we can extract flash trajectories of individuals within a swarm and classify their species with a precision and recall of approximately seventy percent. In addition to scaling population monitoring, automated classification provides the means to study firefly behavior at the population level. We employ the classifier to measure and characterize the variability within and between swarms, unlocking a new dimension of their behavior. Our method is open source, and deployment in community science applications could revolutionize our ability to monitor and understand firefly populations.
5

NPEPPS is a novel and druggable driver of platinum resistance

Robert Jones et al.Oct 24, 2023
+21
A
M
R
ABSTRACT There is an unmet need to improve efficacy of platinum-based cancer chemotherapy. Using multi-omic assessment of cisplatin-responsive and -resistant human bladder cancer cell lines and whole-genome CRISPR screens, we identified Puromycin-Sensitive Aminopeptidase, NPEPPS, as a novel driver of cisplatin resistance. NPEPPS depletion sensitizes resistant bladder cancer cells to cisplatin in vitro and in vivo . Conversely, overexpression of NPEPPS in sensitive cells increased cisplatin resistance. We show that NPEPPS affects treatment response by regulating intracellular cisplatin concentrations. Patient-derived organoids (PDOs) generated from bladder cancer samples before and after cisplatin-based treatment, and from patients who did not receive cisplatin, were evaluated for sensitivity to cisplatin and they were found to be concordant with clinical response. In PDOs, shRNA depletion or pharmacologic inhibition of NPEPPS led to increased cisplatin sensitivity, while NPEPPS overexpression had the opposite effect. Our data present NPEPPS as a novel and druggable driver of cisplatin resistance by regulating intracellular cisplatin concentrations, along with providing the preclinical data to support clinical trials combining NPEPPS inhibition with cisplatin.
5
Citation1
0
Save
0

Efficient genotype compression and analysis of large genetic variation datasets

Ryan Layer et al.May 6, 2020
+2
K
N
R
The economy of human genome sequencing has catalyzed ambitious efforts to interrogate the genomes of large cohorts in search of new insight into the genetic basis of disease. This manuscript introduces Genotype Query Tools (GQT) as a new indexing strategy and toolset that addresses an analytical bottleneck by enabling interactive analyses based on genotypes, phenotypes and sample relationships. Speed improvements are achieved by operating directly on a compressed genotype index without decompression. GQT?s data compression ratios increase favorably with cohort size and relative analysis performance improves in kind. We demonstrate substantial performance improvements over state-of-theart tools using datasets from the 1000 Genomes Project (46 fold), the Exome Aggregation Consortium (443 fold), and simulated datasets of up to 100,000 genomes (218 fold). Furthermore, we show that this indexing strategy facilitates population and statistical genetics measures such as principal component analysis and burden tests. Based on its computational efficiency and by complementing existing toolsets, GQT provides a flexible framework for current and future analyses of massive genome datasets.
67

Mining Thousands of Genomes to Classify Somatic and Pathogenic Structural Variants

Ryan Layer et al.Oct 24, 2023
A
B
F
R
Abstract Structural variants (SVs) are associated with cancer progression and Mendelian disorders, but challenges with estimating SV frequency remain a barrier to somatic and de novo classification. In particular, variability in filtering and variant calling heuristics limit our ability to use SV catalogs from large cohorts. We present a method to index and search the raw alignments from thousands of samples that overcomes these limitations and supports robust SV analysis.
0

SpeedSeq: Ultra-fast personal genome analysis and interpretation

Colby Chiang et al.May 6, 2020
+6
G
R
C
Comprehensive interpretation of human genome sequencing data is a challenging bioinformatic problem that typically requires weeks of analysis, with extensive hands-on expert involvement. This informatics bottleneck inflates genome sequencing costs, poses a computational burden for large-scale projects, and impedes the adoption of time-critical clinical applications such as personalized cancer profiling and newborn disease diagnosis, where the actionable timeframe can measure in hours or days. We developed SpeedSeq, an open-source genome analysis platform that vastly reduces computing time. SpeedSeq accomplishes read alignment, duplicate removal, variant detection and functional annotation of a 50X human genome in <24 hours, even using one low-cost server. SpeedSeq offers competitive or superior performance to current methods for detecting germline and somatic single nucleotide variants (SNVs), indels, and structural variants (SVs) and includes novel functionality for SV genotyping, SV annotation, fusion gene detection, and rapid identification of actionable mutations. SpeedSeq will help bring timely genome analysis into the clinical realm.
0
0
Save
Load More