JR
Jeffrey Rosenfeld
Author with expertise in RNA Sequencing Data Analysis
Loma Linda University, Rutgers, The State University of New Jersey, Loma Linda University Medical Center
+ 7 more
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
8
(63% Open Access)
Cited by:
1,462
h-index:
49
/
i10-index:
97
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
195

The complete sequence of a human genome

Sergey Nurk et al.Apr 1, 2022
+97
A
S
S
Since its initial release in 2000, the human reference genome has covered only the euchromatic fraction of the genome, leaving important heterochromatic regions unfinished. Addressing the remaining 8% of the genome, the Telomere-to-Telomere (T2T) Consortium presents a complete 3.055 billion-base pair sequence of a human genome, T2T-CHM13, that includes gapless assemblies for all chromosomes except Y, corrects errors in the prior references, and introduces nearly 200 million base pairs of sequence containing 1956 gene predictions, 99 of which are predicted to be protein coding. The completed regions include all centromeric satellite arrays, recent segmental duplications, and the short arms of all five acrocentric chromosomes, unlocking these complex regions of the genome to variational and functional studies.
195
Citation1,417
3
Save
335

A complete reference genome improves analysis of human genetic variation

Sergey Aganezov et al.Oct 24, 2023
+30
D
S
S
Abstract Compared to its predecessors, the Telomere-to-Telomere CHM13 genome adds nearly 200 Mbp of sequence, corrects thousands of structural errors, and unlocks the most complex regions of the human genome to clinical and functional study. Here we demonstrate how the new reference universally improves read mapping and variant calling for 3,202 and 17 globally diverse samples sequenced with short and long reads, respectively. We identify hundreds of thousands of novel variants per sample—a new frontier for evolutionary and biomedical discovery. Simultaneously, the new reference eliminates tens of thousands of spurious variants per sample, including up to 12-fold reduction of false positives in 269 medically relevant genes. The vast improvement in variant discovery coupled with population and functional genomic resources position T2T-CHM13 to replace GRCh38 as the prevailing reference for human genetics. One Sentence Summary The T2T-CHM13 reference genome universally improves the analysis of human genetic variation.
113

Benchmarking challenging small variants with linked and long reads

Justin Wagner et al.Oct 11, 2023
+39
L
N
J
Summary Genome in a Bottle (GIAB) benchmarks have been widely used to help validate clinical sequencing pipelines and develop new variant calling and sequencing methods. Here, we use accurate linked reads and long reads to expand the prior benchmarks in 7 samples to include difficult-to-map regions and segmental duplications that are not readily accessible to short reads. Our new benchmark adds more than 300,000 SNVs, 50,000 indels, and 16 % new exonic variants, many in challenging, clinically relevant genes not previously covered (e.g., PMS2 ). For HG002, we include 92% of the autosomal GRCh38 assembly, while excluding problematic regions for benchmarking small variants (e.g., copy number variants and reference errors) that should not have been in the previous version, which included 85% of GRCh38. By including difficult-to-map regions, this benchmark identifies eight times more false negatives in a short read variant call set relative to our previous benchmark.We have demonstrated the utility of this benchmark to reliably identify false positives and false negatives across technologies in more challenging regions, which enables continued technology and bioinformatics development.
3k

The complete sequence of a human genome

Sergey Nurk et al.Oct 11, 2023
+96
A
S
S
Abstract In 2001, Celera Genomics and the International Human Genome Sequencing Consortium published their initial drafts of the human genome, which revolutionized the field of genomics. While these drafts and the updates that followed effectively covered the euchromatic fraction of the genome, the heterochromatin and many other complex regions were left unfinished or erroneous. Addressing this remaining 8% of the genome, the Telomere-to-Telomere (T2T) Consortium has finished the first truly complete 3.055 billion base pair (bp) sequence of a human genome, representing the largest improvement to the human reference genome since its initial release. The new T2T-CHM13 reference includes gapless assemblies for all 22 autosomes plus Chromosome X, corrects numerous errors, and introduces nearly 200 million bp of novel sequence containing 2,226 paralogous gene copies, 115 of which are predicted to be protein coding. The newly completed regions include all centromeric satellite arrays and the short arms of all five acrocentric chromosomes, unlocking these complex regions of the genome to variational and functional studies for the first time.
0

Single-Cell, Human Sperm Transcriptomes and Variants from Fathers of Autistic and Healthy Children

Delia Tomoiaga et al.May 7, 2020
+4
S
V
D
The human sperm is one of the smallest cells in the body, but also one of the most important, as it serves as the entire paternal genetic contribution to a child. This is especially relevant for diseases such as Autism Spectrum Disorders (ASD), which have been correlated with advance paternal age. Historically, most studies of sperm have focused on the assessment of a bulk sperm, wherein millions of individual sperm are present and only high-frequency variants can be detected. Using 10X Chromium single cell sequencing technology, we have assessed the RNA from >65,000 single sperm cells across 6 donors (scsperm-RNA-seq), including two of whom have autistic children and four that do not. Using multiple RNA-seq methods for differential expression and variant analysis, we found clusters of sperm mutations in each donor that are indicative of the sperm being produced by different stem cell pools. Moreover, by comparing the two groups, we have found expression changes that can separate out the two sets of donors. Finally, through our novel variant calling from single-cell RNA-seq methods, we have shown that we can detect mutation rates in sperm from ASD donors that is distinct from the controls, highlighting this method as a new means to characterize ASD risk.
0
0
Save
0

Whole Genome Sequencing and Assembly of the Asian Honey Bee Apis dorsata

Sara Oppenheim et al.May 7, 2020
+7
O
X
S
The Asian honey bee (Apis dorsata) is distinct from its more widely distributed cousin A. mellifera by a few key characteristics. Most prominently, A. dorsata, nest in the open by forming a colony clustered around the honeycomb, while A. mellifera nest in concealed cavities. Additionally, the worker and reproductive castes are all of the same size in A. dorsata. In order to investigate these differences, we performed whole genome sequencing of A. dorsata using a hybrid Oxford Nanopore and Illumina approach. The 223MB genome has an N50 of 35kb with the largest scaffold of 302kb. We have found that there are many genes in the dorsata genome that are distinct from other hymenoptera and also large amounts of transposable elements, and we suggest some candidate genes for A. dorsata's exceptional level of defensive aggression.
0

Protein Assembly Modulation: A New Approach to ALS Therapeutics

Yu Shao et al.Jun 2, 2024
+31
D
K
Y
Abstract Amyotrophic Lateral Sclerosis (ALS) is a neurodegenerative disease with a complex, multifactorial pathophysiology, most commonly manifest as loss of motor neurons. We introduce a new mechanism of ALS pathogenesis via a novel drug-like small molecule series that targets protein disulfide isomerase (PDI) within a previously unappreciated transient and energy-dependent multi-protein complex. This novel drug was found to have activity in cellular models for both familial and sporadic ALS, as well as in transgenic worms, flies, and mice bearing a diversity of human genes with ALS-associated mutations. These compounds were initially identified as modulators of human immunodeficiency virus (HIV) capsid assembly in cell-free protein synthesis and assembly (CFPSA) systems, with demonstrated antiviral activity in cell culture. Their advancement as ALS-therapeutics, and the subsequent separation of activity against HIV and ALS in chemical subseries through structure-activity-relationship optimization, may provide insights into the molecular mechanisms governing pathophysiology of disordered homeostasis relevant to ALS.
0

A robust benchmark for germline structural variant detection

Justin Zook et al.May 6, 2020
+47
N
N
J
New technologies and analysis methods are enabling genomic structural variants (SVs) to be detected with ever-increasing accuracy, resolution, and comprehensiveness. Translating these methods to routine research and clinical practice requires robust benchmark sets. We developed the first benchmark set for identification of both false negative and false positive germline SVs, which complements recent efforts emphasizing increasingly comprehensive characterization of SVs. To create this benchmark for a broadly consented son in a Personal Genome Project trio with broadly available cells and DNA, the Genome in a Bottle (GIAB) Consortium integrated 19 sequence-resolved variant calling methods, both alignment- and de novo assembly-based, from short-, linked-, and long-read sequencing, as well as optical and electronic mapping. The final benchmark set contains 12745 isolated, sequence-resolved insertion and deletion calls ≥50 base pairs (bp) discovered by at least 2 technologies or 5 callsets, genotyped as heterozygous or homozygous variants by long reads. The Tier 1 benchmark regions, for which any extra calls are putative false positives, cover 2.66 Gbp and 9641 SVs supported by at least one diploid assembly. Support for SVs was assessed using svviz with short-, linked-, and long-read sequence data. In general, there was strong support from multiple technologies for the benchmark SVs, with 90 % of the Tier 1 SVs having support in reads from more than one technology. The Mendelian genotype error rate was 0.3 %, and genotype concordance with manual curation was >98.7 %. We demonstrate the utility of the benchmark set by showing it reliably identifies both false negatives and false positives in high-quality SV callsets from short-, linked-, and long-read sequencing and optical mapping.