RW
R Waterston
Author with expertise in Molecular Mechanisms of Aging and Longevity
University of Washington, Washington University in St. Louis, Seattle University
+ 7 more
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
14
(64% Open Access)
Cited by:
7,195
h-index:
95
/
i10-index:
177
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
4

Initial sequencing and comparative analysis of the mouse genome

R Waterston et al.Dec 16, 2023
+219
E
K
R
The sequence of the mouse genome is a key informational tool for understanding the contents of the human genome and a key experimental tool for biomedical research. Here, we report the results of an international collaboration to produce a high-quality draft sequence of the mouse genome. We also present an initial comparative analysis of the mouse and human genomes, describing some of the insights that can be gleaned from the two sequences. We discuss topics including the analysis of the evolutionary forces shaping the size, structure and sequence of the genomes; the conservation of large-scale synteny across most of the genomes; the much lower extent of sequence orthology covering less than half of the genomes; the proportions of the genomes under selection; the number of protein-coding genes; the expansion of gene families related to reproduction and immunity; the evolution of proteins; and the identification of intraspecies polymorphism.
4
Paper
Citation6,592
1
Save
0

Evidence for compensatory upregulation of expressed X-linked genes in mammals, Caenorhabditis elegans and Drosophila melanogaster

Xinxian Deng et al.Apr 18, 2024
+12
D
J
X
Many animal species use a chromosome-based mechanism of sex determination, which has led to the coordinate evolution of dosage-compensation systems. Dosage compensation not only corrects the imbalance in the number of X chromosomes between the sexes but also is hypothesized to correct dosage imbalance within cells that is due to monoallelic X-linked expression and biallelic autosomal expression, by upregulating X-linked genes twofold (termed 'Ohno's hypothesis'). Although this hypothesis is well supported by expression analyses of individual X-linked genes and by microarray-based transcriptome analyses, it was challenged by a recent study using RNA sequencing and proteomics. We obtained new, independent RNA-seq data, measured RNA polymerase distribution and reanalyzed published expression data in mammals, C. elegans and Drosophila. Our analyses, which take into account the skewed gene content of the X chromosome, support the hypothesis of upregulation of expressed X-linked genes to balance expression of the genome.
0
Paper
Citation259
0
Save
0

Diverse transcription factor binding features revealed by genome-wide ChIP-seq in C. elegans

Wei Niu et al.Apr 18, 2024
+15
M
Z
W
Regulation of gene expression by sequence-specific transcription factors is central to developmental programs and depends on the binding of transcription factors with target sites in the genome. To date, most such analyses in Caenorhabditis elegans have focused on the interactions between a single transcription factor with one or a few select target genes. As part of the modENCODE Consortium, we have used chromatin immunoprecipitation coupled with high-throughput DNA sequencing (ChIP-seq) to determine the genome-wide binding sites of 22 transcription factors (ALR-1, BLMP-1, CEH-14, CEH-30, EGL-27, EGL-5, ELT-3, EOR-1, GEI-11, HLH-1, LIN-11, LIN-13, LIN-15B, LIN-39, MAB-5, MDL-1, MEP-1, PES-1, PHA-4, PQM-1, SKN-1, and UNC-130) at diverse developmental stages. For each factor we determined candidate gene targets, both coding and non-coding. The typical binding sites of almost all factors are within a few hundred nucleotides of the transcript start site. Most factors target a mixture of coding and non-coding target genes, although one factor preferentially binds to non-coding RNA genes. We built a regulatory network among the 22 factors to determine their functional relationships to each other and found that some factors appear to act preferentially as regulators and others as target genes. Examination of the binding targets of three related HOX factors--LIN-39, MAB-5, and EGL-5--indicates that these factors regulate genes involved in cellular migration, neuronal function, and vulval differentiation, consistent with their known roles in these developmental processes. Ultimately, the comprehensive mapping of transcription factor binding sites will identify features of transcriptional networks that regulate C. elegans developmental processes.
0
Paper
Citation223
0
Save
1

Regulatory analysis of the C. elegans genome with spatiotemporal resolution

Carlos Araya et al.Apr 14, 2024
+15
A
T
C
Discovering the structure and dynamics of transcriptional regulatory events in the genome with cellular and temporal resolution is crucial to understanding the regulatory underpinnings of development and disease. We determined the genomic distribution of binding sites for 92 transcription factors and regulatory proteins across multiple stages of Caenorhabditis elegans development by performing 241 ChIP-seq (chromatin immunoprecipitation followed by sequencing) experiments. Integration of regulatory binding and cellular-resolution expression data produced a spatiotemporally resolved metazoan transcription factor binding map. Using this map, we explore developmental regulatory circuits that encode combinatorial logic at the levels of co-binding and co-expression of transcription factors, characterizing the genomic coverage and clustering of regulatory binding, the binding preferences of, and biological processes regulated by, transcription factors, the global transcription factor co-associations and genomic subdomains that suggest shared patterns of regulation, and identifying key transcription factors and transcription factor co-associations for fate specification of individual lineages and cell types. Chromatin immunoprecipitation followed by sequencing across multiple stages of Caenorhabditis elegans development reveals the genomic distribution of binding sites for 92 transcription factors and regulatory proteins, and integration of these and cellular-resolution expression data produce a spatiotemporally resolved metazoan transcription factor binding map allowing exploration into the properties of developmental regulatory circuits. Here the modENCODE consortium looks at the genomic distribution of binding sites for 92 transcription factors and regulatory proteins across multiple stages of Caenorhabditis elegans development. By integrating these and cellular-resolution expression data they produce a spatiotemporal metazoan transcription factor binding map which is used to explore the design and properties of developmental regulatory circuits.
1
Paper
Citation117
1
Save
15

Whole-body gene expression atlas of an adult metazoan

Abbas Ghaddar et al.Oct 24, 2023
+4
C
E
A
Summary Animals are integrated organ systems composed of interacting cells whose structure and function are in turn defined by their active genes. Understanding what distinguishes physiological and disease states therefore requires systemic knowledge of the gene activities that define the distinct cells that make up an animal. Towards this goal, this study reports the first single-cell resolution transcriptional atlas of a fertile multicellular organism: Caenorhabditis elegans . The scRNA-Seq compendium of wild-type young adult C. elegans comprises 159 distinct cell types with 18,033 genes expressed across cell types. Fewer than 300 of these genes are housekeeping genes as evidenced by their consistent expression across cell types and conditions, and by their basic and essential functions; 170 of these housekeeping genes are conserved across phyla. The 362 transcription factors with available ChIP-Seq data are linked to patterns of gene expression of different cell types. To identify potential interactions between cell types, we used the in silico tool cell2cell to predict molecular patterns reflecting both known and uncharacterized intercellular interactions across the C. elegans body. Finally, we present WormSeq ( wormseq.org ), a web interface that, among other functions, enables users to query gene expression across cell types, identify cell-type specific and potential housekeeping genes, analyze candidate ligand-receptors mediating communication between cells, and study promiscuous and cell-specific transcription factors. The datasets, analyses, and tools presented here will enable the generation of testable hypotheses about the cell and organ-specific function of genes in diverse biological contexts.
13

Comprehensive characterization of tissue-specific chromatin accessibility in L2Caenorhabditis elegansnematodes

Timothy Durham et al.Oct 24, 2023
+4
L
R
T
Abstract Recently developed single cell technologies allow researchers to characterize cell states at ever greater resolution and scale. C. elegans is a particularly tractable system for studying development, and recent single cell RNA-seq studies characterized the gene expression patterns for nearly every cell type in the embryo and at the second larval stage (L2). Gene expression patterns are useful for learning about gene function and give insight into the biochemical state of different cell types; however, in order to understand these cell types, we must also determine how these gene expression levels are regulated. We present the first single cell ATAC-seq study in C. elegans . We collected data in L2 larvae to match the available single cell RNA-seq data set, and we identify tissue-specific chromatin accessibility patterns that align well with existing data, including the L2 single cell RNA-seq results. Using a novel implementation of the latent Dirichlet allocation algorithm, we leverage the single-cell resolution of the sci-ATAC-seq data to identify accessible loci at the level of individual cell types, providing new maps of putative cell type-specific gene regulatory sites, with promise for better understanding of cellular differentiation and gene regulation in the worm.
13
Paper
Citation1
0
Save
1

An integrated analysis tool reveals intrinsic biases in gene set enrichment

Nishant Thakur et al.Oct 24, 2023
+4
J
N
N
ABSTRACT Generating meaningful interpretations of gene lists remains a challenge for all large-scale studies. Many approaches exist, often based on evaluating gene enrichment among pre-determined gene classes. Here, we conceived and implemented yet another analysis tool (YAAT), specifically for data from the widely-used model organism C. elegans . YAAT extends standard enrichment analyses, using a combination of co-expression data and profiles of phylogenetic conservation, to identify groups of functionally-related genes. It additionally allows class clustering, providing inference of functional links between groups of genes. We give examples of the utility of YAAT for uncovering unsuspected links between genes and show how the approach can be used to prioritise genes for in-depth study. Our analyses revealed several limitations to the meaningful interpretation of gene lists, specifically related to data sources and the “universe” of gene lists used. We hope that YAAT will represent a model for integrated analysis that could be useful for large-scale exploration of biological function in other species.
1
Citation1
0
Save
0

A lineage-resolved molecular atlas of C. elegans embryogenesis at single cell resolution

Jonathan Packer et al.May 6, 2020
+9
C
Q
J
C. elegans is an animal with few cells, but a striking diversity of cell types. Here, we characterize the molecular basis for their specification by profiling the transcriptomes of 84,625 single embryonic cells. We identify 284 terminal and pre-terminal cell types, mapping most single cell transcriptomes to their exact position in the invariant C. elegans lineage. We use these annotations to perform the first quantitative analysis of the relationship between lineage and the transcriptome for a whole organism. We find that a strong lineage-transcriptome correlation in the early embryo breaks down in the final two cell divisions as cells adopt their terminal fates and that most distinct lineages that produce the same anatomical cell type converge to a homogenous transcriptomic state. Users can explore our data with a graphical application VisCello.
0

Comprehensive single cell transcriptional profiling of a multicellular organism by combinatorial indexing

Junyue Cao et al.May 6, 2020
+11
V
J
J
Conventional methods for profiling the molecular content of biological samples fail to resolve heterogeneity that is present at the level of single cells. In the past few years, single cell RNA sequencing has emerged as a powerful strategy for overcoming this challenge. However, its adoption has been limited by a paucity of methods that are at once simple to implement and cost effective to scale massively. Here, we describe a combinatorial indexing strategy to profile the transcriptomes of large numbers of single cells or single nuclei without requiring the physical isolation of each cell (Single cell Combinatorial Indexing RNA-seq or sci-RNA-seq). We show that sci-RNA-seq can be used to efficiently profile the transcriptomes of tens-of-thousands of single cells per experiment, and demonstrate that we can stratify cell types from these data. Key advantages of sci-RNA-seq over contemporary alternatives such as droplet-based single cell RNA-seq include sublinear cost scaling, a reliance on widely available reagents and equipment, the ability to concurrently process many samples within a single workflow, compatibility with methanol fixation of cells, cell capture based on DNA content rather than cell size, and the flexibility to profile either cells or nuclei. As a demonstration of sci-RNA-seq, we profile the transcriptomes of 42,035 single cells from C. elegans at the L2 stage, effectively 50-fold "shotgun cellular coverage" of the somatic cell composition of this organism at this stage. We identify 27 distinct cell types, including rare cell types such as the two distal tip cells of the developing gonad, estimate consensus expression profiles and define cell-type specific and selective genes. Given that C. elegans is the only organism with a fully mapped cellular lineage, these data represent a rich resource for future methods aimed at defining cell types and states. They will advance our understanding of developmental biology, and constitute a major leap towards a comprehensive, single-cell molecular atlas of a whole animal.
0

PhenoMIP: High Throughput Phenotyping of Diverse C. elegans Populations via Molecular Inversion Probes

Calvin Mok et al.May 7, 2020
+2
M
G
C
Whether generated within a lab setting or isolated from the wild, variant alleles continue to be an important resource for decoding gene function in model organisms such as Caenorhabditis elegans . With advances in massively parallel sequencing, multiple whole-genome sequenced (WGS) strain collections are now available to the research community. The Million Mutation Project (MMP) for instance, analysed 2007 N2-derived, mutagenized strains. Individually, each strain averages ~400 single nucleotide variants amounting to ~80 protein coding variants. The effects of these variants, however, remain largely uncharacterized and querying the breadth of these strains for phenotypic changes requires a method amenable to rapid and sensitive high-throughput analysis. Here we present a pooled competitive fitness approach to quantitatively phenotype subpopulations of sequenced collections via molecular inversion probes (PhenoMIP). We phenotyped the relative fitness of 217 mutant strains on multiple food sources and classified these into five categories. We also demonstrate on a subset of these strains, that their fitness defects can be genetically mapped. Overall, our results suggest that approximately 80% of MMP mutant strains may have a decreased fitness relative to the lab reference, N2. The costs of generating this form of analysis through WGS methods would be prohibitive while PhenoMIP analysis in this manner is accomplished at less than 1% of projected WGS costs. We propose methods for applying PhenoMIP to a broad range of population selection experiments in a cost-efficient manner that would be useful to the community at large.
Load More