WW
Wesley Warren
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
77
(84% Open Access)
Cited by:
22,007
h-index:
82
/
i10-index:
196
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
13

Towards complete and error-free genome assemblies of all vertebrate species

Arang Rhie et al.Apr 28, 2021
Abstract High-quality and complete reference genome assemblies are fundamental for the application of genomics to biology, disease, and biodiversity conservation. However, such assemblies are available for only a few non-microbial species 1–4 . To address this issue, the international Genome 10K (G10K) consortium 5,6 has worked over a five-year period to evaluate and develop cost-effective methods for assembling highly accurate and nearly complete reference genomes. Here we present lessons learned from generating assemblies for 16 species that represent six major vertebrate lineages. We confirm that long-read sequencing technologies are essential for maximizing genome quality, and that unresolved complex repeats and haplotype heterozygosity are major sources of assembly error when not handled correctly. Our assemblies correct substantial errors, add missing sequence in some of the best historical reference genomes, and reveal biological discoveries. These include the identification of many false gene duplications, increases in gene sizes, chromosome rearrangements that are specific to lineages, a repeated independent chromosome breakpoint in bat genomes, and a canonical GC-rich pattern in protein-coding genes and their regulatory regions. Adopting these lessons, we have embarked on the Vertebrate Genomes Project (VGP), an international effort to generate high-quality, complete reference genomes for all of the roughly 70,000 extant vertebrate species and to help to enable a new era of discovery across the life sciences.
13
Citation1,568
0
Save
0

A high-resolution map of human evolutionary constraint using 29 mammals

Kerstin Lindblad‐Toh et al.Oct 1, 2011
The comparison of related genomes has emerged as a powerful lens for genome interpretation. Here we report the sequencing and comparative analysis of 29 eutherian genomes. We confirm that at least 5.5% of the human genome has undergone purifying selection, and locate constrained elements covering ∼4.2% of the genome. We use evolutionary signatures and comparisons with experimental data sets to suggest candidate functions for ∼60% of constrained bases. These elements reveal a small number of new coding exons, candidate stop codon readthrough events and over 10,000 regions of overlapping synonymous constraint within protein-coding exons. We find 220 candidate RNA structural families, and nearly a million elements overlapping potential promoter, enhancer and insulator regions. We report specific amino acid residues that have undergone positive selection, 280,000 non-coding elements exapted from mobile elements and more than 1,000 primate- and human-accelerated elements. Overlap with disease-associated variants indicates that our findings will be relevant for studies of human biology, health and disease. This comparative genomics study, comparing the complete human genome sequence with those of 29 placental mammals, including chimpanzees, mice and dogs, identifies 4.2% of the human genome as constrained by evolutionary selection, and ascribes a potential function to about 60% of these constrained bases. A series of evolutionary signatures emerges, providing insights into coding and non-coding functional genomic elements, candidate RNA structural families and aspects of genome organization and evolution. Overlap with disease-associated variants indicates that the findings will be relevant for studies of human disease.
0
Citation1,129
0
Save
0

The genome of a songbird

Wesley Warren et al.Mar 30, 2010
The genome of the zebra finch — a songbird and a model for the study of vertebrate brain, behaviour and evolution — has been sequenced. Its comparison with the chicken genome, the only other bird genome available, shows that genes with neural function and implicated in cognitive processing of song have been rapidly evolving in the finch lineage. The study also shows that vocal communication engages much of the zebra finch brain transcriptome and identifies a potential integrator of microRNA signals linked to vocal communication. The genome of the zebra finch — a songbird and a model for studying the vertebrate brain, behaviour and evolution — has been sequenced. Comparison with the chicken genome, the only other bird genome available, shows that genes that have neural function and are implicated in the cognitive processing of song have been evolving rapidly in the finch lineage. Moreover, vocal communication engages much of the transcriptome of the zebra finch brain. The zebra finch is an important model organism in several fields1,2 with unique relevance to human neuroscience3,4. Like other songbirds, the zebra finch communicates through learned vocalizations, an ability otherwise documented only in humans and a few other animals and lacking in the chicken5—the only bird with a sequenced genome until now6. Here we present a structural, functional and comparative analysis of the genome sequence of the zebra finch (Taeniopygia guttata), which is a songbird belonging to the large avian order Passeriformes7. We find that the overall structures of the genomes are similar in zebra finch and chicken, but they differ in many intrachromosomal rearrangements, lineage-specific gene family expansions, the number of long-terminal-repeat-based retrotransposons, and mechanisms of sex chromosome dosage compensation. We show that song behaviour engages gene regulatory networks in the zebra finch brain, altering the expression of long non-coding RNAs, microRNAs, transcription factors and their targets. We also show evidence for rapid molecular evolution in the songbird lineage of genes that are regulated during song experience. These results indicate an active involvement of the genome in neural processes underlying vocal communication and identify potential genetic substrates for the evolution and regulation of this behaviour.
0
Citation807
0
Save
0

Insights into hominid evolution from the gorilla genome sequence

Aylwyn Scally et al.Mar 1, 2012
Gorillas are humans’ closest living relatives after chimpanzees, and are of comparable importance for the study of human origins and evolution. Here we present the assembly and analysis of a genome sequence for the western lowland gorilla, and compare the whole genomes of all extant great ape genera. We propose a synthesis of genetic and fossil evidence consistent with placing the human–chimpanzee and human–chimpanzee–gorilla speciation events at approximately 6 and 10 million years ago. In 30% of the genome, gorilla is closer to human or chimpanzee than the latter are to each other; this is rarer around coding genes, indicating pervasive selection throughout great ape evolution, and has functional consequences in gene expression. A comparison of protein coding genes reveals approximately 500 genes showing accelerated evolution on each of the gorilla, human and chimpanzee lineages, and evidence for parallel acceleration, particularly of genes involved in hearing. We also compare the western and eastern gorilla species, estimating an average sequence divergence time 1.75 million years ago, but with evidence for more recent genetic exchange and a population bottleneck in the eastern species. The use of the genome sequence in these and future analyses will promote a deeper understanding of great ape biology and evolution. The genome of a western lowland gorilla has been sequenced and analysed, completing the genome sequences of all great ape genera, and providing evidence for parallel accelerated evolution in chimpanzee, gorilla and human lineages at a number of loci. The genome of the gorilla has been sequenced, making it possible to compare the DNA of the four surviving hominid genera: human, chimpanzee, gorilla and orang-utan. The data — mainly from a female western lowland gorilla named Kamilah, but also from other gorillas representing both the western lowland and eastern lowland sub-species — imply that in almost one-third of its genome, the gorilla is closer to the human or chimpanzee than the human and chimp are to each other. Around 500 genes show accelerated evolution in gorilla, human and chimpanzee lineages, and there is evidence for parallel acceleration, particularly in genes associated with hearing. On the basis of genetic and fossil evidence, the authors suggest that the human–chimpanzee and human–chimpanzee–gorilla speciation events occurred at around 6 million and 10 million years ago respectively, whereas the two gorilla species diverged around 1.75 million years ago.
0
Citation749
0
Save
0

Genome analysis of the platypus reveals unique signatures of evolution

Wesley Warren et al.May 1, 2008
We present a draft genome sequence of the platypus, Ornithorhynchus anatinus. This monotreme exhibits a fascinating combination of reptilian and mammalian characters. For example, platypuses have a coat of fur adapted to an aquatic lifestyle; platypus females lactate, yet lay eggs; and males are equipped with venom similar to that of reptiles. Analysis of the first monotreme genome aligned these features with genetic innovations. We find that reptile and platypus venom proteins have been co-opted independently from the same gene families; milk protein genes are conserved despite platypuses laying eggs; and immune gene family expansions are directly related to platypus biology. Expansions of protein, non-protein-coding RNA and microRNA families, as well as repeat elements, are identified. Sequencing of this genome now provides a valuable resource for deep mammalian comparative analyses, as well as for monotreme biology and conservation. The duck-billed platypus (Ornithorhynchus anatinus) is a unique egg-laying mammal, with lactation, venom and a bill. It even has an electro­sensory system for foraging underwater. Platypuses are monotremes descended from the most basal branch of the mammalian lineage and combine aspects of both reptilian and mammalian biology. Now an international consortium reports the sequence and analysis of the platypus genome. It is an amalgam of reptilian, mammalian and its own unique characteristics that provides clues to the function and evolution of all mammalian genomes. As well as helping uncover the origins of genomic imprinting, analyses show that platypus and reptile venom proteins have been co-opted independently from the same gene families; milk protein genes are conserved; and immune gene family expansions are directly related to platypus biology. The sequence provides an invaluable resource for comparative genomics, and it will be important for monotreme conservation. The cover image shows the bill with electro­sensory pits, eye and ear opening behind the eye. Platypuses are monotremes and combine aspects of both reptilian and mammalian behaviour. An international consortium reports the genome sequence and analysis of Ornithorhynchus anatinus and as expected, parts of the genome look more like mammals, whereas other parts more like reptiles or even chickens.
0
Citation703
0
Save
0

Elephant shark genome provides unique insights into gnathostome evolution

Byrappa Venkatesh et al.Jan 7, 2014
The emergence of jawed vertebrates (gnathostomes) from jawless vertebrates was accompanied by major morphological and physiological innovations, such as hinged jaws, paired fins and immunoglobulin-based adaptive immunity. Gnathostomes subsequently diverged into two groups, the cartilaginous fishes and the bony vertebrates. Here we report the whole-genome analysis of a cartilaginous fish, the elephant shark (Callorhinchus milii). We find that the C. milii genome is the slowest evolving of all known vertebrates, including the ‘living fossil’ coelacanth, and features extensive synteny conservation with tetrapod genomes, making it a good model for comparative analyses of gnathostome genomes. Our functional studies suggest that the lack of genes encoding secreted calcium-binding phosphoproteins in cartilaginous fishes explains the absence of bone in their endoskeleton. Furthermore, the adaptive immune system of cartilaginous fishes is unusual: it lacks the canonical CD4 co-receptor and most transcription factors, cytokines and cytokine receptors related to the CD4 lineage, despite the presence of polymorphic major histocompatibility complex class II molecules. It thus presents a new model for understanding the origin of adaptive immunity. Whole-genome analysis of the elephant shark, a cartilaginous fish, shows that it is the slowest evolving of all known vertebrates, lacks critical bone formation genes and has an unusual adaptive immune system. The elephant shark (Callorhinchus milii) is a cartilaginous fish native to the temperate waters off southern Australia and New Zealand, living at depths of 200 to 500 metres and migrating into shallow waters during spring for breeding. The genome sequence is published in this issue of Nature. Comparison with other vertebrate genomes shows that it is the slowest evolving genome of all known vertebrates — coelacanth included. Genome analysis points to an unusual adaptive immune system lacking the CD4 receptor and some associated cytokines, indicating that cartilaginous fishes possess a primordial gnathostome adaptive immune system. Also absent are genes encoding secreted calcium-binding phosphoproteins, in line with the absence of bone in cartilaginous fish.
0
Citation678
0
Save
Load More