SS
Steve Searle
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
12
(100% Open Access)
Cited by:
16,479
h-index:
20
/
i10-index:
21
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
4

Initial sequencing and comparative analysis of the mouse genome

R Waterston et al.Dec 1, 2002
+228
T
K
R
The sequence of the mouse genome is a key informational tool for understanding the contents of the human genome and a key experimental tool for biomedical research. Here, we report the results of an international collaboration to produce a high-quality draft sequence of the mouse genome. We also present an initial comparative analysis of the mouse and human genomes, describing some of the insights that can be gleaned from the two sequences. We discuss topics including the analysis of the evolutionary forces shaping the size, structure and sequence of the genomes; the conservation of large-scale synteny across most of the genomes; the much lower extent of sequence orthology covering less than half of the genomes; the proportions of the genomes under selection; the number of protein-coding genes; the expansion of gene families related to reproduction and immunity; the evolution of proteins; and the identification of intraspecies polymorphism.
4
Citation6,929
1
Save
0

The zebrafish reference genome sequence and its relationship to the human genome

Kerstin Howe et al.Apr 16, 2013
+180
L
K
K
A high-quality sequence assembly of the zebrafish genome reveals the largest gene set of any vertebrate and provides information on key genomic features, and comparison to the human reference genome shows that approximately 70% of human protein-coding genes have at least one clear zebrafish orthologue. The genome of the zebrafish — a key model organism for the study of development and human disease — has now been sequenced and published as a well-annotated reference genome. Zebrafish turns out to have the largest gene set of any vertebrate so far sequenced, and few pseudogenes. Importantly for disease studies, comparison between human and zebrafish sequences reveals that 70% of human genes have at least one obvious zebrafish orthologue. A second paper reports on an ongoing effort to identify and phenotype disruptive mutations in every zebrafish protein-coding gene. Using the reference genome sequence along with high-throughput sequencing and efficient chemical mutagenesis, the project's initial results — covering 38% of all known protein-coding genes — they describe phenotypic consequences of more than 1,000 alleles. The long-term goal is the creation of a knockout allele in every protein-coding gene in the zebrafish genome. All mutant alleles and data are freely available at go.nature.com/en6mos . Zebrafish have become a popular organism for the study of vertebrate gene function1,2. The virtually transparent embryos of this species, and the ability to accelerate genetic studies by gene knockdown or overexpression, have led to the widespread use of zebrafish in the detailed investigation of vertebrate gene function and increasingly, the study of human genetic disease3,4,5. However, for effective modelling of human genetic disease it is important to understand the extent to which zebrafish genes and gene structures are related to orthologous human genes. To examine this, we generated a high-quality sequence assembly of the zebrafish genome, made up of an overlapping set of completely sequenced large-insert clones that were ordered and oriented using a high-resolution high-density meiotic map. Detailed automatic and manual annotation provides evidence of more than 26,000 protein-coding genes6, the largest gene set of any vertebrate so far sequenced. Comparison to the human reference genome shows that approximately 70% of human genes have at least one obvious zebrafish orthologue. In addition, the high quality of this genome assembly provides a clearer understanding of key genomic features such as a unique repeat content, a scarcity of pseudogenes, an enrichment of zebrafish-specific genes on chromosome 4 and chromosomal regions that influence sex determination.
0
Citation4,154
1
Save
0

The genomic substrate for adaptive radiation in African cichlid fish

David Brawand et al.Sep 1, 2014
+72
Y
C
D
Cichlid fishes are famous for large, diverse and replicated adaptive radiations in the Great Lakes of East Africa. To understand the molecular mechanisms underlying cichlid phenotypic diversity, we sequenced the genomes and transcriptomes of five lineages of African cichlids: the Nile tilapia (Oreochromis niloticus), an ancestral lineage with low diversity; and four members of the East African lineage: Neolamprologus brichardi/pulcher (older radiation, Lake Tanganyika), Metriaclima zebra (recent radiation, Lake Malawi), Pundamilia nyererei (very recent radiation, Lake Victoria), and Astatotilapia burtoni (riverine species around Lake Tanganyika). We found an excess of gene duplications in the East African lineage compared to tilapia and other teleosts, an abundance of non-coding element divergence, accelerated coding sequence evolution, expression divergence associated with transposable element insertions, and regulation by novel microRNAs. In addition, we analysed sequence data from sixty individuals representing six closely related species from Lake Victoria, and show genome-wide diversifying selection on coding and regulatory variants, some of which were recruited from ancient polymorphisms. We conclude that a number of molecular mechanisms shaped East African cichlid genomes, and that amassing of standing variation during periods of relaxed purifying selection may have been important in facilitating subsequent evolutionary diversification. Genomes and transcriptomes of five distinct lineages of African cichlids, a textbook example of adaptive radiation, have been sequenced and analysed to reveal that many types of molecular changes contributed to rapid evolution, and that standing variation accumulated during periods of relaxed selection may have primed subsequent diversification. The 2,000 or so species of cichlid fish, to be found in the lakes and rivers of Africa's Rift Valley, provide the classic example of adaptive radiations. This large-scale international collaboration has sequenced and analysed the genomes and transcriptomes of five distinct lineages of African cichlids. The data reveal an excess of gene duplications in comparison to other fish species. There is an abundance of non-coding element divergence; accelerated coding sequence evolution; expression divergence associated with transposable element insertions in orthologous gene pairs; and regulation by novel miRNAs. Sequencing data from sixty individuals from six closely related Lake Victoria species point to rapid cichlid speciation associated with genome-wide diversifying selection on coding and regulatory variants, and imply that ancient periods of relaxed purifying selection enabled the accumulation of standing variation, which may have been important in facilitating diversification.
0
Citation934
0
Save
0

The genome of a songbird

Wesley Warren et al.Mar 30, 2010
+78
H
D
W
The genome of the zebra finch — a songbird and a model for the study of vertebrate brain, behaviour and evolution — has been sequenced. Its comparison with the chicken genome, the only other bird genome available, shows that genes with neural function and implicated in cognitive processing of song have been rapidly evolving in the finch lineage. The study also shows that vocal communication engages much of the zebra finch brain transcriptome and identifies a potential integrator of microRNA signals linked to vocal communication. The genome of the zebra finch — a songbird and a model for studying the vertebrate brain, behaviour and evolution — has been sequenced. Comparison with the chicken genome, the only other bird genome available, shows that genes that have neural function and are implicated in the cognitive processing of song have been evolving rapidly in the finch lineage. Moreover, vocal communication engages much of the transcriptome of the zebra finch brain. The zebra finch is an important model organism in several fields1,2 with unique relevance to human neuroscience3,4. Like other songbirds, the zebra finch communicates through learned vocalizations, an ability otherwise documented only in humans and a few other animals and lacking in the chicken5—the only bird with a sequenced genome until now6. Here we present a structural, functional and comparative analysis of the genome sequence of the zebra finch (Taeniopygia guttata), which is a songbird belonging to the large avian order Passeriformes7. We find that the overall structures of the genomes are similar in zebra finch and chicken, but they differ in many intrachromosomal rearrangements, lineage-specific gene family expansions, the number of long-terminal-repeat-based retrotransposons, and mechanisms of sex chromosome dosage compensation. We show that song behaviour engages gene regulatory networks in the zebra finch brain, altering the expression of long non-coding RNAs, microRNAs, transcription factors and their targets. We also show evidence for rapid molecular evolution in the songbird lineage of genes that are regulated during song experience. These results indicate an active involvement of the genome in neural processes underlying vocal communication and identify potential genetic substrates for the evolution and regulation of this behaviour.
0
Citation807
0
Save
0

The genome sequence of Atlantic cod reveals a unique immune system

Bastiaan Star et al.Aug 9, 2011
+39
S
A
B
The genome of the Atlantic cod has been sequenced, and genomic analysis reveals an immune system that differs significantly from that in other vertebrates. The major histocompatibility complex (MHC) II has been lost, as have some other genes that are essential for MHC II function. But there is an expansion in the number of MHC I genes and a unique composition for its toll-like receptor family. These compensatory changes in both adaptive and innate immunity mean that cod is no more susceptible to disease than most other vertebrates. These findings challenge current models of vertebrate immune evolution, and may facilitate the development of targeted vaccines for disease management in aquaculture. Atlantic cod (Gadus morhua) is a large, cold-adapted teleost that sustains long-standing commercial fisheries and incipient aquaculture1,2. Here we present the genome sequence of Atlantic cod, showing evidence for complex thermal adaptations in its haemoglobin gene cluster and an unusual immune architecture compared to other sequenced vertebrates. The genome assembly was obtained exclusively by 454 sequencing of shotgun and paired-end libraries, and automated annotation identified 22,154 genes. The major histocompatibility complex (MHC) II is a conserved feature of the adaptive immune system of jawed vertebrates3,4, but we show that Atlantic cod has lost the genes for MHC II, CD4 and invariant chain (Ii) that are essential for the function of this pathway. Nevertheless, Atlantic cod is not exceptionally susceptible to disease under natural conditions5. We find a highly expanded number of MHC I genes and a unique composition of its Toll-like receptor (TLR) families. This indicates how the Atlantic cod immune system has evolved compensatory mechanisms in both adaptive and innate immunity in the absence of MHC II. These observations affect fundamental assumptions about the evolution of the adaptive immune system and its components in vertebrates.
0
Citation749
0
Save
0

The genome of the green anole lizard and a comparative analysis with birds and mammals

Jessica Alföldi et al.Aug 30, 2011
+46
M
F
J
The evolution of the amniotic egg was one of the great evolutionary innovations in the history of life, freeing vertebrates from an obligatory connection to water and thus permitting the conquest of terrestrial environments. Among amniotes, genome sequences are available for mammals and birds, but not for non-avian reptiles. Here we report the genome sequence of the North American green anole lizard, Anolis carolinensis. We find that A. carolinensis microchromosomes are highly syntenic with chicken microchromosomes, yet do not exhibit the high GC and low repeat content that are characteristic of avian microchromosomes. Also, A. carolinensis mobile elements are very young and diverse-more so than in any other sequenced amniote genome. The GC content of this lizard genome is also unusual in its homogeneity, unlike the regionally variable GC content found in mammals and birds. We describe and assign sequence to the previously unknown A. carolinensis X chromosome. Comparative gene analysis shows that amniote egg proteins have evolved significantly more rapidly than other proteins. An anole phylogeny resolves basal branches to illuminate the history of their repeated adaptive radiations.
0
Citation628
0
Save
0

The consensus coding sequence (CCDS) project: Identifying a common protein-coding gene set for the human and mouse genomes

Kim Pruitt et al.Jun 4, 2009
+46
R
J
K
Effective use of the human and mouse genomes requires reliable identification of genes and their products. Although multiple public resources provide annotation, different methods are used that can result in similar but not identical representation of genes, transcripts, and proteins. The collaborative consensus coding sequence (CCDS) project tracks identical protein annotations on the reference mouse and human genomes with a stable identifier (CCDS ID), and ensures that they are consistently represented on the NCBI, Ensembl, and UCSC Genome Browsers. Importantly, the project coordinates on manually reviewing inconsistent protein annotations between sites, as well as annotations for which new evidence suggests a revision is needed, to progressively converge on a complete protein-coding set for the human and mouse reference genomes, while maintaining a high standard of reliability and biological accuracy. To date, the project has identified 20,159 human and 17,707 mouse consensus coding regions from 17,052 human and 16,893 mouse genes. Three evaluation methods indicate that the entries in the CCDS set are highly likely to represent real proteins, more so than annotations from contributing groups not included in CCDS. The CCDS database thus centralizes the function of identifying well-supported, identically-annotated, protein-coding regions.
0
Citation560
0
Save
0

The draft genomes of soft-shell turtle and green sea turtle yield insights into the development and evolution of the turtle-specific body plan

Zhuo Wang et al.Apr 28, 2013
+31
A
J
Z
The unique anatomical features of turtles have raised unanswered questions about the origin of their unique body plan. We generated and analyzed draft genomes of the soft-shell turtle (Pelodiscus sinensis) and the green sea turtle (Chelonia mydas); our results indicated the close relationship of the turtles to the bird-crocodilian lineage, from which they split ∼267.9-248.3 million years ago (Upper Permian to Triassic). We also found extensive expansion of olfactory receptor genes in these turtles. Embryonic gene expression analysis identified an hourglass-like divergence of turtle and chicken embryogenesis, with maximal conservation around the vertebrate phylotypic period, rather than at later stages that show the amniote-common pattern. Wnt5a expression was found in the growth zone of the dorsal shell, supporting the possible co-option of limb-associated Wnt signaling in the acquisition of this turtle-specific novelty. Our results suggest that turtle evolution was accompanied by an unexpectedly conservative vertebrate phylotypic period, followed by turtle-specific repatterning of development to yield the novel structure of the shell.
0
Citation408
0
Save
0

Rabbit genome analysis reveals a polygenic basis for phenotypic change during domestication

Miguel Carneiro et al.Aug 28, 2014
+37
F
C
M
Rabbits softly swept to domestication When people domesticate animals, they select for tameness and tolerance of humans. What else do they look for? To identify the selective pressures that led to rabbit domestication, Carneiro et al. sequenced a domestic rabbit genome and compared it to that of its wild brethren (see the Perspective by Lohmueller). Domestication did not involve a single gene changing, but rather many gene alleles changing in frequency between tame and domestic rabbits, known as a soft selective sweep. Many of these alleles have changes that may affect brain development, supporting the idea that tameness involves changes at multiple loci. Science , this issue p. 1074 ; see also p. 1000
0
Citation362
0
Save
0

Ensembl 2005

Tim Hubbard et al.Dec 17, 2004
+49
M
D
T
The Ensembl ( http://www.ensembl.org/ ) project provides a comprehensive and integrated source of annotation of large genome sequences. Over the last year the number of genomes available from the Ensembl site has increased by 7 to 16, with the addition of the six vertebrate genomes of chimpanzee, dog, cow, chicken, tetraodon and frog and the insect genome of honeybee. The majority have been annotated automatically using the Ensembl gene build system, showing its flexibility to reliably annotate a wide variety of genomes. With the increased number of vertebrate genomes, the comparative analysis provided to users has been greatly improved, with new website interfaces allowing annotation of different genomes to be directly compared. The Ensembl software system is being increasingly widely reused in different projects showing the benefits of a completely open approach to software development and distribution.
0
Citation345
0
Save
Load More