EJ
Erich Jarvis
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
63
(90% Open Access)
Cited by:
13,807
h-index:
83
/
i10-index:
221
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Revised nomenclature for avian telencephalon and some related brainstem nuclei

Anton Reiner et al.Apr 22, 2004
Abstract The standard nomenclature that has been used for many telencephalic and related brainstem structures in birds is based on flawed assumptions of homology to mammals. In particular, the outdated terminology implies that most of the avian telencephalon is a hypertrophied basal ganglia, when it is now clear that most of the avian telencephalon is neurochemically, hodologically, and functionally comparable to the mammalian neocortex, claustrum, and pallial amygdala (all of which derive from the pallial sector of the developing telencephalon). Recognizing that this promotes misunderstanding of the functional organization of avian brains and their evolutionary relationship to mammalian brains, avian brain specialists began discussions to rectify this problem, culminating in the Avian Brain Nomenclature Forum held at Duke University in July 2002, which approved a new terminology for avian telencephalon and some allied brainstem cell groups. Details of this new terminology are presented here, as is a rationale for each name change and evidence for any homologies implied by the new names. Revisions for the brainstem focused on vocal control, catecholaminergic, cholinergic, and basal ganglia‐related nuclei. For example, the Forum recognized that the hypoglossal nucleus had been incorrectly identified as the nucleus intermedius in the Karten and Hodos ( 1967 ) pigeon brain atlas, and what was identified as the hypoglossal nucleus in that atlas should instead be called the supraspinal nucleus. The locus ceruleus of this and other avian atlases was noted to consist of a caudal noradrenergic part homologous to the mammalian locus coeruleus and a rostral region corresponding to the mammalian A8 dopaminergic cell group. The midbrain dopaminergic cell group in birds known as the nucleus tegmenti pedunculopontinus pars compacta was recognized as homologous to the mammalian substantia nigra pars compacta and was renamed accordingly; a group of γ‐aminobutyric acid (GABA)ergic neurons at the lateral edge of this region was identified as homologous to the mammalian substantia nigra pars reticulata and was also renamed accordingly. A field of cholinergic neurons in the rostral avian hindbrain was named the nucleus pedunculopontinus tegmenti, whereas the anterior nucleus of the ansa lenticularis in the avian diencephalon was renamed the subthalamic nucleus, both for their evident mammalian homologues. For the basal (i.e., subpallial) telencephalon, the actual parts of the basal ganglia were given names reflecting their now evident homologues. For example, the lobus parolfactorius and paleostriatum augmentatum were acknowledged to make up the dorsal subdivision of the striatal part of the basal ganglia and were renamed as the medial and lateral striatum. The paleostriatum primitivum was recognized as homologous to the mammalian globus pallidus and renamed as such. Additionally, the rostroventral part of what was called the lobus parolfactorius was acknowledged as comparable to the mammalian nucleus accumbens, which, together with the olfactory tubercle, was noted to be part of the ventral striatum in birds. A ventral pallidum, a basal cholinergic cell group, and medial and lateral bed nuclei of the stria terminalis were also recognized. The dorsal (i.e., pallial) telencephalic regions that had been erroneously named to reflect presumed homology to striatal parts of mammalian basal ganglia were renamed as part of the pallium, using prefixes that retain most established abbreviations, to maintain continuity with the outdated nomenclature. We concluded, however, that one‐to‐one (i.e., discrete) homologies with mammals are still uncertain for most of the telencephalic pallium in birds and thus the new pallial terminology is largely devoid of assumptions of one‐to‐one homologies with mammals. The sectors of the hyperstriatum composing the Wulst (i.e., the hyperstriatum accessorium intermedium, and dorsale), the hyperstriatum ventrale, the neostriatum, and the archistriatum have been renamed (respectively) the hyperpallium (hypertrophied pallium), the mesopallium (middle pallium), the nidopallium (nest pallium), and the arcopallium (arched pallium). The posterior part of the archistriatum has been renamed the posterior pallial amygdala, the nucleus taeniae recognized as part of the avian amygdala, and a region inferior to the posterior paleostriatum primitivum included as a subpallial part of the avian amygdala. The names of some of the laminae and fiber tracts were also changed to reflect current understanding of the location of pallial and subpallial sectors of the avian telencephalon. Notably, the lamina medularis dorsalis has been renamed the pallial‐subpallial lamina. We urge all to use this new terminology, because we believe it will promote better communication among neuroscientists. Further information is available at http://avianbrain.org . J. Comp. Neurol. 473:377–414, 2004. © 2004 Wiley‐Liss, Inc.
0

Hybrid error correction and de novo assembly of single-molecule sequencing reads

Sergey Koren et al.Jul 1, 2012
Single-molecule sequencing technologies can produce multikilobase-long reads, which are more useful than short reads for assembling genomes and transcriptomes, but their error rates are too high. Koren et al. correct long reads from a PacBio instrument using high-fidelity, short reads from complementary technologies, facilitating assembly of previously intractable sequences. Single-molecule sequencing instruments can generate multikilobase sequences with the potential to greatly improve genome and transcriptome assembly. However, the error rates of single-molecule reads are high, which has limited their use thus far to resequencing bacteria. To address this limitation, we introduce a correction algorithm and assembly strategy that uses short, high-fidelity sequences to correct the error in single-molecule sequences. We demonstrate the utility of this approach on reads generated by a PacBio RS instrument from phage, prokaryotic and eukaryotic whole genomes, including the previously unsequenced genome of the parrot Melopsittacus undulatus, as well as for RNA-Seq reads of the corn (Zea mays) transcriptome. Our long-read correction achieves >99.9% base-call accuracy, leading to substantially better assemblies than current sequencing strategies: in the best example, the median contig size was quintupled relative to high-coverage, second-generation assemblies. Greater gains are predicted if read lengths continue to increase, including the prospect of single-contig bacterial chromosome assembly.
0
Citation1,017
0
Save
0

The genome of a songbird

Wesley Warren et al.Mar 30, 2010
The genome of the zebra finch — a songbird and a model for the study of vertebrate brain, behaviour and evolution — has been sequenced. Its comparison with the chicken genome, the only other bird genome available, shows that genes with neural function and implicated in cognitive processing of song have been rapidly evolving in the finch lineage. The study also shows that vocal communication engages much of the zebra finch brain transcriptome and identifies a potential integrator of microRNA signals linked to vocal communication. The genome of the zebra finch — a songbird and a model for studying the vertebrate brain, behaviour and evolution — has been sequenced. Comparison with the chicken genome, the only other bird genome available, shows that genes that have neural function and are implicated in the cognitive processing of song have been evolving rapidly in the finch lineage. Moreover, vocal communication engages much of the transcriptome of the zebra finch brain. The zebra finch is an important model organism in several fields1,2 with unique relevance to human neuroscience3,4. Like other songbirds, the zebra finch communicates through learned vocalizations, an ability otherwise documented only in humans and a few other animals and lacking in the chicken5—the only bird with a sequenced genome until now6. Here we present a structural, functional and comparative analysis of the genome sequence of the zebra finch (Taeniopygia guttata), which is a songbird belonging to the large avian order Passeriformes7. We find that the overall structures of the genomes are similar in zebra finch and chicken, but they differ in many intrachromosomal rearrangements, lineage-specific gene family expansions, the number of long-terminal-repeat-based retrotransposons, and mechanisms of sex chromosome dosage compensation. We show that song behaviour engages gene regulatory networks in the zebra finch brain, altering the expression of long non-coding RNAs, microRNAs, transcription factors and their targets. We also show evidence for rapid molecular evolution in the songbird lineage of genes that are regulated during song experience. These results indicate an active involvement of the genome in neural processes underlying vocal communication and identify potential genetic substrates for the evolution and regulation of this behaviour.
0
Citation807
0
Save
0

Earth BioGenome Project: Sequencing life for the future of life

Harris Lewin et al.Apr 23, 2018
Increasing our understanding of Earth’s biodiversity and responsibly stewarding its resources are among the most crucial scientific and social challenges of the new millennium. These challenges require fundamental new knowledge of the organization, evolution, functions, and interactions among millions of the planet’s organisms. Herein, we present a perspective on the Earth BioGenome Project (EBP), a moonshot for biology that aims to sequence, catalog, and characterize the genomes of all of Earth’s eukaryotic biodiversity over a period of 10 years. The outcomes of the EBP will inform a broad range of major issues facing humanity, such as the impact of climate change on biodiversity, the conservation of endangered species and ecosystems, and the preservation and enhancement of ecosystem services. We describe hurdles that the project faces, including data-sharing policies that ensure a permanent, freely available resource for future scientific discovery while respecting access and benefit sharing guidelines of the Nagoya Protocol. We also describe scientific and organizational challenges in executing such an ambitious project, and the structure proposed to achieve the project’s goals. The far-reaching potential benefits of creating an open digital repository of genomic information for life on Earth can be realized only by a coordinated international effort.
0
Paper
Citation788
0
Save
0

Assemblathon 2: evaluating de novo methods of genome assembly in three vertebrate species

Keith Bradnam et al.Jul 22, 2013
Background - The process of generating raw genome sequence data continues to become cheaper, faster, and more accurate. However, assembly of such data into high-quality, finished genome sequences remains challenging. Many genome assembly tools are available, but they differ greatly in terms of their performance (speed, scalability, hardware requirements, acceptance of newer read technologies) and in their final output (composition of assembled sequence). More importantly, it remains largely unclear how to best assess the quality of assembled genome sequences. The Assemblathon competitions are intended to assess current state-of-the-art methods in genome assembly. Results - In Assemblathon 2, we provided a variety of sequence data to be assembled for three vertebrate species (a bird, a fish, and snake). This resulted in a total of 43 submitted assemblies from 21 participating teams. We evaluated these assemblies using a combination of optical map data, Fosmid sequences, and several statistical methods. From over 100 different metrics, we chose ten key measures by which to assess the overall quality of the assemblies. Conclusions - Many current genome assemblers produced useful assemblies, containing a significant representation of their genes, regulatory sequences, and overall genome structure. However, the high degree of variability between the entries suggests that there is still much room for improvement in the field of genome assembly and that approaches which work well in assembling the genome of one species may not necessarily work well for another.
0
Citation670
0
Save
0

Advances to Bayesian network inference for generating causal networks from observational biological data

Jing Yu et al.Jul 29, 2004
Network inference algorithms are powerful computational tools for identifying putative causal interactions among variables from observational data. Bayesian network inference algorithms hold particular promise in that they can capture linear, non-linear, combinatorial, stochastic and other types of relationships among variables across multiple levels of biological organization. However, challenges remain when applying these algorithms to limited quantities of experimental data collected from biological systems. Here, we use a simulation approach to make advances in our dynamic Bayesian network (DBN) inference algorithm, especially in the context of limited quantities of biological data.We test a range of scoring metrics and search heuristics to find an effective algorithm configuration for evaluating our methodological advances. We also identify sampling intervals and levels of data discretization that allow the best recovery of the simulated networks. We develop a novel influence score for DBNs that attempts to estimate both the sign (activation or repression) and relative magnitude of interactions among variables. When faced with limited quantities of observational data, combining our influence score with moderate data interpolation reduces a significant portion of false positive interactions in the recovered networks. Together, our advances allow DBN inference algorithms to be more effective in recovering biological networks from experimentally collected data.Source code and simulated data are available upon request.http://www.jarvislab.net/Bioinformatics/BNAdvances/
Load More