BH
Bettina Haase
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
16
(94% Open Access)
Cited by:
1,906
h-index:
16
/
i10-index:
22
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
13

Towards complete and error-free genome assemblies of all vertebrate species

Arang Rhie et al.Apr 28, 2021
Abstract High-quality and complete reference genome assemblies are fundamental for the application of genomics to biology, disease, and biodiversity conservation. However, such assemblies are available for only a few non-microbial species 1–4 . To address this issue, the international Genome 10K (G10K) consortium 5,6 has worked over a five-year period to evaluate and develop cost-effective methods for assembling highly accurate and nearly complete reference genomes. Here we present lessons learned from generating assemblies for 16 species that represent six major vertebrate lineages. We confirm that long-read sequencing technologies are essential for maximizing genome quality, and that unresolved complex repeats and haplotype heterozygosity are major sources of assembly error when not handled correctly. Our assemblies correct substantial errors, add missing sequence in some of the best historical reference genomes, and reveal biological discoveries. These include the identification of many false gene duplications, increases in gene sizes, chromosome rearrangements that are specific to lineages, a repeated independent chromosome breakpoint in bat genomes, and a canonical GC-rich pattern in protein-coding genes and their regulatory regions. Adopting these lessons, we have embarked on the Vertebrate Genomes Project (VGP), an international effort to generate high-quality, complete reference genomes for all of the roughly 70,000 extant vertebrate species and to help to enable a new era of discovery across the life sciences.
13
Citation1,568
0
Save
0

Single-cell isoform RNA sequencing characterizes isoforms in thousands of cerebellar cells

Ishaan Gupta et al.Oct 15, 2018
Full-length spliced RNA isoforms are identified in thousands of single cerebellar cells. Full-length RNA sequencing (RNA-Seq) has been applied to bulk tissue, cell lines and sorted cells to characterize transcriptomes1,2,3,4,5,6,7,8,9,10,11, but applying this technology to single cells has proven to be difficult, with less than ten single-cell transcriptomes having been analyzed thus far12,13. Although single splicing events have been described for ≤200 single cells with statistical confidence14,15, full-length mRNA analyses for hundreds of cells have not been reported. Single-cell short-read 3′ sequencing enables the identification of cellular subtypes16,17,18,19,20,21, but full-length mRNA isoforms for these cell types cannot be profiled. We developed a method that starts with bulk tissue and identifies single-cell types and their full-length RNA isoforms without fluorescence-activated cell sorting. Using single-cell isoform RNA-Seq (ScISOr-Seq), we identified RNA isoforms in neurons, astrocytes, microglia, and cell subtypes such as Purkinje and Granule cells, and cell-type-specific combination patterns of distant splice sites6,7,8,9,22,23. We used ScISOr-Seq to improve genome annotation in mouse Gencode version 10 by determining the cell-type-specific expression of 18,173 known and 16,872 novel isoforms.
0
Citation299
0
Save
0

Distinct patterns of genetic variation at low-recombining genomic regions represent haplotype structure

Jun Ishigohoka et al.Dec 23, 2021
Abstract Genetic variation of the entire genome represents population structure, yet individual loci can show distinct patterns. Such deviations identified through genome scans have often been attributed to effects of selective factors instead of randomness, assuming that the genomic intervals are long enough to average out randomness in underlying genealogies. However, an alternative explanation to distinct patterns has not been fully addressed: too few genealogies to average out the effect of randomness. Specifically, distinct patterns of genetic variation may be due to reduced local recombination rate, since the number of genealogies in a genomic interval corresponds to the number of ancestral recombination events. Here, we associate distinct patterns of local genetic variation with reduced recombination rate in a songbird, the Eurasian blackcap, using genome sequences and recombination maps. We find that distinct patterns of local genetic variation represent haplotype structure at low-recombining regions present either in all populations or only in a few populations. At the former species-wide low- recombining regions, genetic variation depicts conspicuous haplotypes segregating in multiple populations. On the contrary, at the latter population-specific low-recombining regions, genetic variation primarily represents cryptic haplotype structure among individuals of the low-recombining populations. With simulations, we confirm that reduction in recombination rate alone can cause distinct patterns of genetic variation mirroring our empirical data. Our results highlight that distinct patterns of genetic variation can emerge through evolution of reduced local recombination rate. Recombination landscape as an evolvable trait therefore plays an important role determining the heterogeneous distribution of genetic variation along the genome.
0
Citation8
0
Save
0

Reference genome and demographic history of the most endangered marine mammal, the vaquita

Phillip Morin et al.May 28, 2020
Abstract The vaquita is the most critically endangered marine mammal, with fewer than 19 remaining in the wild. First described in 1958, the vaquita has been in rapid decline resulting from inadvertent deaths due to the increasing use of large-mesh gillnets for more than 20 years. To understand the evolutionary and demographic history of the vaquita, we used combined long-read sequencing and long-range scaffolding methods with long- and short-read RNA sequencing to generate a near error-free annotated reference genome assembly from cell lines derived from a female individual. The genome assembly consists of 99.92% of the assembled sequence contained in 21 nearly gapless chromosome-length autosome scaffolds and the X-chromosome scaffold, with a scaffold N50 of 115 Mb. Genome-wide heterozygosity is the lowest (0.01%) of any mammalian species analyzed to date, but heterozygosity is evenly distributed across the chromosomes, consistent with long-term small population size at genetic equilibrium, rather than low diversity resulting from a recent population bottleneck or inbreeding. Historical demography of the vaquita indicates long-term population stability at less than 5000 ( Ne ) for over 200,000 years. Together, these analyses indicate that the vaquita genome has had ample opportunity to purge highly deleterious alleles and potentially maintain diversity necessary for population health.
0
Citation7
0
Save
148

Cell-type, single-cell, and spatial signatures of brain-region specific splicing in postnatal development

Anoushka Joglekar et al.Aug 27, 2020
Abstract Alternative RNA splicing varies across brain regions, but the single-cell resolution of such regional variation is unknown. Here we present the first single-cell investigation of differential isoform expression (DIE) between brain regions, by performing single cell long-read transcriptome sequencing in the mouse hippocampus and prefrontal cortex in 45 cell types at postnatal day 7 ( www.isoformAtlas.com ). Using isoform tests for brain-region specific DIE, which outperform exon-based tests, we detect hundreds of brain-region specific DIE events traceable to specific cell-types. Many DIE events correspond to functionally distinct protein isoforms, some with just a 6-nucleotide exon variant. In most instances, one cell type is responsible for brain-region specific DIE. Cell types indigenous to only one anatomic structure display distinctive DIE, where for example, the choroid plexus epithelium manifest unique transcription start sites. However, for some genes, multiple cell-types are responsible for DIE in bulk data, indicating that regional identity can, although less frequently, override cell-type specificity. We validated our findings with spatial transcriptomics and long-read sequencing, yielding the first spatially resolved splicing map in the postnatal mouse brain ( www.isoformAtlas.com ). Our methods are highly generalizable. They provide a robust means of quantifying isoform expression with cell-type and spatial resolution, and reveal how the brain integrates molecular and cellular complexity to serve function.
148
Citation4
0
Save
32

Divergent sensory and immune gene evolution in sea turtles with contrasting demographic and life histories

Blair Bentley et al.Jan 12, 2022
Abstract Sea turtles represent an ancient lineage of marine vertebrates that evolved from terrestrial ancestors over 100 MYA, yet the genomic basis of the unique physiological and ecological traits enabling these species to thrive in diverse marine habitats remains largely unknown. Additionally, many populations have drastically declined due to anthropogenic activities over the past two centuries, and their recovery is a high global conservation priority. We generated and analyzed high-quality reference genomes for the leatherback (Dermochelys coriacea) and green (Chelonia mydas) turtles, representing the two extant sea turtle families. These genomes are highly syntenic and homologous, but localized regions of non-collinearity were associated with higher copy numbers of immune, zinc-finger, and olfactory receptor (OR) genes in green turtles, with ORs related to waterborne odorants greatly expanded in green turtles. Our findings suggest that divergent evolution of these key gene families may underlie immunological and sensory adaptations assisting navigation, occupancy of neritic versus pelagic environments, and diet specialization. Reduced collinearity was especially prevalent in microchromosomes, with greater gene content, heterozygosity, and genetic distances between species, supporting their critical role in vertebrate evolutionary adaptation. Finally, diversity and demographic histories starkly contrasted between species, indicating that leatherback turtles have had a low yet stable effective population size, exhibit extremely low diversity compared to other reptiles, and harbor a higher genetic load compared to green turtles, reinforcing concern over their persistence under future climate scenarios. These genomes provide invaluable resources for advancing our understanding of evolution and conservation best practices in an imperiled vertebrate lineage. Statement of significance Sea turtle populations have undergone recent global declines. We analyzed de novo assembled genomes for both extant sea turtle families through the Vertebrate Genomes Project to inform their conservation and evolutionary biology. These highly conserved genomes were differentiated by localized gene-rich regions of divergence, particularly within microchromosomes, suggesting that these genomic elements play key functional roles in the evolution of sea turtles and possibly other vertebrates. We further demonstrate that dissimilar evolutionary histories impact standing genomic diversity and genetic load, and are critical to consider when using these metrics to assess adaptive potential and extinction risk. Our results also demonstrate how reference genome quality impacts inferences of comparative and conservation genomics analyses that need to be considered in their application.
32
Citation4
0
Save
14

Convergent gene expression highlights shared vocal motor microcircuitry in songbirds and humans

Gregory Gedman et al.Jul 2, 2022
Abstract Vocal learning is a skilled motor behavior observed in several mammalian and avian species and is critical for human speech. While convergent gene expression patterns have highlighted similar primary motor and striatal pathways for vocal imitation in songbirds and humans, the extent of molecular and circuit convergence remains unresolved. Here we profiled the four principal song nuclei of the zebra finch (HVC, LMAN, RA, Area X) and their surrounding brain regions using RNA-Seq and compared them with specialized markers we identified for human speech brain regions. Expanding previous work, both songbird RA and HVC exhibited convergent specialized gene expression of ∼350 genes with human laryngeal sensorimotor cortex. The songbird HVC RA intratelencephalic (IT) neurons were the predominant cell type that was convergent with human, specifically layer 2/3 IT neurons, while the songbird RA extratelencephalic (ET) projection neurons exhibited convergent expression with human layer 5 ET projection neurons. The molecular specializations of both songbird LMAN and human Broca’s area were more unique to each species. These findings demonstrate the extent of convergent molecular specializations in distantly related species for vocal imitation and emphasize important evolutionary constraints for this complex trait. One-Sentence Summary Our data provide hundreds of candidate genes to study the molecular basis and evolution of song and speech across species.
14
Citation3
0
Save
0

As above, so below: Whole transcriptome profiling supports the continuum hypothesis of avian dorsal and ventral pallium organization

Gregory Gedman et al.Nov 13, 2020
Abstract Over the last two decades, beginning with the Avian Brain Nomenclature Forum in 2000, major revisions have been made to our understanding of the organization and nomenclature of the avian brain. However, there are still unresolved questions on avian pallial organization, particularly whether the cells above the ventricle represent different populations to those below it. Concerns included limited number of genes profiled, biased selection of genes, and potential independent origins of cell types in different parts of the brain. Here we test two competing hypotheses, using RNA sequencing to profile the transcriptomes of the major avian pallial subdivisions dorsal and ventral to the ventricle boundary, and a new zebra finch genome assembly containing about 22,000 annotated, complete genes. We found that the transcriptomes of neural populations below and above the ventricle were remarkably similar. What had been previously named hyperpallium densocellulare above the ventricle had nearly the same molecular profile as the mesopallium below it; the hyperpallium apicale above was highly similar to the nidopallium below; the primary sensory intercalated hyperpallium apicale above was most similar to the sensory population below, although more divergent than the other populations were to each other. These shared population expression profiles define unique functional specializations in anatomical structure development, synaptic transmission, signaling, and neurogenesis. These findings support the continuum hypothesis of avian brain subdivisions above and below the ventricle space, with the pallium as a whole consisting of four major cell populations instead of seven and has some profound implications for our understanding of vertebrate brain evolution.
0
Citation1
0
Save
Load More