JM
Jacquelyn Mountcastle
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
16
(100% Open Access)
Cited by:
2,468
h-index:
17
/
i10-index:
23
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
13

Towards complete and error-free genome assemblies of all vertebrate species

Arang Rhie et al.Apr 28, 2021
Abstract High-quality and complete reference genome assemblies are fundamental for the application of genomics to biology, disease, and biodiversity conservation. However, such assemblies are available for only a few non-microbial species 1–4 . To address this issue, the international Genome 10K (G10K) consortium 5,6 has worked over a five-year period to evaluate and develop cost-effective methods for assembling highly accurate and nearly complete reference genomes. Here we present lessons learned from generating assemblies for 16 species that represent six major vertebrate lineages. We confirm that long-read sequencing technologies are essential for maximizing genome quality, and that unresolved complex repeats and haplotype heterozygosity are major sources of assembly error when not handled correctly. Our assemblies correct substantial errors, add missing sequence in some of the best historical reference genomes, and reveal biological discoveries. These include the identification of many false gene duplications, increases in gene sizes, chromosome rearrangements that are specific to lineages, a repeated independent chromosome breakpoint in bat genomes, and a canonical GC-rich pattern in protein-coding genes and their regulatory regions. Adopting these lessons, we have embarked on the Vertebrate Genomes Project (VGP), an international effort to generate high-quality, complete reference genomes for all of the roughly 70,000 extant vertebrate species and to help to enable a new era of discovery across the life sciences.
13
Citation1,568
0
Save
1

Pangenome graph construction from genome alignments with Minigraph-Cactus

Glenn Hickey et al.May 10, 2023
Pangenome references address biases of reference genomes by storing a representative set of diverse haplotypes and their alignment, usually as a graph. Alternate alleles determined by variant callers can be used to construct pangenome graphs, but advances in long-read sequencing are leading to widely available, high-quality phased assemblies. Constructing a pangenome graph directly from assemblies, as opposed to variant calls, leverages the graph’s ability to represent variation at different scales. Here we present the Minigraph-Cactus pangenome pipeline, which creates pangenomes directly from whole-genome alignments, and demonstrate its ability to scale to 90 human haplotypes from the Human Pangenome Reference Consortium. The method builds graphs containing all forms of genetic variation while allowing use of current mapping and genotyping tools. We measure the effect of the quality and completeness of reference genomes used for analysis within the pangenomes and show that using the CHM13 reference from the Telomere-to-Telomere Consortium improves the accuracy of our methods. We also demonstrate construction of a Drosophila melanogaster pangenome. Constructing genome graphs directly from genome assemblies overcomes single-reference bias.
1
Citation61
0
Save
0

Distinct patterns of genetic variation at low-recombining genomic regions represent haplotype structure

Jun Ishigohoka et al.Dec 23, 2021
Abstract Genetic variation of the entire genome represents population structure, yet individual loci can show distinct patterns. Such deviations identified through genome scans have often been attributed to effects of selective factors instead of randomness, assuming that the genomic intervals are long enough to average out randomness in underlying genealogies. However, an alternative explanation to distinct patterns has not been fully addressed: too few genealogies to average out the effect of randomness. Specifically, distinct patterns of genetic variation may be due to reduced local recombination rate, since the number of genealogies in a genomic interval corresponds to the number of ancestral recombination events. Here, we associate distinct patterns of local genetic variation with reduced recombination rate in a songbird, the Eurasian blackcap, using genome sequences and recombination maps. We find that distinct patterns of local genetic variation represent haplotype structure at low-recombining regions present either in all populations or only in a few populations. At the former species-wide low- recombining regions, genetic variation depicts conspicuous haplotypes segregating in multiple populations. On the contrary, at the latter population-specific low-recombining regions, genetic variation primarily represents cryptic haplotype structure among individuals of the low-recombining populations. With simulations, we confirm that reduction in recombination rate alone can cause distinct patterns of genetic variation mirroring our empirical data. Our results highlight that distinct patterns of genetic variation can emerge through evolution of reduced local recombination rate. Recombination landscape as an evolvable trait therefore plays an important role determining the heterogeneous distribution of genetic variation along the genome.
0
Citation8
0
Save
0

Reference genome and demographic history of the most endangered marine mammal, the vaquita

Phillip Morin et al.May 28, 2020
Abstract The vaquita is the most critically endangered marine mammal, with fewer than 19 remaining in the wild. First described in 1958, the vaquita has been in rapid decline resulting from inadvertent deaths due to the increasing use of large-mesh gillnets for more than 20 years. To understand the evolutionary and demographic history of the vaquita, we used combined long-read sequencing and long-range scaffolding methods with long- and short-read RNA sequencing to generate a near error-free annotated reference genome assembly from cell lines derived from a female individual. The genome assembly consists of 99.92% of the assembled sequence contained in 21 nearly gapless chromosome-length autosome scaffolds and the X-chromosome scaffold, with a scaffold N50 of 115 Mb. Genome-wide heterozygosity is the lowest (0.01%) of any mammalian species analyzed to date, but heterozygosity is evenly distributed across the chromosomes, consistent with long-term small population size at genetic equilibrium, rather than low diversity resulting from a recent population bottleneck or inbreeding. Historical demography of the vaquita indicates long-term population stability at less than 5000 ( Ne ) for over 200,000 years. Together, these analyses indicate that the vaquita genome has had ample opportunity to purge highly deleterious alleles and potentially maintain diversity necessary for population health.
0
Citation7
0
Save
32

Divergent sensory and immune gene evolution in sea turtles with contrasting demographic and life histories

Blair Bentley et al.Jan 12, 2022
Abstract Sea turtles represent an ancient lineage of marine vertebrates that evolved from terrestrial ancestors over 100 MYA, yet the genomic basis of the unique physiological and ecological traits enabling these species to thrive in diverse marine habitats remains largely unknown. Additionally, many populations have drastically declined due to anthropogenic activities over the past two centuries, and their recovery is a high global conservation priority. We generated and analyzed high-quality reference genomes for the leatherback (Dermochelys coriacea) and green (Chelonia mydas) turtles, representing the two extant sea turtle families. These genomes are highly syntenic and homologous, but localized regions of non-collinearity were associated with higher copy numbers of immune, zinc-finger, and olfactory receptor (OR) genes in green turtles, with ORs related to waterborne odorants greatly expanded in green turtles. Our findings suggest that divergent evolution of these key gene families may underlie immunological and sensory adaptations assisting navigation, occupancy of neritic versus pelagic environments, and diet specialization. Reduced collinearity was especially prevalent in microchromosomes, with greater gene content, heterozygosity, and genetic distances between species, supporting their critical role in vertebrate evolutionary adaptation. Finally, diversity and demographic histories starkly contrasted between species, indicating that leatherback turtles have had a low yet stable effective population size, exhibit extremely low diversity compared to other reptiles, and harbor a higher genetic load compared to green turtles, reinforcing concern over their persistence under future climate scenarios. These genomes provide invaluable resources for advancing our understanding of evolution and conservation best practices in an imperiled vertebrate lineage. Statement of significance Sea turtle populations have undergone recent global declines. We analyzed de novo assembled genomes for both extant sea turtle families through the Vertebrate Genomes Project to inform their conservation and evolutionary biology. These highly conserved genomes were differentiated by localized gene-rich regions of divergence, particularly within microchromosomes, suggesting that these genomic elements play key functional roles in the evolution of sea turtles and possibly other vertebrates. We further demonstrate that dissimilar evolutionary histories impact standing genomic diversity and genetic load, and are critical to consider when using these metrics to assess adaptive potential and extinction risk. Our results also demonstrate how reference genome quality impacts inferences of comparative and conservation genomics analyses that need to be considered in their application.
32
Citation4
0
Save
0

Ecological diversification of sea catfishes is accompanied by genome-wide signatures of positive selection

Melissa Rincon‐Sandoval et al.Nov 20, 2024
Abstract Habitat transitions have shaped the evolutionary trajectory of many clades. Sea catfishes (Ariidae) have repeatedly undergone ecological transitions, including colonizing freshwaters from marine environments, leading to an adaptive radiation in Australia and New Guinea alongside non-radiating freshwater lineages elsewhere. Here, we generate and analyze one long-read reference genome and 66 short-read whole genome assemblies, in conjunction with genomic data for 54 additional species. We investigate how three major ecological transitions have shaped genomic variation among ariids over their ~ 50 million-year evolutionary history. Our results show that relatively younger freshwater lineages exhibit a higher incidence of positive selection than their more ancient marine counterparts. They also display a larger disparity in body shapes, a trend that correlates with a heightened occurrence of positive selection on genes associated with body size and elongation. Although positive selection in the Australia and New Guinea radiation does not stand out compared to non-radiating lineages overall, selection across the prolactin gene family during the marine-to-freshwater transition suggests that strong osmoregulatory adaptations may have facilitated their colonization and radiation. Our findings underscore the significant role of selection in shaping the genome and organismal traits in response to habitat shifts across macroevolutionary scales.
0
Citation1
0
Save
Load More