AL
Aaron Liston
Author with expertise in RNA Sequencing Data Analysis
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
13
(62% Open Access)
Cited by:
3,920
h-index:
56
/
i10-index:
116
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

The genome of woodland strawberry (Fragaria vesca)

Vladimir Shulaev et al.Dec 26, 2010
+68
R
D
V
The International Strawberry Sequencing Consortium reports the draft genome of the woodland strawberry (Fragaria vesca). The genome of this diploid species should serve as a reference genome for the Fragaria genus, as the cultivated strawberry (Fragaria × ananassa) is an octoploid where F. vesca is predicted to be a subgenome donor. The woodland strawberry, Fragaria vesca (2n = 2x = 14), is a versatile experimental plant system. This diminutive herbaceous perennial has a small genome (240 Mb), is amenable to genetic transformation and shares substantial sequence identity with the cultivated strawberry (Fragaria × ananassa) and other economically important rosaceous plants. Here we report the draft F. vesca genome, which was sequenced to ×39 coverage using second-generation technology, assembled de novo and then anchored to the genetic linkage map into seven pseudochromosomes. This diploid strawberry sequence lacks the large genome duplications seen in other rosids. Gene prediction modeling identified 34,809 genes, with most being supported by transcriptome mapping. Genes critical to valuable horticultural traits including flavor, nutritional value and flowering time were identified. Macrosyntenic relationships between Fragaria and Prunus predict a hypothetical ancestral Rosaceae genome that had nine chromosomes. New phylogenetic analysis of 154 protein-coding genes suggests that assignment of Populus to Malvidae, rather than Fabidae, is warranted.
0
Citation1,123
0
Save
0

The genome of Eucalyptus grandis

Alexander Myburg et al.Jun 11, 2014
+77
G
D
A
Eucalypts are the world’s most widely planted hardwood trees. Their outstanding diversity, adaptability and growth have made them a global renewable resource of fibre and energy. We sequenced and assembled >94% of the 640-megabase genome of Eucalyptus grandis. Of 36,376 predicted protein-coding genes, 34% occur in tandem duplications, the largest proportion thus far in plant genomes. Eucalyptus also shows the highest diversity of genes for specialized metabolites such as terpenes that act as chemical defence and provide unique pharmaceutical oils. Genome sequencing of the E. grandis sister species E. globulus and a set of inbred E. grandis tree genomes reveals dynamic genome evolution and hotspots of inbreeding depression. The E. grandis genome is the first reference for the eudicot order Myrtales and is placed here sister to the eurosids. This resource expands our understanding of the unique biology of large woody perennials and provides a powerful tool to accelerate comparative biology, breeding and biotechnology. The Eucalyptus grandis genome has been sequenced, revealing the greatest number of tandem duplications of any plant genome sequenced so far, and the highest diversity of genes for specialized metabolites that act as chemical defence and provide unique pharmaceutical oils; genome sequencing of the sister species E. globulus and a set of inbred E. grandis tree genomes reveals dynamic genome evolution and hotspots of inbreeding depression. Fast-growing Eucalyptus trees form the basis of an international pulp, paper and chemical cellulose industry and they are also seen as potential biomass feedstocks for bioenergy and biomaterials. The genome of Eucalyptus grandis has now been sequenced. It contains the greatest number of tandem duplications so far found in a plant genome, as well as the highest diversity of genes for specialized metabolites that act as chemical defence and provide unique pharmaceutical oils. Comparison with the sister species E. globulus and with other E. grandis lines reveals dynamic genome evolution and hotspots of inbreeding depression. The availability of comprehensive genomic data will be of use in work on accelerating breeding cycles for productivity and wood quality and developing eucalypt strains suited to a variety of habitats.
0
Citation799
0
Save
0

Navigating the tip of the genomic iceberg: Next‐generation sequencing for plant systematics

Shannon Straub et al.Dec 16, 2011
+3
K
M
S
• Premise of the study: Just as Sanger sequencing did more than 20 years ago, next‐generation sequencing (NGS) is poised to revolutionize plant systematics. By combining multiplexing approaches with NGS throughput, systematists may no longer need to choose between more taxa or more characters. Here we describe a genome skimming (shallow sequencing) approach for plant systematics. • Methods: Through simulations, we evaluated optimal sequencing depth and performance of single‐end and paired‐end short read sequences for assembly of nuclear ribosomal DNA (rDNA) and plastomes and addressed the effect of divergence on reference‐guided plastome assembly. We also used simulations to identify potential phylogenetic markers from low‐copy nuclear loci at different sequencing depths. We demonstrated the utility of genome skimming through phylogenetic analysis of the Sonoran Desert clade (SDC) of Asclepias (Apocynaceae). • Key results: Paired‐end reads performed better than single‐end reads. Minimum sequencing depths for high quality rDNA and plastome assemblies were 40× and 30×, respectively. Divergence from the reference significantly affected plastome assembly, but relatively similar references are available for most seed plants. Deeper rDNA sequencing is necessary to characterize intragenomic polymorphism. The low‐copy fraction of the nuclear genome was readily surveyed, even at low sequencing depths. Nearly 160000 bp of sequence from three organelles provided evidence of phylogenetic incongruence in the SDC. • Conclusions: Adoption of NGS will facilitate progress in plant systematics, as whole plastome and rDNA cistrons, partial mitochondrial genomes, and low‐copy nuclear markers can now be efficiently obtained for molecular phylogenetics studies.
0
Citation611
0
Save
0

Multiplex sequencing of plant chloroplast genomes using Solexa sequencing-by-synthesis technology

Richard Cronn et al.Aug 27, 2008
+3
M
A
R
Organellar DNA sequences are widely used in evolutionary and population genetic studies, however, the conservative nature of chloroplast gene and genome evolution often limits phylogenetic resolution and statistical power. To gain maximal access to the historical record contained within chloroplast genomes, we have adapted multiplex sequencing-by-synthesis (MSBS) to simultaneously sequence multiple genomes using the Illumina Genome Analyzer. We PCR-amplified ∼120 kb plastomes from eight species (seven Pinus , one Picea ) in 35 reactions. Pooled products were ligated to modified adapters that included 3 bp indexing tags and samples were multiplexed at four genomes per lane. Tagged microreads were assembled by de novo and reference-guided assembly methods, using previously published Pinus plastomes as surrogate references. Assemblies for these eight genomes are estimated at 88–94% complete, with an average sequence depth of 55× to 186×. Mononucleotide repeats interrupt contig assembly with increasing repeat length, and we estimate that the limit for their assembly is 16 bp. Comparisons to 37 kb of Sanger sequence show a validated error rate of 0.056%, and conspicuous errors are evident from the assembly process. This efficient sequencing approach yields high-quality draft genomes and should have immediate applicability to genomes with comparable complexity.
0
Citation515
0
Save
0

Phylogeny and classification of Pinus

David Gernandt et al.Feb 1, 2005
A
G
S
D
Abstract We used chloroplast DNA sequences from matK and rbcL to infer the phylogeny for 101 of the approximately 111 species of Pinus (Pinaceae). At the level of subsection and above, the cpDNA tree is congruent with phylogenies based on nuclear DNA with one notable exception: cpDNA sequences from subsect. Contortae are sister to all other North American hard pines rather than occupying a more derived position in the same clade. We used the cpDNA tree plus evidence from nuclear ribosomal DNA and morphology to propose a new classification for the genus. The molecular phylogenies are symmetrical at the deepest branches of the genus, allowing for the delineation of two subgenera, each with two sections that form sister groups. Within sections, clades were slightly asymmetric and sometimes ambiguously resolved. To accomodate ambiguity in some interrelationships, avoid the creation of new ranks, and retain traditional names, we recognised up to three monophyletic subsections per section. Subgenus Pinus (the diploxylon, or hard pines) is divided into the predominantly Eurasian and Mediterranean section Pinus , composed of subsections Pinus and Pinaster , and the strictly North American section Trifoliae , composed of subsections Australes , Ponderosae , and Contortae . Subgenus Strobus (the haploxylon, or soft pines) is divided into the strictly North American section Parrya , composed of subsections Cembroides , Nelsoniae , and Balfourianae , and the Eurasian and North American section Quinquefoliae , composed of subsections Gerardianae , Krempfianae , and Strobus . Mapping of ten morphological and distributional characters indicates that two were diagnostic for infrageneric taxa: the number of vascular bundles per leaf distinguishes subgenus Pinus from subgenus Strobus , and a terminal­positioned umbo on the ovulate cone scale is diagnostic of subsect. Strobus .
0

Hyb‐Seq: Combining target enrichment and genome skimming for plant phylogenomics

Kevin Weitemier et al.Aug 29, 2014
+4
R
S
K
Hyb-Seq, the combination of target enrichment and genome skimming, allows simultaneous data collection for low-copy nuclear genes and high-copy genomic targets for plant systematics and evolution studies. •Genome and transcriptome assemblies for milkweed (Asclepias syriaca) were used to design enrichment probes for 3385 exons from 768 genes (>1.6 Mbp) followed by Illumina sequencing of enriched libraries. Hyb-Seq of 12 individuals (10 Asclepias species and two related genera) resulted in at least partial assembly of 92.6% of exons and 99.7% of genes and an average assembly length >2 Mbp. Importantly, complete plastomes and nuclear ribosomal DNA cistrons were assembled using off-target reads. Phylogenomic analyses demonstrated signal conflict between genomes. •The Hyb-Seq approach enables targeted sequencing of thousands of low-copy nuclear exons and flanking regions, as well as genome skimming of high-copy repeats and organellar genomes, to efficiently produce genome-scale data sets for phylogenomics.
0
Citation404
0
Save
0

Repeated translocation of a gene cassette drives sex chromosome turnover in strawberries

Jacob Tennessen et al.Jul 15, 2017
+3
S
N
J
Abstract Turnovers of sex-determining systems represent important diversifying forces across eukaryotes. Shifts in sex chromosomes, but conservation of the master sex-determining genes, characterize distantly-related animal lineages. Yet in plants, where separate sexes have evolved repeatedly and sex chromosomes are typically homomorphic, we do not know whether such translocations drive turnovers within closely related groups. This phenomenon can only be demonstrated by identifying sex-associated nucleotide sequences, still largely unknown in plants. The wild North American octoploid strawberries ( Fragaria ) exhibit separate sexes (dioecy) with homomorphic, female heterogametic (ZW) inheritance, yet sex maps to at least three different chromosomes. To characterize these turnovers, we sequenced the complete genomes of 60 plants of known sex from five Fragaria taxa. We identified 31-mers unique to females and assembled their reads into contigs. Remarkably, a short (13 kb) sequence is observed in nearly all females and never in male-fertile individuals, implicating it as the sex-determining region (SDR). This female-specific “SDR cassette” contains both a gene with a known role in fruit and pollen production and a novel retrogene absent on Z and autosomal chromosomes. Comparing SDR cassettes across taxa reveals a history of repeated translocation, which can be ordered temporally due to the capture of adjacent sequence with each successive move. The accumulation of these “souvenirs” suggests an adaptive basis for the expanding (up to at least 23 kb) hemizygous region. This is the first plant SDR known to be translocated, and it suggests a new mechanism (“move-lock-grow”) for expansion and diversification of incipient sex chromosomes. Significance Statement Sex chromosomes frequently restructure themselves during organismal evolution, often becoming highly differentiated. This dynamic process is poorly understood for most taxa, especially during the early stages typical of many dioecious plants. In wild strawberries, a sex-determining region of DNA has repeatedly changed its genomic location, each time increasing the size of the hemizygous female-specific sequence. This observation shows for the first time that plant sex regions can “jump”, and suggests that this phenomenon may be adaptive by gathering and locking new genes into linkage with sex. This conserved and presumed causal sequence with a variable genomic location presents a unique opportunity to understand how sex chromosomes first begin to differentiate.
0
Citation12
0
Save
1

Analysis of paralogs in target enrichment data pinpoints multiple ancient polyploidy events inAlchemillas.l. (Rosaceae)

Diego Morales‐Briones et al.Aug 23, 2020
+5
C
B
D
Abstract Target enrichment is becoming increasingly popular for phylogenomic studies. Although baits for enrichment are typically designed to target single-copy genes, paralogs are often recovered with increased sequencing depth, sometimes from a significant proportion of loci, especially in groups experiencing whole-genome duplication (WGD) events. Common approaches for processing paralogs in target enrichment datasets include random selection, manual pruning, and mainly, the removal of entire genes that show any evidence of paralogy. These approaches are prone to errors in orthology inference or removing large numbers of genes. By removing entire genes, valuable information that could be used to detect and place WGD events is discarded. Here we use an automated approach for orthology inference in a target enrichment dataset of 68 species of Alchemilla s.l. (Rosaceae), a widely distributed clade of plants primarily from temperate climate regions. Previous molecular phylogenetic studies and chromosome numbers both suggested ancient WGDs in the group. However, both the phylogenetic location and putative parental lineages of these WGD events remain unknown. By taking paralogs into consideration, we identified four nodes in the backbone of Alchemilla s.l. with an elevated proportion of gene duplication. Furthermore, using a gene-tree reconciliation approach we established the autopolyploid origin of the entire Alchemilla s.l. and the nested allopolyploid origin of four major clades within the group. Here we showed the utility of automated tree-based orthology inference methods, previously designed for genomic or transcriptomic datasets, to study complex scenarios of polyploidy and reticulate evolution from target enrichment datasets.
1
Citation4
0
Save
0

Both functional trait divergence and trait plasticity confer polyploid advantage in changing environments

Na Wei et al.Mar 2, 2018
T
A
R
N
Polyploidy, or whole genome duplication, exists in all eukaryotes and is thought to drive ecological and evolutionary success especially in plants. The mechanisms of polyploid success in ecologically relevant contexts, however, remain largely unknown. Here we conducted an extensive test of functional trait divergence and trait plasticity in conferring polyploid fitness advantage in changing environments by growing clonal replicates of a worldwide genotype collection of six polyploid and five diploid wild strawberry (Fragaria) species in three climatically different common gardens. Among leaf functional traits, we detected divergence in means but not plasticities between polyploids and diploids, suggesting that increased genomic redundancy does not necessarily translate into broader phenotypic amplitude in polyploids. Across the heterogeneous garden environments, however, polyploids exhibited fitness advantage, which was conferred by both trait means and adaptive trait plasticities, supporting a 'jack-and-master' hypothesis for polyploids. Our findings provide unparalleled insight into the prevalence and persistence of polyploidization.
0

Revisiting the Origin of the Octoploid Strawberry

Aaron Liston et al.Jun 11, 2019
+3
J
N
A
The cultivated strawberry, Fragaria ×ananassa , originated in France approximately 270 years ago via hybridization between two wild species introduced from North and South America. Both the cultivated strawberry and its parental species are octoploids with 2 n =8 x =56 chromosomes. In the recent publication of the genome of the cultivated strawberry, the authors present a novel phylogenetic hypothesis, proposing that each of the four subgenomes originated from a different 2 n =2 x =14 diploid progenitor. They further suggest that the hexaploid species Fragaria moschata was a direct ancestor of the strawberries. We reanalyzed the four octoploid subgenomes in a phylogenomic context, and found that only two extant diploids were progenitors, a result that is consistent with several previous studies. We also conducted a phylogenetic analysis of genetic linkage-mapped loci in the hexaploid F. moschata , and resolved its origin as independent of the octoploids. We identified assumptions in their tree-searching algorithm that prevented it from accepting extinct or unsampled progenitors, and we argue that this is a critical weakness of their approach. Correctly identifying their diploid progenitors is important for understanding and predicting the responses of polyploid plants to climate change and associated environmental stress.
Load More