AY
Alan Yocca
Author with expertise in Molecular Mechanisms of Pollen Development and Function
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
14
(71% Open Access)
Cited by:
565
h-index:
14
/
i10-index:
16
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Origin and evolution of the octoploid strawberry genome

Patrick Edger et al.Feb 25, 2019
+26
R
T
P
Cultivated strawberry emerged from the hybridization of two wild octoploid species, both descendants from the merger of four diploid progenitor species into a single nucleus more than 1 million years ago. Here we report a near-complete chromosome-scale assembly for cultivated octoploid strawberry (Fragaria × ananassa) and uncovered the origin and evolutionary processes that shaped this complex allopolyploid. We identified the extant relatives of each diploid progenitor species and provide support for the North American origin of octoploid strawberry. We examined the dynamics among the four subgenomes in octoploid strawberry and uncovered the presence of a single dominant subgenome with significantly greater gene content, gene expression abundance, and biased exchanges between homoeologous chromosomes, as compared with the other subgenomes. Pathway analysis showed that certain metabolomic and disease-resistance traits are largely controlled by the dominant subgenome. These findings and the reference genome should serve as a powerful platform for future evolutionary studies and enable molecular breeding in strawberry. Chromosome-scale assembly for the cultivated octoploid strawberry (Fragaria × ananassa) uncovers the origin and evolutionary processes that shaped this complex allopolyploid, providing a useful resource for genome-wide analyses and molecular breeding.
0
Citation536
0
Save
26

Blueprint for Phasing and Assembling the Genomes of Heterozygous Polyploids: Application to the Octoploid Genome of Strawberry

Michael Hardigan et al.Nov 4, 2021
+15
D
M
M
The challenge of allelic diversity for assembling haplotypes is exemplified in polyploid genomes containing homoeologous chromosomes of identical ancestry, and significant homologous variation within their ancestral subgenomes. Cultivated strawberry ( Fragaria × ananassa ) and its wild progenitors are outbred octoploids (2n = 8x = 56) in which up to eight homologous and homoeologous alleles are preserved. This introduces significant risk of haplotype collapse, switching, and chimeric fusions during assembly. Using third generation HiFi sequences from PacBio, we assembled the genome of the day-neutral octoploid F. × ananassa hybrid ‘Royal Royce’ from the University of California. Our goal was to produce subgenome-and haplotype-resolved assemblies of all 56 chromosomes, accurately reconstructing the parental haploid chromosome complements. Previous work has demonstrated that partitioning sequences by parental phase supports direct assembly of haplotypes in heterozygous diploid species. We leveraged the accuracy of HiFi sequence data with pedigree-informed sequencing to partition long read sequences by phase, and reduce the downstream risk of subgenomic chimeras during assembly. We were able to utilize an octoploid strawberry recombination breakpoint map containing 3.6 M variants to identify and break chimeric junctions, and perform scaffolding of the phase-1 and phase-2 octoploid assemblies. The N50 contiguity of the phase-1 and phase-2 assemblies prior to scaffolding and gap-filling was 11 Mb. The final haploid assembly represented seven of 28 chromosomes in a single contiguous sequence, and averaged fewer than three gaps per pseudomolecule. Additionally, we re-annotated the octoploid genome to produce a custom F. × ananassa repeat library and improved set of gene models based on IsoSeq transcript data and an expansive RNA-seq expression atlas. Here we present ‘FaRR1’, a gold-standard reference genome of F. × ananassa cultivar ‘Royal Royce’ to assist future genomic research and molecular breeding of allo-octoploid strawberry.
26
Citation26
0
Save
18

Blueberry and cranberry pangenomes as a resource for future genetic studies and breeding efforts

Alan Yocca et al.Aug 2, 2023
+23
A
P
A
Abstract Domestication of cranberry and blueberry began in the United States in the early 1800s and 1900s, respectively, and in part owing to their flavors and health-promoting benefits are now cultivated and consumed worldwide. The industry continues to face a wide variety of production challenges (e.g. disease pressures) as well as a demand for higher-yielding cultivars with improved fruit quality characteristics. Unfortunately, molecular tools to help guide breeding efforts for these species have been relatively limited compared with those for other high-value crops. Here, we describe the construction and analysis of the first pangenome for both blueberry and cranberry. Our analysis of these pangenomes revealed both crops exhibit great genetic diversity, including the presence-absence variation of 48.4% genes in highbush blueberry and 47.0% genes in cranberry. Auxiliary genes, those not shared by all cultivars, are significantly enriched with molecular functions associated with disease resistance and the biosynthesis of specialized metabolites, including compounds previously associated with improving fruit quality traits. The discovery of thousands of genes, not present in the previous reference genomes for blueberry and cranberry, will serve as the basis of future research and as potential targets for future breeding efforts. The pangenome, as a multiple-sequence alignment, as well as individual annotated genomes, are publicly available for analysis on the Genome Database for Vaccinium - a curated and integrated web-based relational database. Lastly, the core-gene predictions from the pangenomes will serve useful to develop a community genotyping platform to guide future molecular breeding efforts across the family.
18
Citation1
0
Save
1

Machine learning approaches to identify core and dispensable genes in pangenomes

Alan Yocca et al.Mar 22, 2021
P
A
Abstract A gene in a given taxonomic group is either present in every individual (core), or absent in at least a single individual (dispensable). Previous pangenomic studies have identified certain functional differences between core and dispensable genes. However, identifying if a gene belongs to the core or dispensable portion of the genome requires the construction of a pangenome, which involves sequencing the genomes of many individuals. Here we aim to leverage the previously characterized core and dispensable gene content for two grass species ( Brachypodium distachyon and Oryza sativa ) to construct a machine learning model capable of accurately classifying genes as core or dispensable using only a single annotated reference genome. Such a model may mitigate the need for pangenome construction, an expensive hurdle especially in orphan crops which often lack the adequate genomic resources.
1
Citation1
0
Save
0

A Phased, Chromosome-scale Genome for Malus domestica 'WA 38'

Huiting Zhang et al.Jan 11, 2024
+14
I
A
H
Genome sequencing for agriculturally important Rosaceous crops has made rapid progress both in completeness and annotation quality. Whole genome sequence and annotation gives breeders, researchers, and growers information about cultivar specific traits such as fruit quality, disease resistance, and informs strategies to enhance postharvest storage. Here we present a haplotype-phased, chromosomal level, genome of Malus domestica, 'WA 38', a new cultivar of apple released to market in 2017 as Cosmic Crisp ®. Using both short and long read sequencing data and a k-mer based approach, chromosomes originating from each parent were assembled and segregated. This is the first haplotype-resolved assembly in pome fruit genomes, a milestone in the new genomic era. The two haplome assemblies, 'Honeycrisp' originated HapA and 'Enterprise' originated HapB, are about 650 Megabases each, and both have a BUSCO score of 98.7% complete. A total of 53,028 and 54,235 genes were annotated from HapA and HapB, respectively. Additionally, we provide genome-scale comparisons to 'Gala', 'Honeycrisp', and other relevant cultivars highlighting major differences in genome structure and gene family circumscription. This assembly and annotation was done in collaboration with the American Campus Tree Genomes project that included 'WA 38' (Washington State University), 'd'Anjou' pear (Auburn University), and many more. To ensure transparency, reproducibility, and applicability for any genome project, our genome assembly and annotation workflow is recorded in detail and shared under a public GitLab repository. All software is containerized, offering a simple implementation of the workflow.
0
Citation1
0
Save
0

Disease Resistance Genetics and Genomics in Octoploid Strawberry

Christopher Barbey et al.May 23, 2019
+6
S
S
C
Octoploid strawberry ( Fragaria × ananassa ) is a valuable specialty crop, but profitable production and availability are threatened by many pathogens. Efforts to identify and introgress useful disease resistance genes (R-genes) in breeding programs are complicated by strawberry’s complex octoploid genome. Recently-developed resources in strawberry, including a complete octoploid reference genome and high-resolution octoploid genotyping, enable new analyses in strawberry disease resistance genetics. This study characterizes the complete R-gene collection in the genomes of commercial octoploid strawberry and two diploid ancestral relatives, and introduces several new technological and data resources for strawberry disease resistance research. These include octoploid R-gene transcription profiling, d N/ d S analysis, eQTL analysis and RenSeq analysis in cultivars. Octoploid fruit transcript expression quantitative trait loci (eQTL) were identified for 77 putative R-genes. R-genes from the ancestral diploids Fragaria vesca and Fragaria iinumae were compared, revealing differential inheritance and retention of various octoploid R-gene subtypes. The mode and magnitude of natural selection of individual F. × ananassa R-genes was also determined via d N/ d S analysis. R-gene sequencing using enriched libraries (RenSeq) has been used recently for R-gene discovery in many crops, however this technique somewhat relies upon a priori knowledge of desired sequences. An octoploid strawberry capture-probe panel, derived from the results of this study, is validated in a RenSeq experiment and is presented for community use. These results give unprecedented insight into crop disease resistance genetics, and represent an advance towards exploiting variation for strawberry cultivar improvement.
0

Evolution of conserved noncoding sequences in Arabidopsis thaliana

Alan Yocca et al.Aug 6, 2019
+2
R
Z
A
Recent pangenome studies have revealed a large fraction of the gene content within a species exhibits presence-absence variation (PAV). However, coding regions alone provide an incomplete assessment of functional genomic sequence variation at the species level. Little to no attention has been paid to noncoding regulatory regions in pangenome studies, though these sequences directly modulate gene expression and phenotype. To uncover regulatory genetic variation, we generated chromosome-scale genome assemblies for thirty Arabidopsis thaliana accessions from multiple distinct habitats and characterized species level variation in Conserved Noncoding Sequences (CNS). Our analyses uncovered not only evidence for PAV and positional variation (PosV) but that diversity in CNS is non-random, with variants shared across different accessions. Using evolutionary analyses and chromatin accessibility data, we provide further evidence supporting roles for conserved and variable CNS in gene regulation. Characterizing species-level diversity in all functional genomic sequences may later uncover previously unknown mechanistic links between genotype and phenotype.
0

Exceptional subgenome stability and functional divergence in allotetraploid teff, the primary cereal crop in Ethiopia

Robert VanBuren et al.Mar 18, 2019
+9
A
J
R
Teff (Eragrostis tef) is a cornerstone of food security in the Horn of Africa, where it is prized for stress resilience, grain nutrition, and market value. Despite its overall importance to small-scale farmers and communities in Africa, teff suffers from low production compared to other cereals because of limited intensive selection and molecular breeding. Here we report a chromosome-scale genome assembly of allotetraploid teff (variety Dabbi) and patterns of subgenome dynamics. The teff genome contains two complete sets of homoeologous chromosomes, with most genes maintained as syntenic gene pairs. Through analyzing the history of transposable element activity, we estimate the teff polyploidy event occurred ~1.1 million years ago (mya) and the two subgenomes diverged ~5.0 mya. Despite this divergence, we detected no large-scale structural rearrangements, homoeologous exchanges, or bias gene loss, contrasting most other allopolyploid plant systems. The exceptional subgenome stability observed in teff may enable the ubiquitous and recurrent polyploidy within Chloridoideae, possibly contributing to the increased resilience and diversification of these grasses. The two teff subgenomes have partitioned their ancestral functions based on divergent expression patterns among homoeologous gene pairs across a diverse expression atlas. The most striking differences in homoeolog expression bias are observed during seed development and under abiotic stress, and thus may be related to agronomic traits. Together these genomic resources will be useful for accelerating breeding efforts of this underutilized grain crop and for acquiring fundamental insights into polyploid genome evolution.
0

Genome of the North American wild apple species Malus angustifolia

Ben Mansfeld et al.Jan 1, 2023
+6
E
S
B
Apple (Malus × domestica Borkh.) production faces many challenges stemming from abiotic and biotic stresses. Abiotic stressors, such as extreme temperatures, droughts, and spring frosts, can lead to diminished yields and tree loss, while biotic stresses like fire blight and pest infestations further reduce tree health and fruit quality. To lessen the threat of these challenges, plant breeders aim to introduce resistance and resilience genes into cultivated varieties. However, high-relatedness among cultivated varieties and breeding lines, coupled with the long juvenility and generation times in apples, hinder the breeding process. The introduction of resistance traits from wild relatives is also constrained by these factors, as well as the lack of genomic resources that could assist in accelerating the introgression process. Herein, we report the assembly and annotation of Malus angustifolia, the Southern Crabapple, one of Eastern North America9s native species. Using a combination of Pacific Biosciences High Fidelity reads, Next-generation short read sequencing, as well as chromatin conformation capture sequencing, we achieve an extremely contiguous haplotype-resolved assembly. We perform comparative haplotypic analyses to identify SNPs and large structural variants, shedding light on the genomic landscape of M. angustifolia. Finally, we explore the phylogenetic and syntenic relationships between Eurasian Malus progenitors and the recently sequenced North American species, contributing valuable insights to the broader understanding of apple evolution and potential breeding strategies.
0

ZW sex chromosome structure in Amborella trichopoda

Sarah Carey et al.May 14, 2024
+20
J
L
S
Sex chromosomes have evolved hundreds of times, and their recent origins in flowering plants can shed light on the early consequences of suppressed recombination. Amborella trichopoda, the sole species on a lineage that is sister to all other extant flowering plants, is dioecious with a young ZW sex determination system. Here we present a haplotype-resolved genome assembly, including highly-contiguous assemblies of the Z and W chromosomes. We identify a ~3-Megabase sex-determination region (SDR) captured in two strata that includes a ~300-Kilobase inversion that is enriched with repetitive sequence and contains a homolog of the Arabidopsis METHYLTHIOADENOSINE NUCLEOSIDASE (MTN1-2) genes, which are known to be involved in fertility. However, the remainder of the SDR does not show patterns typically found in non-recombining SDRs, like repeat accumulation and gene loss. These findings are consistent with the hypothesis that dioecy is recently derived in Amborella and the sex chromosome pair has not significantly degenerated.
Load More