TM
Todd Michael
Author with expertise in RNA Sequencing Data Analysis
Salk Institute for Biological Studies, Salus Klinik, J. Craig Venter Institute
+ 14 more
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
36
(72% Open Access)
Cited by:
36
h-index:
58
/
i10-index:
90
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
100

The genetic and epigenetic landscape of the Arabidopsis centromeres

Matthew Naish et al.Oct 24, 2023
+13
P
M
M
Abstract Centromeres attach chromosomes to spindle microtubules during cell division and, despite this conserved role, show paradoxically rapid evolution and are typified by complex repeats. We used ultra-long-read sequencing to generate the Col-CEN Arabidopsis thaliana genome assembly that resolves all five centromeres. The centromeres consist of megabase-scale tandemly repeated satellite arrays, which support high CENH3 occupancy and are densely DNA methylated, with satellite variants private to each chromosome. CENH3 preferentially occupies satellites with least divergence and greatest higher-order repetition. The centromeres are invaded by ATHILA retrotransposons, which disrupt genetic and epigenetic organization of the centromeres. Crossover recombination is suppressed within the centromeres, yet low levels of meiotic DSBs occur that are regulated by DNA methylation. We propose that Arabidopsis centromeres are evolving via cycles of satellite homogenization and retrotransposon-driven diversification. One-sentence summary Long read sequencing and assembly of the Arabidopsis centromeres reveals their genetic and epigenetic topography.
100
Citation12
0
Save
0

A new Spirodela polyrhiza genome and proteome reveal a conserved chromosomal structure with high abundances of proteins favoring energy production

Alex Harkess et al.May 7, 2020
+8
N
F
A
Abstract Duckweeds are a monophyletic group of rapidly reproducing aquatic monocots in the Lemnaceae family. Spirodela polyrhiza , the Greater Duckweed, has the largest body plan yet the smallest genome size in the family (1C = 150 Mb). Given their clonal, exponentially fast reproduction, a key question is whether genome structure is conserved across the species in the absence of meiotic recombination. We generated a highly contiguous, chromosome-scale assembly of Spirodela polyrhiza line Sp7498 using Oxford Nanopore plus Hi-C scaffolding (Sp7498_HiC) which is highly syntenic with a related line (Sp9509). Both the Sp7498_HiC and Sp9509 genome assemblies reveal large chromosomal misorientations in a recent PacBio assembly of Sp7498, highlighting the necessity of orthogonal long-range scaffolding techniques like Hi-C and BioNano optical mapping. Shotgun proteomics of Sp7498 verified the expression of ∼2,250 proteins and revealed a high abundance of proteins involved in photosynthesis and carbohydrate metabolism among other functions. In addition, a strong increase in chloroplast proteins was observed that correlated to chloroplast density. This Sp7498_HiC genome was generated cheaply and quickly with a single Oxford Nanopore MinION flow cell and one Hi-C library in a classroom setting. Combining these data with a mass spectrometry-generated proteome illustrates the utility of duckweed as a model for genomics- and proteomics-based education.
0
Paper
Citation6
0
Save
39

Unusual predominance of maintenance DNA methylation in Spirodela polyrhiza

Alex Harkess et al.Oct 24, 2023
+5
Z
A
A
Abstract 5-methylcytosine (5mC) is a modified base often described as necessary for the proper regulation of genes and transposons and for the maintenance of genome integrity in plants. However, the extent of this dogma is limited by the current phylogenetic sampling of land plant species diversity. Here, we report that a monocot plant, Spirodela polyrhiza , has lost CG gene body methylation, genome-wide CHH methylation, and the presence or expression of several genes in the highly conserved RNA-directed DNA methylation (RdDM) pathway. It has also lost the CHH methyltransferase CHROMOMETHYLASE 2 . Consequently, the transcriptome is depleted of 24-nucleotide, heterochromatic, small interfering RNAs that act as guides for the deposition of 5mC to RdDM-targeted loci in all other currently sampled angiosperm genomes. Although the genome displays low levels of genome-wide 5mC primarily at LTR retrotransposons, CG maintenance methylation is still functional. In contrast, CHG methylation is weakly maintained even though H3K9me2 is present at loci dispersed throughout the euchromatin and highly enriched at regions likely demarcating pericentromeric regions. Collectively, these results illustrate that S. polyrhiza is maintaining CG and CHG methylation mostly at repeats in the absence of small RNAs. S. polyrhiza reproduces rapidly through clonal propagation in aquatic environments, which we hypothesize may enable low levels of maintenance methylation to persist in large populations. Significance Statement DNA methylation is a widespread chromatin modification that is regularly found in all plant species. By examining one aquatic duckweed species, Spirodela polyrhiza , we find that it has lost highly conserved genes involved in methylation of DNA at sites often associated with repetitive DNA, and within genes, however DNA methylation and heterochromatin is maintained during cell division at other sites. Consequently, small RNAs that normally guide methylation to silence repetitive DNA like retrotransposons are diminished. Despite the loss of a highly conserved methylation pathway, and the reduction of small RNAs that normally target repetitive DNA, transposons have not proliferated in the genome, perhaps due in part to the rapid, clonal growth lifestyle of duckweeds.
39
Paper
Citation6
0
Save
27

Underwater CAM photosynthesis elucidated by Isoetes genome

David Wickell et al.Oct 24, 2023
+10
H
L
D
Abstract To conserve water in arid environments, numerous plant lineages have independently evolved Crassulacean Acid Metabolism (CAM). Interestingly, Isoetes , an aquatic lycophyte, can also perform CAM as an adaptation to low CO 2 availability underwater. However, little is known about the evolution of CAM in aquatic plants and the lack of genomic data has hindered comparison between aquatic and terrestrial CAM. Here, we investigated the underwater CAM in Isoetes taiwanensis by generating a high-quality genome assembly and RNA-seq time course. Despite broad similarities between CAM in Isoetes and terrestrial angiosperms, we identified several key differences. Notably, for carboxylation of PEP, Isoetes recruited the lesser-known “bacterial-type” PEPC, along with the “plant-type” exclusively used in other terrestrial CAM and C4 plants. Furthermore, we found that circadian control of key CAM pathway genes has diverged considerably in Isoetes relative to flowering plants. This suggests the existence of more evolutionary paths to CAM than previously recognized.
1

Evolutionary gain and loss of a plant pattern-recognition receptor for HAMP recognition

Simon Snoeck et al.Oct 24, 2023
+3
A
B
S
Abstract Pattern recognition receptors (PRR) recognize distinct pathogen and herbivore-associated molecular patterns (PAMPs and HAMPs) and mediate activation of immune responses, but the evolution of new PRR sensing functions is not well understood. We employed comparative genomics and functional analysis to define evolutionary events leading to the sensing of the peptide HAMP inceptin (In11) by the PRR Inceptin Receptor (INR). Existing and de novo genome assemblies revealed that the presence of a functional INR gene corresponded with In11 response across 55 million years (my) of legume evolution, and that In11 recognition is unique to the clade of Phaseoloid legumes. The INR loci of certain Phaseoloid and non-Phaseoloid species also contain diverse INR-like homologues, suggesting that the evolution of INR receptor function ∼28 mya occurred after an ancestral gene insertion ∼32 mya. Functional analysis of chimeric and ancestrally reconstructed receptors revealed that specific AA differences in the C1 leucine-rich repeat (LRR) domain and C2 intervening motif likely mediated gain of In11 recognition. In summary, we present a conceptual model for the evolution of a defined PRR function based on patterns of INR variation in legumes.
1
Paper
Citation2
0
Save
12

Single nuclei transcriptome of the Lesser Duckweed Lemna minuta reveals cell trajectories for an entire plant

Bradley Abramson et al.Oct 24, 2023
+4
N
M
B
Abstract The ability to trace every cell in some model organisms has led to the fundamental understanding of development and cellular function. However, in plants the complexity of cell number, organ size and developmental times makes this a challenge even in the diminutive model plant Arabidopsis thaliana . Here we develop the Lesser Duckweed Lemna minuta as a model with a reduced body plan, small genome size and clonal growth pattern that enables simultaneous tracing of cells from the entire plant over the complete developmental cycle. We generated a chromosome-resolved genome for the 360 megabase genome and defined the growth trajectory of the entire plant with single nuclei RNA sequencing. The L. minuta gene complement represents a primarily non-redundant set with only the ancient tau whole genome duplication shared with all monocots, and paralog expansion as a result of tandem duplications related to phytoremediation. Thirteen distinct cell types representing meristem, the leaf-stem fusion called a frond, and root-like tissues were defined using gene orthology with single cell expression from model plants, gene ontology categories, and cell trajectory analysis. Dividing meristem cells give rise to two main branches of root-transition and mesophyll cells, which then give rise to terminally differentiated parenchyma, epidermal and root cells. Mesophyll tissues express high levels of elemental transport genes consistent with this tissue playing a role in L. minuta wastewater detoxification. The L. minuta genome and cell map provide a paradigm to decipher developmental genes and pathways for an entire plant. Sentence summary Genome and single nuclei transcriptome of the Lesser Duckweed Lemna minuta enables tracing of all developmental, transitional and terminal cells of an entire plant.
12
Paper
Citation2
0
Save
41

Large structural variations in the haplotype-resolved African cassava genome

Ben Mansfeld et al.Oct 24, 2023
+6
J
A
B
Abstract Cassava ( Manihot esculenta Crantz, 2n=36) is a global food security crop. Cassava has a highly heterozygous genome, high genetic load, and genotype-dependent asynchronous flowering. It is typically propagated by stem cuttings and any genetic variation between haplotypes, including large structural variations, is preserved by such clonal propagation. Traditional genome assembly approaches generate a collapsed haplotype representation of the genome. In highly heterozygous plants, this results in artifacts and an oversimplification of heterozygous regions. We used a combination of Pacific Biosciences (PacBio), Illumina, and Hi-C to resolve each haplotype of the genome of a farmer-preferred cassava line, TME7 (Oko-iyawo). PacBio reads were assembled using the FALCON suite. Phase switch errors were corrected using FALCON-Phase and Hi-C read data. The ultra-long-range information from Hi-C sequencing was also used for scaffolding. Comparison of the two phases revealed more than 5,000 large haplotype-specific structural variants affecting over 8 Mb, including insertions and deletions spanning thousands of base pairs. The potential of these variants to affect allele specific expression was further explored. RNA-seq data from 11 different tissue types were mapped against the scaffolded haploid assembly and gene expression data are incorporated into our existing easy-to-use web-based interface to facilitate use by the broader plant science community. These two assemblies provide an excellent means to study the effects of heterozygosity, haplotype-specific structural variation, gene hemizygosity, and allele specific gene expression contributing to important agricultural traits and further our understanding of the genetics and domestication of cassava. Significance statement The cassava varieties grown by subsistence farmers in Africa largely differ from the inbred reference genome due to their highly heterozygous nature. We used multiple sequencing technologies to assemble and resolve both haplotypes in TME7, a farmer-preferred cassava line, enabling us to study the considerable haplotypic structural variation in this line.
41
Citation2
0
Save
0

Genome-Wide Association Study Reveals Influence of Cell-specific Gene Networks on Soybean Root System Architecture

Ying Sun et al.May 26, 2024
+9
A
C
Y
Abstract Root system architecture (RSA) describes the shape and arrangement of a plant’s roots in the soil including the angle, rate of growth, and type of individual roots, which facilitates the uptake of nutrients and water. In crop improvement efforts, RSA has been less well studied due to the technical challenges associated with phenotyping roots as well as a focus on above-ground traits such as yield. We developed a gel-based root phenotyping system called RADICYL (Root Architecture 3D Cylinder), which is a non-invasive, high-throughput approach that enabled us to measure 15 RSA traits. We leveraged RADICYL to perform a comprehensive genome-wide association study (GWAS) with a panel of 371 diverse soybean elite lines, cultivars, landraces, and closely related species to identify gene networks underlying RSA. We identified 54 significant single nucleotide polymorphisms (SNPs) in our GWAS, some of which were shared across multiple RSA traits while others were specific to a given trait. We generated a single cell atlas of the soybean root using single nuclei RNA sequencing (snRNAseq) to explore the associated genes in the context of root tissues. Using gene co-expression network (GCN) analyses applied to RNA-seq of soybean root tissues, we identified network-level associations of genes predominantly expressed in endodermis with root width, and of those expressed in metaphloem with lateral root length. Our results suggest that pathways active in the endodermis and metaphloem cell-types influence soybean root system architecture.
0
Paper
Citation1
0
Save
0

Telomere Length in Plants Estimated with Long Read Sequencing

Kelly Colt et al.May 26, 2024
+3
B
S
K
Telomeres play an important role in chromosome stability and their length is thought to be related to an organism's lifestyle and lifespan. Telomere length is variable across plant species and between cultivars of the same species, possibly conferring adaptive advantage. However, it is not known whether telomere length is related to lifestyle or life span across a diverse array of plant species due to the lack of information on telomere length in plants. Here we leverage genomes assembled with long read sequencing data to estimate telomere length by chromosome. We find that long read assemblies based on Oxford Nanopore Technologies (ONT) accurately predict telomere length in the two model plant species Arabidopsis thaliana and Oryza sativa matching lab-based length estimates. We then estimate telomere length across an array of plant species with different lifestyles and lifespans and find that in general gymnosperms have shorter telomeres compared to eudicots and monocots. Crop species frequently have longer telomeres than their wild relatives, and species that have been maintained clonally such as hemp have long telomeres possibly reflecting that this lifestyle requires long term chromosomal stability.
0
Citation1
0
Save
6

Core circadian clock and light signaling genes brought into genetic linkage across the green lineage

Todd MichaelOct 24, 2023
T
Abstract The circadian clock ensures that biological processes are phased to the correct time of day. In plants the circadian clock is conserved at both the level of transcriptional networks as well as core genes. In the model plant Arabidopsis thaliana, the core circadian singleMYB ( sMYB ) genes CCA1 and RVE4 are in genetic linkage with the PSEUDO-RESPONSE REGULATOR ( PRR ) genes PRR9 and PRR7 respectively. Leveraging chromosome-resolved plant genomes and syntenic ortholog analysis it was possible to trace this genetic linkage back to the basal angiosperm Amborella and identify an additional evolutionarily conserved genetic linkage between PIF3 and PHYA . The LHY/CCA1-PRR5/9, RVE4/8-PRR3/7 and PIF3-PHYA genetic linkages emerged in the bryophyte lineage and progressively moved within several genes of each other across an array of higher plant families representing distinct whole genome duplication and fractionation events. Soybean maintains all but two genetic linkages, and expression analysis revealed the PIF3-PHYA linkage overlapping with the E4 maturity group locus was the only pair to robustly cycle with an evening phase in contrast to the sMYB-PRR morning and midday phase. While most monocots maintain the genetic linkages, they have been lost in the economically important grasses (Poaceae) such as maize where the genes have been fractionated to separate chromosomes and presence/absence variation results in the segregation of PRR7 paralogs across heterotic groups. The evolutionary conservation of the genetic linkage as well as its loss in the grasses provides new insight in the plant circadian clock, which has been a critical target of breeding and domestication. Summary Sentence The genetic linkage of the core circadian clock components has evolutionary origins in bryophytes and sheds light on the current functioning and selection on the circadian clock in crops.
6
Paper
Citation1
0
Save
Load More