MS
Michael Song
Author with expertise in Viral RNA Silencing and Plant Immunity
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
7
(71% Open Access)
Cited by:
1
h-index:
8
/
i10-index:
8
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

Induction of autotetraploidy and microbiome associations mediate differential responses to pathogens

Elijah Mehlferber et al.Oct 1, 2021
Abstract It has become increasingly clear that the microbiome plays a critical role in shaping the host organism’s response to disease. There also exists mounting evidence that an organism’s ploidy level is important in their response to pathogens and parasites. However, no study has determined if or how these two factors influence one another. We investigate the effect of whole-genome duplication in Arabidopsis thaliana on their above-ground (phyllosphere) microbiome, and determine the interacting impacts of ploidy and the microbiome on disease outcome. Using seven independently derived synthetic auto-tetraploid Arabidopsis accessions, a synthetic leaf-associated bacterial community, and the model pathogen Pseudomonas syringae pv. Tomato DC3000, we confirm that polyploids are generally more resistant to pathogens, but illustrate that this resistance may be in part due to a decrease in the reliance on beneficial bacteria. Polyploids fare better against the pathogen than diploids regardless of microbial inoculation, while we observed that diploids harboring an intact microbiome have lower pathogen densities than those without. We then use RNA sequencing to show that diploids have many more differentially expressed defense-related genes in the presence of their phyllosphere microbiota, while polyploids exhibit constitutively activated defenses regardless of exposure to the synthetic community. These results imply that whole-genome duplication can disrupt historical host-microbiome associations, and suggest that a potential cause or consequence of disruption is a heightened capacity for pathogen defense that is less impacted by the microbiome.
1
Citation1
0
Save
0

cis-Regulatory Chromatin Contacts in Neural Cells Reveal Contributions of Genetic Variants to Complex Neurological Disorders

Michael Song et al.Dec 13, 2018
Mutations in gene regulatory elements have been associated with a wide range of complex neurological disorders. However, due to their inherent cell type-specificity and difficulties in characterizing their regulatory targets, our ability to identify causal genetic variants has remained limited. To address these constraints, we perform integrative analysis of chromatin interactions using promoter capture Hi-C (pcHi-C), open chromatin regions using ATAC-seq, and transcriptomes using RNA-seq in four functionally distinct neural cell types: iPSC-induced excitatory neurons and lower motor neurons, iPSC-derived hippocampal dentate gyrus (DG)-like neurons, and primary astrocytes. We identify hundreds of thousands of long-range cis interactions between promoters and distal promoter-interacting regions (PIRs), enabling us to link regulatory elements to their target genes and reveal putative pathways that are dysregulated in disease. We validate several novel PIRs using CRISPR techniques in human excitatory neurons, demonstrating that CDK5RAP3, STRAP, and DRD2 are transcriptionally regulated by physically linked enhancers. Finally, we show that physical chromatin interactions mediate genetic interactions in autism spectrum disorder (ASD). Our study illustrates how characterizing the 3D epigenome elucidates novel regulatory relationships in the central nervous system (CNS), shedding light on previously unknown functions for noncoding variants in complex neurological disorders.
0

The nitrogen-fixing fern Azolla has a complex microbiome characterized by multiple modes of transmission

Michael Song et al.May 20, 2024
Azolla is a floating fern that has closely evolved with a vertically transmitted obligate cyanobacterium endosymbiont--Anabaena azollae that performs nitrogen fixation in specialized Azolla leaf pockets. This cyanobacterium has a greatly reduced genome and appears to be in the "advanced" stages of symbiosis, potentially evolving into a nitrogen fixing organelle. However, there are also other lesser-known inhabitants of the leaf pocket whose role and mode of transmission are unknown. We sequenced 112 Azolla specimens collected across the state of California and characterized their metagenomes in order to identify the common bacterial endosymbionts of the leaf pocket and assess their patterns of co-diversification. Four taxa were found across all samples, establishing that there are multiple endosymbionts that consistently inhabit the Azolla leaf pocket. We found varying degrees of co-diversification across these taxa as well as varying degrees of isolation by distance and of pseudogenation, which implies that the endosymbiotic community is transmitted by a mix of horizontal and vertical mechanisms, and that some members of the microbiome are more facultative symbionts than others. These results show that the Azolla symbiotic community is complex, featuring members at potentially different stages of symbiosis evolution, further supporting the utility of the Azolla microcosm as a system for studying the evolution of symbioses.
0

A genome assembly for the California endemic liverwort Calasterella californica

Ixchel González-Ramírez et al.Nov 6, 2024
Abstract Calasterella californica belongs to a monotypic genus of liverworts endemic to the west coast of North America, primarily distributed in California. This dioicous species occurs in a variety of ecosystems from deserts to redwood forest; little is known about how this species is adapted to live in those seemingly contrasting environments. In this paper, we report the assembly of the nuclear genome of Calasterella californica. As part of the California Conservation Genomics Project (CCGP), we used Pacific Biosciences HiFi long-read sequencing data to produce a de novo assembly that consists of 772 contigs, with a total length of 517 Mbp and a BUSCO complete score of 95%. C. californica is only the sixth species of liverworts – a group with more than 7200 described species – to have a nuclear reference genome. The availability of this reference genome will facilitate the study of the unique features of C. californica and other liverworts, pave the road towards a comparative understanding of liverwort genomes, and add an important starting point for studies of the geographic variation of this species within the CCGP project.
1

Commonly used Bayesian diversification-rate models produce biologically meaningful differences on empirical phylogenies

Jesús Martínez‐Gómez et al.May 21, 2023
Abstract Identifying along which lineages shifts in diversification rates occur is a central goal of comparative phylogenetics; these shifts may coincide with key evolutionary events such as the development of novel morphological characters, the acquisition of adaptive traits, polyploidization or other structural genomic changes, or dispersal to a new habitat and subsequent increase in environmental niche space. However, while multiple methods now exist to estimate diversification rates and identify shifts using phylogenetic topologies, the appropriate use and accuracy of these methods is hotly debated. Here we test whether five Bayesian methods—Bayesian Analysis of Macroevolutionary Mixtures ( BAMM ), two implementations of the Lineage-Specific Birth-Death-Shift model ( LSBDS and PESTO ), the approximate Multi-Type Birth-Death model ( MTBD ; implemented in BEAST2 ), and the cladogenetic diversification rate shift model ( CLaDS2 )—produce comparable results. We apply each of these methods to a set of 65 empirical time-calibrated phylogenies and compare inferences of speciation rate, extinction rate, and net diversification rate. We find that the five methods often infer different speciation, extinction, and net-diversification rates. Consequently, these different estimates may lead to different interpretations of the macroevolutionary dynamics. The different estimates can be attributed to fundamental differences among the compared models. Therefore, the inference of shifts in diver-sification rates is strongly method-dependent. We advise biologists to apply multiple methods to test the robustness of the conclusions or to carefully select the method based on the validity of the underlying model assumptions to their particular empirical system. Lay Summary Understanding why some groups of organisms have more species than others is key to understanding the origin of biodiversity. Theory and empirical evidence suggest that multiple distinct historical events—such as the evolution of particular morphological features (e.g., the flower, the tetrapod limb) and competition amongst species—can produce this pattern of divergent species richness. Identifying when and where on the tree of life shifts in diversification rates occur is important for explaining the origin of modern-day biodiversity and understanding how disparity among species evolves. Several statistical methods have been developed to infer diversification rates and identify these shifts. While these methods each attempt to make inferences about changes in the tempo of diversification, they differ in their underlying statistical models and assumptions. Here we test if these methods draw similar conclusions using a dataset of 65 time-calibrated phylogenies from across multicellular life. We find that inferences of where rate shifts occur strongly depends on the chosen method. Therefore, biologists should choose the model whose assumptions they believe to be the most valid and justify their model choice a priori , or consider using several independent methods to test an evolutionary hypothesis.
0

Gene balance predicts transcriptional responses immediately following ploidy change in Arabidopsis thaliana

Barney Potter et al.Oct 7, 2019
The Gene Balance Hypothesis postulates that there is selection on gene copy number (gene dosage) to preserve stoichiometric balance among interacting proteins. This presupposes that gene product abundance is governed by gene dosage, and that the way in which gene product abundance is governed by gene dosage is consistent for all genes in a dosage-sensitive network or complex. Gene dosage responses, however, have rarely been quantified and the available data suggest that they are highly variable. We sequenced the transcriptomes of two synthetic autopolyploid accessions of Arabidopsis thaliana and their diploid progenitors, as well as one natural tetraploid and its synthetic diploid produced via haploid induction, to estimate transcriptome size and gene dosage responses immediately following ploidy change. We demonstrate that overall transcriptome size does not exhibit a simple doubling in response to genome doubling, and that individual gene dosage responses are highly variable in all three accessions, indicating that expression is not strictly coupled with gene dosage. Nonetheless, putatively dosage-sensitive gene groups (GO terms, metabolic networks, gene families, and predicted interacting protein pairs) exhibit both smaller and more coordinated dosage responses than do putatively dosage-insensitive gene groups, suggesting that constraints on dosage balance operate immediately following whole genome duplication. This supports the hypothesis that duplicate gene retention patterns are shaped by selection to preserve dosage balance.
6

HPRep: Quantifying reproducibility in HiChIP and PLAC-seq datasets

Jonathan Rosen et al.Nov 23, 2020
Abstract HiChIP and PLAC-seq are emerging technologies for studying genome-wide long-range chromatin interactions mediated by protein of interest, enabling more sensitive and cost-efficient interrogation of protein-centric chromatin conformation. However, due to the unbalanced read distribution introduced by protein immunoprecipitation, existing reproducibility measures developed for Hi-C data are not appropriate for the analysis of HiChIP and PLAC-seq data. Here, we present HPRep, a stratified and weighted correlation metric derived from normalized contact counts, to quantify reproducibility in HiChIP and PLAC-seq data. We applied HPRep to multiple real datasets and demonstrate that HPRep outperforms existing reproducibility measures developed for Hi-C data. Specifically, we applied HPRep to H3K4me3 PLAC-seq data from mouse embryonic stem cells and mouse brain tissues, as well as H3K27ac HiChIP data from human lymphoblastoid cell line GM12878 and leukemia cell line K562, showing that HPRep can more clearly separate among pseudo-replicates, real replicates, and non-replicates. Furthermore, in an H3K4me3 PLAC-seq dataset consisting of 11 samples from four human brain cell types, HPRep demonstrates expected clustering of data which could not be achieved by existing methods developed for Hi-C data, highlighting the need of a reproducibility metric tailored to HiChIP and PLAC-seq data.