YM
Yizi Mao
Author with expertise in RNA Sequencing Data Analysis
Achievements
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
6
(67% Open Access)
Cited by:
2
h-index:
3
/
i10-index:
0
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

DNA-m6A calling and integrated long-read epigenetic and genetic analysis with fibertools

Anupama Jha et al.Jun 7, 2024
Long-read DNA sequencing has recently emerged as a powerful tool for studying both genetic and epigenetic architectures at single-molecule and single-nucleotide resolution. Long-read epigenetic studies encompass both the direct identification of native cytosine methylation as well as the identification of exogenously placed DNA N6-methyladenine (DNA-m6A). However, detecting DNA-m6A modifications using single-molecule sequencing, as well as coprocessing single-molecule genetic and epigenetic architectures, is limited by computational demands and a lack of supporting tools. Here, we introduce fibertools, a state-of-the-art toolkit that features a semisupervised convolutional neural network for fast and accurate identification of m6A-marked bases using PacBio single-molecule long-read sequencing, as well as the coprocessing of long-read genetic and epigenetic data produced using either PacBio or Oxford Nanopore sequencing platforms. We demonstrate accurate DNA-m6A identification (>90% precision and recall) along >20 kilobase long DNA molecules with a ~1,000-fold improvement in speed. In addition, we demonstrate that fibertools can readily integrate genetic and epigenetic data at single-molecule resolution, including the seamless conversion between molecular and reference coordinate systems, allowing for accurate genetic and epigenetic analyses of long-read data within structurally and somatically variable genomic regions.
0
Citation1
0
Save
43

Synchronized long-read genome, methylome, epigenome, and transcriptome for resolving a Mendelian condition

Mitchell Vollger et al.Jan 1, 2023
Resolving the molecular basis of a Mendelian condition (MC) remains challenging owing to the diverse mechanisms by which genetic variants cause disease. To address this, we developed a synchronized long-read genome, methylome, epigenome, and transcriptome sequencing approach, which enables accurate single-nucleotide, insertion-deletion, and structural variant calling and diploid de novo genome assembly, and permits the simultaneous elucidation of haplotype-resolved CpG methylation, chromatin accessibility, and full-length transcript information in a single long-read sequencing run. Application of this approach to an Undiagnosed Diseases Network (UDN) participant with a chromosome X;13 balanced translocation of uncertain significance revealed that this translocation disrupted the functioning of four separate genes (NBEA, PDK3, MAB21L1, and RB1) previously associated with single-gene MCs. Notably, the function of each gene was disrupted via a distinct mechanism that required integration of the four 9omes9 to resolve. These included nonsense-mediated decay, fusion transcript formation, enhancer adoption, transcriptional readthrough silencing, and inappropriate X chromosome inactivation of autosomal genes. Overall, this highlights the utility of synchronized long-read multi-omic profiling for mechanistically resolving complex phenotypes.
0

Stable centromere association of the yeast histone variant Cse4 requires its essential N-terminal domain

Andrew Popchock et al.Jul 24, 2024
Chromosome segregation relies on kinetochores that assemble on specialized centromeric chromatin containing a histone H3 variant. In budding yeast, a single centromeric nucleosome containing Cse4 assembles at a sequence-defined 125 bp centromere. Yeast centromeric sequences are poor templates for nucleosome formation in vitro, suggesting the existence of mechanisms that specifically stabilize Cse4 nucleosomes in vivo. The extended Cse4 N-terminal tail binds to the chaperone Scm3, and a short essential region called END within the N-terminal tail binds the inner kinetochore complex OA. To address the roles of these interactions, we utilized single molecule fluorescence assays to monitor Cse4 during kinetochore assembly. We found that OA and Scm3 independently stabilize Cse4 at centromeres via their END interaction. Scm3 binding to the Cse4 END is enhanced by Ipl1/Aurora B phosphorylation, identifying a previously unknown role for Ipl1 in ensuring Cse4 stability. Strikingly, an Ipl1 phosphomimetic mutation in the Cse4 END enhances Scm3 binding and can restore Cse4 recruitment in mutants defective in OA binding. Together, these data suggest that a key function of the essential Cse4 N-terminus is to ensure Cse4 localization at centromeres.
0

Centromeric transposable elements and epigenetic status drive karyotypic variation in the eastern hoolock gibbon

Gabrielle Hartley et al.Aug 30, 2024
Great apes have maintained a stable karyotype with few large-scale rearrangements; in contrast, gibbons have undergone a high rate of chromosomal rearrangements coincident with rapid centromere turnover. Here we characterize assembled centromeres in the Eastern hoolock gibbon, Hoolock leuconedys (HLE), finding a diverse group of transposable elements (TEs) that differ from the canonical alpha satellites found across centromeres of other apes. We find that HLE centromeres contain a CpG methylation centromere dip region, providing evidence this epigenetic feature is conserved in the absence of satellite arrays; nevertheless, we report a variety of atypical centromeric features, including protein-coding genes and mismatched replication timing. Further, large structural variations define HLE centromeres and distinguish them from other gibbons. Combined with differentially methylated TEs, topologically associated domain boundaries, and segmental duplications at chromosomal breakpoints, we propose that a perfect storm of multiple genomic attributes with propensities for chromosome instability shaped gibbon centromere evolution.