FS
Fan Song
Author with expertise in Regulation of Chromatin Structure and Function
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
13
(54% Open Access)
Cited by:
1,508
h-index:
30
/
i10-index:
62
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

HiCRep: assessing the reproducibility of Hi-C data using a stratum-adjusted correlation coefficient

Tao Yang et al.Aug 30, 2017
Hi-C is a powerful technology for studying genome-wide chromatin interactions. However, current methods for assessing Hi-C data reproducibility can produce misleading results because they ignore spatial features in Hi-C data, such as domain structure and distance dependence. We present HiCRep, a framework for assessing the reproducibility of Hi-C data that systematically accounts for these features. In particular, we introduce a novel similarity measure, the stratum adjusted correlation coefficient (SCC), for quantifying the similarity between Hi-C interaction matrices. Not only does it provide a statistically sound and reliable evaluation of reproducibility, SCC can also be used to quantify differences between Hi-C contact matrices and to determine the optimal sequencing depth for a desired resolution. The measure consistently shows higher accuracy than existing approaches in distinguishing subtle differences in reproducibility and depicting interrelationships of cell lineages. The proposed measure is straightforward to interpret and easy to compute, making it well-suited for providing standardized, interpretable, automatable, and scalable quality control. The freely available R package HiCRep implements our approach.
1
Citation422
0
Save
0

Integrative detection and analysis of structural variation in cancer genomes

Jesse Dixon et al.Sep 4, 2018
Structural variants (SVs) can contribute to oncogenesis through a variety of mechanisms. Despite their importance, the identification of SVs in cancer genomes remains challenging. Here, we present a framework that integrates optical mapping, high-throughput chromosome conformation capture (Hi-C), and whole-genome sequencing to systematically detect SVs in a variety of normal or cancer samples and cell lines. We identify the unique strengths of each method and demonstrate that only integrative approaches can comprehensively identify SVs in the genome. By combining Hi-C and optical mapping, we resolve complex SVs and phase multiple SV events to a single haplotype. Furthermore, we observe widespread structural variation events affecting the functions of noncoding sequences, including the deletion of distal regulatory sequences, alteration of DNA replication timing, and the creation of novel three-dimensional chromatin structural domains. Our results indicate that noncoding SVs may be underappreciated mutational drivers in cancer genomes. The authors present an integrative framework for identifying structural variants (SVs) in cancer that applies optical mapping, Hi-C, and whole-genome sequencing. They find SVs affecting distal regulatory sequences, DNA replication, and three-dimensional chromatin structure.
0
Citation366
0
Save
0

Mitochondrial phylogenomics of Hemiptera reveals adaptive innovations driving the diversification of true bugs

Hu Li et al.Sep 6, 2017
Hemiptera, the largest non-holometabolous order of insects, represents approximately 7% of metazoan diversity. With extraordinary life histories and highly specialized morphological adaptations, hemipterans have exploited diverse habitats and food sources through approximately 300 Myr of evolution. To elucidate the phylogeny and evolutionary history of Hemiptera, we carried out the most comprehensive mitogenomics analysis on the richest taxon sampling to date covering all the suborders and infraorders, including 34 newly sequenced and 94 published mitogenomes. With optimized branch length and sequence heterogeneity, Bayesian analyses using a site-heterogeneous mixture model resolved the higher-level hemipteran phylogeny as (Sternorrhyncha, (Auchenorrhyncha, (Coleorrhyncha, Heteroptera))). Ancestral character state reconstruction and divergence time estimation suggest that the success of true bugs (Heteroptera) is probably due to angiosperm coevolution, but key adaptive innovations (e.g. prognathous mouthpart, predatory behaviour, and haemelytron) facilitated multiple independent shifts among diverse feeding habits and multiple independent colonizations of aquatic habitats.
0
Paper
Citation267
0
Save
0

HiCRep: assessing the reproducibility of Hi-C data using a stratum-adjusted correlation coefficient

Tao Yang et al.Jan 18, 2017
Abstract Hi-C is a powerful technology for studying genome-wide chromatin interactions. However, current methods for assessing Hi-C data reproducibility can produce misleading results because they ignore spatial features in Hi-C data, such as domain structure and distance dependence. We present HiCRep, a framework for assessing the reproducibility of Hi-C data that systematically accounts for these features. In particular, we introduce a novel similarity measure, the stratum adjusted correlation coefficient (SCC), for quantifying the similarity between Hi-C interaction matrices. Not only does it provide a statistically sound and reliable evaluation of reproducibility, SCC can also be used to quantify differences between Hi-C contact matrices and to determine the optimal sequencing depth for a desired resolution. The measure consistently shows higher accuracy than existing approaches in distinguishing subtle differences in reproducibility and depicting interrelationships of cell lineages. The proposed measure is straightforward to interpret and easy to compute, making it well-suited for providing standardized, interpretable, automatable, and scalable quality control. The freely available R package HiCRep implements our approach.
0
Citation10
0
Save
0

Conserved A-to-I RNA editing with non-conserved recoding expands the candidates of functional editing sites

Yuange Duan et al.Jun 18, 2024
Adenosine-to-inosine (A-to-I) RNA editing recodes the genome and confers flexibility for the organisms to adapt to the environment. It is believed that RNA recoding sites are well suited for facilitating adaptive evolution by increasing the proteomic diversity in a temporal-spatial manner. The function and essentiality of a few conserved recoding sites are recognized. However, the experimentally discovered functional sites only make up a small corner of the total sites, and there is still the need to expand the repertoire of such functional sites with bioinformatic approaches. In this study, we define a new category of RNA editing sites termed 'conserved editing with non-conserved recoding' and systematically identify such sites in Drosophila editomes, figuring out their selection pressure and signals of adaptation at inter-species and intra-species levels. Surprisingly, conserved editing sites with non-conserved recoding are not suppressed and are even slightly overrepresented in Drosophila. DNA mutations leading to such cases are also favoured during evolution, suggesting that the function of those recoding events in different species might be diverged, specialized, and maintained. Finally, structural prediction suggests that such recoding in potassium channel Shab might increase ion permeability and compensate the effect of low temperature. In conclusion, conserved editing with non-conserved recoding might be functional as well. Our study provides novel aspects in considering the adaptive evolution of RNA editing sites and meanwhile expands the candidates of functional recoding sites for future validation.
0
Citation3
0
Save
0

Comparative genomic analyses on assassin bug Rhynocoris fuscipes (Hemiptera: Reduviidae) reveal genetic bases governing the diet-shift

Ling Ma et al.Jun 28, 2024
Genetic basis underlying the biodiversity and phenotypic plasticity are fascinating questions in evolutionary biology. Such molecular diversity can be achieved at multi-omics levels. Here, we sequenced the first chromosome-level genome of assassin bug Rhynocoris fuscipes, a polyphagous generalist predator for biological control of agroecosystems. Compared to non-predatory true bugs Apolygus lucorum and Riptortus pedestris, the R. fuscipes-specific genes were enriched in diet-related genes (e.g., serine proteinase, cytochrome P450) which had higher expression level and more exons than non-diet genes. Extensive A-to-I RNA editing was identified in all three species and showed enrichment in genes associated with diet in R. fuscipes, diversifying the transcriptome. An extended analysis between five predaceous and 27 phytophagous hemipteran species revealed an expansion of diet-related genes in R. fuscipes. Our findings bridge the gap between genotype and phenotype, and also advance our understanding on genetic and epigenetic bases governing the diet shifts in ture bugs.
0

Measuring the reproducibility and quality of Hi-C data

Galip Yardımcı et al.Sep 14, 2017
Hi-C is currently the most widely used assay to investigate the 3D organization of the genome and to study its role in gene regulation, DNA replication, and disease. However, Hi-C experiments are costly to perform and involve multiple complex experimental steps; thus, accurate methods for measuring the quality and reproducibility of Hi-C data are essential to determine whether the output should be used further in a study. Using real and simulated data, we profile the performance of several recently proposed methods for assessing reproducibility of population Hi-C data, including HiCRep, GenomeDISCO, HiC-Spector and QuASAR-Rep. By explicitly controlling noise and sparsity through simulations, we demonstrate the deficiencies of performing simple correlation analysis on pairs of matrices, and we show that methods developed specifically for Hi-C data produce better measures of reproducibility. We also show how to use established (e.g., ratio of intra to interchromosomal interactions) and novel (e.g., QuASAR-QC) measures to identify low quality experiments. In this work, we assess reproducibility and quality measures by varying sequencing depth, resolution and noise levels in Hi-C data from 13 cell lines, with two biological replicates each, as well as 176 simulated matrices. Through this extensive validation and benchmarking of Hi-C data, we describe best practices for reproducibility and quality assessment of Hi-C experiments. We make all software publicly available at http://github.com/kundaje/3DChromatin_ReplicateQC to facilitate adoption in the community.
0

An Integrated Framework for Genome Analysis Reveals Numerous Previously Unrecognizable Structural Variants in Leukemia Patients' Samples

Jie Xu et al.Feb 28, 2019
While genomic analysis of tumors has stimulated major advances in cancer diagnosis, prognosis and treatment, current methods fail to identify a large fraction of somatic structural variants in tumors. We have applied a combination of whole genome sequencing and optical genome mapping to a number of adult and pediatric leukemia samples, which revealed in each of these samples a large number of structural variants not recognizable by current tools of genomic analyses. We developed computational methods to determine which of those variants likely arose as somatic mutations. The method identified 97% of the structural variants previously reported by karyotype analysis of these samples and revealed an additional fivefold more such somatic rearrangements. The method identified on average tens of previously unrecognizable inversions and duplications and hundreds of previously unrecognizable insertions and deletions. These structural variants recurrently affected a number of leukemia associated genes as well as cancer driver genes not previously associated with leukemia and genes not previously associated with cancer. A number of variants only affected intergenic regions but caused cis-acting alterations in expression of neighboring genes. Analysis of TCGA data indicates that the status of several of the recurrently mutated genes identified in this study significantly affect survival of AML patients. Our results suggest that current genomic analysis methods fail to identify a majority of structural variants in leukemia samples and this lacunae may hamper diagnostic and prognostic efforts.
0

An Integrative Framework For Detecting Structural Variations In Cancer Genomes

Jesse Dixon et al.Mar 28, 2017
Structural variants can contribute to oncogenesis through a variety of mechanisms, yet, despite their importance, the identification of structural variants in cancer genomes remains challenging. Here, we present an integrative framework for comprehensively identifying structural variation in cancer genomes. For the first time, we apply next-generation optical mapping, high-throughput chromosome conformation capture (Hi-C) techniques, and whole genome sequencing to systematically detect SVs in a variety of cancer cells. Using this approach, we identify and characterize structural variants in up to 29 commonly used normal and cancer cell lines. We find that each method has unique strengths in identifying different classes of structural variants and at different scales, suggesting that integrative approaches are likely the only way to comprehensively identify structural variants in the genome. Studying the impact of the structural variants in cancer cell lines, we identify widespread structural variation events affecting replication timing and the functions of non-coding sequences in the genome, including the deletion of distal regulatory sequences, alteration of DNA replication timing, and the creation of novel 3D chromatin structural domains. These results underscore the importance of comprehensive structural variant identification and indicate that non-coding structural variation may be an underappreciated mutational process in cancer genomes.
Load More