JX
Jie Xu
Author with expertise in Regulation of Chromatin Structure and Function
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
11
(27% Open Access)
Cited by:
804
h-index:
17
/
i10-index:
25
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
1

The 3D Genome Browser: a web-based browser for visualizing 3D genome organization and long-range chromatin interactions

Yanli Wang et al.Oct 4, 2018
+10
T
R
Y
Here, we introduce the 3D Genome Browser, http://3dgenome.org , which allows users to conveniently explore both their own and over 300 publicly available chromatin interaction data of different types. We design a new binary data format for Hi-C data that reduces the file size by at least a magnitude and allows users to visualize chromatin interactions over millions of base pairs within seconds. Our browser provides multiple methods linking distal cis-regulatory elements with their potential target genes. Users can seamlessly integrate thousands of other omics data to gain a comprehensive view of both regulatory landscape and 3D genome structure.
1
Citation438
0
Save
0

Integrative detection and analysis of structural variation in cancer genomes

Jesse Dixon et al.Sep 4, 2018
+34
V
J
J
Structural variants (SVs) can contribute to oncogenesis through a variety of mechanisms. Despite their importance, the identification of SVs in cancer genomes remains challenging. Here, we present a framework that integrates optical mapping, high-throughput chromosome conformation capture (Hi-C), and whole-genome sequencing to systematically detect SVs in a variety of normal or cancer samples and cell lines. We identify the unique strengths of each method and demonstrate that only integrative approaches can comprehensively identify SVs in the genome. By combining Hi-C and optical mapping, we resolve complex SVs and phase multiple SV events to a single haplotype. Furthermore, we observe widespread structural variation events affecting the functions of noncoding sequences, including the deletion of distal regulatory sequences, alteration of DNA replication timing, and the creation of novel three-dimensional chromatin structural domains. Our results indicate that noncoding SVs may be underappreciated mutational drivers in cancer genomes. The authors present an integrative framework for identifying structural variants (SVs) in cancer that applies optical mapping, Hi-C, and whole-genome sequencing. They find SVs affecting distal regulatory sequences, DNA replication, and three-dimensional chromatin structure.
0
Citation366
0
Save
0

Detecting Large Indels Using Optical Map Data

Xian Fan et al.Aug 2, 2018
L
J
X
Optical Maps (OM) provide reads that are very long, and thus can be used to detect large indels not detectable by the shorter reads provided by sequence-based technologies such as Illumina and PacBio. Two existing tools for detecting large indels from OM data are BioNano Solve and OMSV. However, these two tools may miss indels with weak signals. We propose a local-assembly based approach, OMIndel, to detect large indels with OM data. The results of applying OMIndel to empirical data demonstrate that it is able to detect indels with weak signal. Furthermore, compared with the other two OM-based methods, OMIndel has a lower false discovery rate. We also investigated the indels that can only be detected by OM but not Illumina, PacBio or 10X, and we found that they mostly fall into two categories: complex events or indels on repetitive regions. This implies that adding the OM data to sequence-based technologies can provide significant progress towards a more complete characterization of structural variants (SVs). The algorithm has been implemented in Perl and is publicly available on https://bitbucket.org/xianfan/optmethod.
0

The 3D Genome Browser: a web-based browser for visualizing 3D genome organization and long-range chromatin interactions

Yanli Wang et al.Feb 27, 2017
+10
L
L
Y
Recent advent of 3C-based technologies such as Hi-C and ChIA-PET provides us an opportunity to explore chromatin interactions and 3D genome organization in an unprecedented scale and resolution. However, it remains a challenge to visualize chromatin interaction data due to its size and complexity. Here, we introduce the 3D Genome Browser (http://3dgenome.org), which allows users to conveniently explore both publicly available and their own chromatin interaction data. Users can also seamlessly integrate other “omics” data sets, such as ChIP-Seq and RNA-Seq for the same genomic region, to gain a complete view of both regulatory landscape and 3D genome structure for any given gene. Finally, our browser provides multiple methods to link distal cis-regulatory elements with their potential target genes, including virtual 4C, ChIA-PET, Capture Hi-C and cross-cell-type correlation of proximal and distal DNA hypersensitive sites, and therefore represents a valuable resource for the study of gene regulation in mammalian genomes.
0

An Integrative Framework For Detecting Structural Variations In Cancer Genomes

Jesse Dixon et al.Mar 28, 2017
+36
V
J
J
Structural variants can contribute to oncogenesis through a variety of mechanisms, yet, despite their importance, the identification of structural variants in cancer genomes remains challenging. Here, we present an integrative framework for comprehensively identifying structural variation in cancer genomes. For the first time, we apply next-generation optical mapping, high-throughput chromosome conformation capture (Hi-C) techniques, and whole genome sequencing to systematically detect SVs in a variety of cancer cells. Using this approach, we identify and characterize structural variants in up to 29 commonly used normal and cancer cell lines. We find that each method has unique strengths in identifying different classes of structural variants and at different scales, suggesting that integrative approaches are likely the only way to comprehensively identify structural variants in the genome. Studying the impact of the structural variants in cancer cell lines, we identify widespread structural variation events affecting replication timing and the functions of non-coding sequences in the genome, including the deletion of distal regulatory sequences, alteration of DNA replication timing, and the creation of novel 3D chromatin structural domains. These results underscore the importance of comprehensive structural variant identification and indicate that non-coding structural variation may be an underappreciated mutational process in cancer genomes.
0

Genome-wide co-localization of RNA-DNA interactions and fusion RNA pairs

Zhangming Yan et al.Nov 19, 2018
+12
W
N
Z
Fusion transcripts are used as biomarkers in companion diagnoses. Although more than 15,000 fusion RNAs have been identified from diverse cancer types, few common features have been reported. Here, we compared 16,410 fusion transcripts detected in cancer (from a published cohort of 9,966 tumor samples of 33 cancer types) with genome-wide RNA-DNA interactions mapped in two normal, non-cancerous cell types (using iMARGI, an enhanced version of the MARGI [Mapping RNA-Genome Interactions assay]). Among the top 10 most significant RNA-DNA interactions in normal cells, 5 co-localized with the gene pairs that formed fusion RNAs in cancer. Furthermore, throughout the genome, the frequency of a gene pair to exhibit RNA-DNA interactions is positively correlated with the probability of this gene pair to present documented fusion transcripts in cancer. To test whether RNA-DNA interactions in normal cells are predictive of fusion RNAs, we analyzed these in a validation cohort of 96 lung cancer samples using RNA-seq. 37 out of 42 fusion transcripts in the validation cohort were found to exhibit RNA-DNA interactions in normal cells. Finally, by combining RNA-seq, single-molecule RNA FISH, and DNA FISH, we detected a cancer sample with EML4-ALK fusion RNA without forming the EML4-ALK fusion gene. Collectively, these data suggest a novel RNA-poise model, where spatial proximity of RNA and DNA could poise for the creation of fusion transcripts.
0

An Integrated Framework for Genome Analysis Reveals Numerous Previously Unrecognizable Structural Variants in Leukemia Patients' Samples

Jie Xu et al.Feb 28, 2019
+17
A
K
J
While genomic analysis of tumors has stimulated major advances in cancer diagnosis, prognosis and treatment, current methods fail to identify a large fraction of somatic structural variants in tumors. We have applied a combination of whole genome sequencing and optical genome mapping to a number of adult and pediatric leukemia samples, which revealed in each of these samples a large number of structural variants not recognizable by current tools of genomic analyses. We developed computational methods to determine which of those variants likely arose as somatic mutations. The method identified 97% of the structural variants previously reported by karyotype analysis of these samples and revealed an additional fivefold more such somatic rearrangements. The method identified on average tens of previously unrecognizable inversions and duplications and hundreds of previously unrecognizable insertions and deletions. These structural variants recurrently affected a number of leukemia associated genes as well as cancer driver genes not previously associated with leukemia and genes not previously associated with cancer. A number of variants only affected intergenic regions but caused cis-acting alterations in expression of neighboring genes. Analysis of TCGA data indicates that the status of several of the recurrently mutated genes identified in this study significantly affect survival of AML patients. Our results suggest that current genomic analysis methods fail to identify a majority of structural variants in leukemia samples and this lacunae may hamper diagnostic and prognostic efforts.
0

Non-coding germline GATA3 variants alter chromatin topology and contribute to pathogenesis of acute lymphoblastic leukemia

Hongbo Yang et al.Feb 25, 2020
+22
B
T
H
Inherited non-coding genetic variants confer significant disease susceptibility in many cancers. However, the molecular processes of by which germline variants contribute to somatic lesions are poorly understood. We performed targeted sequencing in 5,008 patients and identified a key regulatory germline variant in GATA3 strongly associated with Philadelphia chromosome-like acute lymphoblastic leukemia (Ph-like ALL). By creating an isogenic cellular model with CRISPR-Cas9 system, we showed that this variant activated a strong enhancer that significantly upregulated GATA3 transcription, which in turn reshaped the global chromatin accessibility and 3D genome organization. Remarkably, this genotype switch induced a chromatin loop between the CRLF2 oncogene and a distal enhancer, similar to the somatically acquired super-enhancer hijacking event in patients. GATA3 genotype-related alterations in transcriptional control and 3D chromatin organization were further validated in Ph-like ALL patients. Finally, we showed that GATA3 directly regulates CRLF2 and potentiates the oncogenic effects of JAK-STAT signaling in leukemogenesis. Altogether, our results provide evidence for a novel mechanism by which a germline non-coding variant contributes to oncogene activation epigenetic regulation and 3D genome reprogramming.
1

Comparative genomic and pan-genomic characteristion of Staphylococcus epidermidis from different sources unveils the molecular basis and potential biomarkers of pathogenic strains

Shudan Lin et al.Aug 16, 2021
+10
B
J
S
Abstract Coagulase-negative Staphylococcus (CoNS) is the most common pathogen causing traumatic endophthalmitis, Staphylococcus epidermidis is the most common species which colonizes human skin, eye surfaces and nasal cavity and is the main cause of nosocomial infection, specially foreign body-related bloodstream infections (FBR-BSIs). Although some studies have reported the genome characteristics of S. epidermidis , a comprehensive understanding of its pathogenicity and the genome of ocular trauma-sourced strains is still lacking. In this study, we sequenced, analyzed and reported the whole genomes of 11 ocular trauma-sourced samples of S. epidermidis that caused traumatic endophthalmitis. By integrating publicly available genomes, we obtained a total of 187 S. epidermidis samples from healthy and diseased eyes, skin, respiratory tract and blood. Combined with pangenome, phylogenetic and comparative genomic analyses, our study supported that S. epidermidis , regardless of niche source, exhibits two founder lineages with different pathogenicities. Moreover, we identified potential biomarkers associated with the virulence of S. epidermidis , namely, essD , uhpt , sdrF , sdrG , fbe and icaABCDR . The essD and uhpt genes have high homology with esaD and hpt in Staphylococcus aureus , showing that the genomes of S. epidermidis and S. aureus may have communicated during evolution, while the sdrF , sdrG , fbe , and icaABCDR genes are related to biofilm formation. Compared to S. epidermidis from blood sources, ocular-sourced strains causing intraocular infection had no direct relationship with biofilm formation. In conclusion, this study not only provided additional data resources for studies on S. epidermidis is, but also improved understanding of the evolution and pathogenicity of different source strains. Importants In this study, we comprehensively analysied and reported the whole genome sequence (WGS) of the strains that caused traumatic endophthalmitis. Through comparative genomic analyses among 187 S. epidermidis samples from healthy and diseased eyes, skin, respiratory tract and blood, we identified 10 potential biomarkers of pathogenic strains. Finally, we revealed S. epidermidis -induced traumatic endophthalmitis may be independent of biofilm formation. Overall, our data may facilitate comparative research of S. epidermidis and provide clinical value for identifying pathogenic or contaminating strains.
0

An integrative ENCODE resource for cancer genomics

Jing Zhang et al.Jul 18, 2019
+58
J
J
J
ENCODE comprises thousands of functional genomics datasets, and the encyclopedia covers hundreds of cell types, providing a universal annotation for genome interpretation. However, for particular applications, it may be advantageous to use a customized annotation. Here, we develop such a custom annotation by leveraging advanced assays, such as eCLIP, Hi-C, and whole-genome STARR-seq on a number of data-rich ENCODE cell types. A key aspect of this annotation is comprehensive and experimentally derived networks of both transcription factors and RNA-binding proteins (TFs and RBPs). Cancer, a disease of system-wide dysregulation, is an ideal application for such a network-based annotation. Specifically, for cancer-associated cell types, we put regulators into hierarchies and measure their network change (rewiring) during oncogenesis. We also extensively survey TF-RBP crosstalk, highlighting how SUB1, a previously uncharacterized RBP, drives aberrant tumor expression and amplifies the effect of MYC, a well-known oncogenic TF. Furthermore, we show how our annotation allows us to place oncogenic transformations in the context of a broad cell space; here, many normal-to-tumor transitions move towards a stem-like state, while oncogene knockdowns show an opposing trend. Finally, we organize the resource into a coherent workflow to prioritize key elements and variants, in addition to regulators. We showcase the application of this prioritization to somatic burdening, cancer differential expression and GWAS. Targeted validations of the prioritized regulators, elements and variants using siRNA knockdowns, CRISPR-based editing, and luciferase assays demonstrate the value of the ENCODE resource.
Load More