XM
Xinmeng Mu
Author with expertise in Analysis of Gene Interaction Networks
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
11
(73% Open Access)
Cited by:
6,111
h-index:
39
/
i10-index:
43
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Architecture of the human regulatory network derived from ENCODE data

Mark Gerstein et al.Sep 1, 2012
+53
M
A
M
Transcription factors bind in a combinatorial fashion to specify the on-and-off states of genes; the ensemble of these binding events forms a regulatory network, constituting the wiring diagram for a cell. To examine the principles of the human transcriptional regulatory network, we determined the genomic binding information of 119 transcription-related factors in over 450 distinct experiments. We found the combinatorial, co-association of transcription factors to be highly context specific: distinct combinations of factors bind at specific genomic locations. In particular, there are significant differences in the binding proximal and distal to genes. We organized all the transcription factor binding into a hierarchy and integrated it with other genomic information (for example, microRNA regulation), forming a dense meta-network. Factors at different levels have different properties; for instance, top-level transcription factors more strongly influence expression and middle-level ones co-regulate targets to mitigate information-flow bottlenecks. Moreover, these co-regulations give rise to many enriched network motifs (for example, noise-buffering feed-forward loops). Finally, more connected network components are under stronger selection and exhibit a greater degree of allele-specific activity (that is, differential binding to the two parental alleles). The regulatory information obtained in this study will be crucial for interpreting personal genome sequences and understanding basic principles of human biology and disease. A description is given of the ENCODE consortium’s efforts to examine the principles of human transcriptional regulatory networks; the results are integrated with other genomic information to form a hierarchical meta-network where different levels have distinct properties. This manuscript describes the effort of the ENCODE (Encyclopedia of DNA Elements) Consortium to examine the principles of human transcriptional regulatory networks, using a subset of 119 transcription factors. The results are integrated with other genomic information to form a multi-level meta-network in which different levels have distinct properties. The findings will aid future interpretations of human genomics and help us to understand the basic principles of human biology and disease.
0
Citation1,449
0
Save
0

A Systematic Survey of Loss-of-Function Variants in Human Protein-Coding Genes

Daniel MacArthur et al.Feb 16, 2012
+48
A
S
D
Defective Gene Detective Identifying genes that give rise to diseases is one of the major goals of sequencing human genomes. However, putative loss-of-function genes, which are often some of the first identified targets of genome and exome sequencing, have often turned out to be sequencing errors rather than true genetic variants. In order to identify the true scope of loss-of-function genes within the human genome, MacArthur et al. (p. 823 ; see the Perspective by Quintana-Murci ) extensively validated the genomes from the 1000 Genomes Project, as well as an additional European individual, and found that the average person has about 100 true loss-of-function alleles of which approximately 20 have two copies within an individual. Because many known disease-causing genes were identified in “normal” individuals, the process of clinical sequencing needs to reassess how to identify likely causative alleles.
0
Citation1,207
0
Save
0

Mapping copy number variation by population-scale genome sequencing

Ryan Mills et al.Feb 1, 2011
+54
I
F
R
Genomic structural variants (SVs) are abundant in humans, differing from other forms of variation in extent, origin and functional impact. Despite progress in SV characterization, the nucleotide resolution architecture of most SVs remains unknown. We constructed a map of unbalanced SVs (that is, copy number variants) based on whole genome DNA sequencing data from 185 human genomes, integrating evidence from complementary SV discovery approaches with extensive experimental validations. Our map encompassed 22,025 deletions and 6,000 additional SVs, including insertions and tandem duplications. Most SVs (53%) were mapped to nucleotide resolution, which facilitated analysing their origin and functional impact. We examined numerous whole and partial gene deletions with a genotyping approach and observed a depletion of gene disruptions amongst high frequency deletions. Furthermore, we observed differences in the size spectra of SVs originating from distinct formation mechanisms, and constructed a map of SV hotspots formed by common mechanisms. Our analytical framework and SV map serves as a resource for sequencing-based association studies. Copy number variations (or CNVs) are large-scale deletions, duplications and insertions that contribute significantly to genetic variation in the human genome, and many CNVs are linked to susceptibility to disease. A high-resolution map of CNVs has now been produced by harnessing information from whole-genome sequencing in 185 individuals. Nucleotide resolution of the map facilitates analysis of structural variant distribution and identification of the mechanisms of their origin. The study provides a resource for sequence-based association studies. Harnessing information from whole genome sequencing in 185 individuals, this study generates a high-resolution map of copy number variants. Nucleotide resolution of the map facilitates analysis of structural variant distribution and identification of the mechanisms of their origin. The study provides a resource for sequence-based association studies.
0
Citation1,085
0
Save
0

Genomic Correlates of Immune-Cell Infiltrates in Colorectal Carcinoma

Marios Giannakis et al.Apr 1, 2016
+27
S
X
M
Large-scale genomic characterization of tumors from prospective cohort studies may yield new insights into cancer pathogenesis. We performed whole-exome sequencing of 619 incident colorectal cancers (CRCs) and integrated the results with tumor immunity, pathology, and survival data. We identified recurrently mutated genes in CRC, such as BCL9L, RBM10, CTCF, and KLF5, that were not previously appreciated in this disease. Furthermore, we investigated the genomic correlates of immune-cell infiltration and found that higher neoantigen load was positively associated with overall lymphocytic infiltration, tumor-infiltrating lymphocytes (TILs), memory T cells, and CRC-specific survival. The association with TILs was evident even within microsatellite-stable tumors. We also found positive selection of mutations in HLA genes and other components of the antigen-processing machinery in TIL-rich tumors. These results may inform immunotherapeutic approaches in CRC. More generally, this study demonstrates a framework for future integrative molecular epidemiology research in colorectal and other malignancies.
0
Citation806
0
Save
0

RNF43 is frequently mutated in colorectal and endometrial cancers

Marios Giannakis et al.Oct 26, 2014
+15
X
E
M
Levi Garraway and colleagues report the identification of somatic mutations of RNF43, which encodes an E3 ubiquitin ligase that negatively regulates Wnt signaling, in over 18% of colorectal adenocarcinomas and endometrial carcinomas. We report somatic mutations of RNF43 in over 18% of colorectal adenocarcinomas and endometrial carcinomas. RNF43 encodes an E3 ubiquitin ligase that negatively regulates Wnt signaling. Truncating mutations of RNF43 are more prevalent in microsatellite-unstable tumors and show mutual exclusivity with inactivating APC mutations in colorectal adenocarcinomas. These results indicate that RNF43 is one of the most commonly mutated genes in colorectal and endometrial cancers.
0
Citation416
0
Save
0

Genetic Mechanisms of Immune Evasion in Colorectal Cancer

Catherine Grasso et al.Mar 7, 2018
+50
D
M
C
Abstract To understand the genetic drivers of immune recognition and evasion in colorectal cancer, we analyzed 1,211 colorectal cancer primary tumor samples, including 179 classified as microsatellite instability–high (MSI-high). This set includes The Cancer Genome Atlas colorectal cancer cohort of 592 samples, completed and analyzed here. MSI-high, a hypermutated, immunogenic subtype of colorectal cancer, had a high rate of significantly mutated genes in important immune-modulating pathways and in the antigen presentation machinery, including biallelic losses of B2M and HLA genes due to copy-number alterations and copy-neutral loss of heterozygosity. WNT/β-catenin signaling genes were significantly mutated in all colorectal cancer subtypes, and activated WNT/β-catenin signaling was correlated with the absence of T-cell infiltration. This large-scale genomic analysis of colorectal cancer demonstrates that MSI-high cases frequently undergo an immunoediting process that provides them with genetic events allowing immune escape despite high mutational load and frequent lymphocytic infiltration and, furthermore, that colorectal cancer tumors have genetic and methylation events associated with activated WNT signaling and T-cell exclusion. Significance: This multi-omic analysis of 1,211 colorectal cancer primary tumors reveals that it should be possible to better monitor resistance in the 15% of cases that respond to immune blockade therapy and also to use WNT signaling inhibitors to reverse immune exclusion in the 85% of cases that currently do not. Cancer Discov; 8(6); 730–49. ©2018 AACR. This article is highlighted in the In This Issue feature, p. 663
0
Citation416
0
Save
0

Integrative Annotation of Variants from 1092 Humans: Application to Cancer Genomics

Ekta Khurana et al.Oct 3, 2013
+45
V
Y
E
Identifying Important Identifiers Each of us has millions of sequence variations in our genomes. Signatures of purifying or negative selection should help identify which of those variations is functionally important. Khurana et al. ( 1235587 ) used sequence polymorphisms from 1092 humans across 14 populations to identify patterns of selection, especially in noncoding regulatory regions. Noncoding regions under very strong negative selection included binding sites of some chromatin and general transcription factors (TFs) and core motifs of some important TF families. Positive selection in TF binding sites tended to occur in network hub promoters. Many recurrent somatic cancer variants occurred in noncoding regulatory regions and thus might indicate mutations that drive cancer.
0
Citation366
0
Save
0

The real cost of sequencing: higher than you think!

Andrea Sboner et al.Jan 1, 2011
+2
D
X
A
Advances in sequencing technology have led to a sharp decrease in the cost of 'data generation'. But is this sufficient to ensure cost-effective and efficient 'knowledge generation'?
0
Citation366
0
Save
0

Inherited DNA Repair Defects in Colorectal Cancer

Saud AlDubayan et al.Jan 30, 2018
+13
N
M
S
Colorectal cancer (CRC) heritability has been estimated to be around 30%. However, mutations in the known CRC susceptibility genes explain CRC risk in under 10% of the cases. Germline mutations in DNA-repair genes (DRGs) have recently been reported in CRC but their contribution to CRC risk is largely unknown. We evaluated the gene-level germline mutation enrichment of 40 DRGs in 680 unselected CRC individuals compared to 27728 ancestry-matched cancer-free adults. Significant findings were then examined in independent cohorts of 1661 unselected CRC cases and 1456 early-onset CRC cases. Of 680 individuals in the discovery set, 31 (4.56%) individuals harbored germline pathogenic mutations in known CRC susceptibility genes while another 33 (4.85%) individuals had DRG mutations that have not been previously associated with CRC risk. Germline pathogenic mutations in ATM and PALB2 were enriched in both the discovery (OR= 2.81; P= 0.035 and OR= 4.91; P= 0.024, respectively) and validation sets (OR= 2.97; Adjusted P= 0.0013 and OR= 3.42; Adjusted P= 0.034, for ATM and PALB2 respectively). Biallelic loss of ATM was evident in all cases with matched tumor profiling. CRC cases also had higher rates of actionable mutations in the HR pathway that can substantially increase the risk of developing cancers other than CRC. Our analysis provides evidence for ATM and PALB2 as CRC risk genes, underscoring the importance of the homologous recombination pathway in CRC. In addition, we identified frequent complete homologous recombination deficiency in CRC tumors, representing a unique opportunity to explore targeted therapeutic interventions such as PARPi.
0

Discovery of a novel non-negative matrix factorization (NMF)-based homologous recombination deficiency (HRD) score and subsequent exploration in TALAPRO-2 (TP-2), a phase 3 study of talazoparib (TALA) + enzalutamide (ENZA) vs placebo (PBO) + ENZA as first-line treatment in patients (pts) with metastatic castration-resistant prostate cancer (mCRPC).

Karim Fizazi et al.Jun 1, 2024
+12
A
W
K
5021 Background: TP-2 (NCT03395197) demonstrated significantly improved radiographic progression-free survival (rPFS) in pts with mCRPC who received TALA + ENZA (n=402) vs PBO + ENZA (n=403). We discovered a novel NMF-based HRD score and used it to explore potential associations of HRD with efficacy in TP-2. Methods: The Cancer Genome Atlas Prostate Adenocarcinoma (TCGA-PRAD) dataset was used to train a novel NMF-based HRD predictive score incorporating gene expression (RNA seq) and homologous recombination repair (HRR)12 genomic features (mutations possibly or probably damaging by PolyPhen, deleterious by SIFT, or shallow/deep deletion; HRR12 genes: BRCA1, BRCA2, PALB2, ATM, ATR, CHEK2, FANCA, RAD51C, NBN, MLH1, MRE11A, CDK12). A previously published composite HRD score incorporating genomic loss of heterozygosity, large scale transitions, and telomeric allelic imbalances (Knijnenburg et al. Cell Rep. 2018;23:239-254.e6) was used as the “original” HRD reference score. HRR12 genomic features in TCGA-PRAD were associated with higher original and predicted HRD scores. Two datasets were used to generate the HRD score for TP-2: a FoundationOneLiquid CDx (F1LCDx) dataset (Azad et al. ASCO 2023, #5056) of prospectively collected/retrospectively analyzed plasma samples (n=681) and a tumor transcriptomic dataset generated via HTG’s Oncology Biomarker Panel (with 10 additional genes implicated in PARPi sensitivity; n=304). This NMF-based HRD score was then applied to the evaluable TP-2 safety population (n=285). Predicted HRD scores for TP-2 were categorized as high (≥0.46 [median]) or low (<median). Results: Although predicted HRD score is primarily based on gene expression, it proved significantly associated with HRR12 gene alteration (HRR12m) status based on F1LCDx variant calling of retrospectively sequenced ctDNA (Wilcoxon test P=3.3e-10). Of 89 pts with HRR12m by F1LCDx, 74% were HRD-high and 26% were HRD-low. Conversely, of 196 pts who were non-HRR12m by F1LCDx, 39% were HRD-high and 61% were HRD-low, suggesting the presence of a subgroup of pts who had HRD in the absence of detected HRR12m. In all-comers, TALA + ENZA demonstrated more favorable rPFS than PBO + ENZA in both HRD-high (hazard ratio [HR]=0.49, P=0.0036) and HRD-low (HR=0.48 , P=0.0062) pts. A similar trend was evident in the subgroup of pts lacking HRR12m. Conclusions: Our exploratory analysis of TCGA-PRAD resulted in discovery of a novel HRD score, incorporating both gene expression and HRR12 genomic attributes. In TP-2, this score was associated with ctDNA HRR12m status. HRD-high and HRD-low pts exhibited comparable rPFS benefit in terms of HR favoring TALA + ENZA over PBO + ENZA. Clinical trial information: NCT03395197 .
Load More