HN
Hidewaki Nakagawa
Author with expertise in Genomic Landscape of Cancer and Mutational Signatures
RIKEN Center for Integrative Medical Sciences, The University of Tokyo, Cancer Genomics Centre
+ 7 more
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
20
(30% Open Access)
Cited by:
24
h-index:
62
/
i10-index:
169
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

A comprehensive multicenter comparison of whole genome sequencing pipelines using a uniform tumor-normal sample pair

Ivo Buchhalter et al.May 6, 2020
+40
T
B
I
As next-generation sequencing becomes a clinical tool, a full understanding of the variables affecting sequencing analysis output is required. Through the International Cancer Genome Consortium (ICGC), we compared sequencing pipelines at five independent centers (CNAG, DKFZ, OICR, RIKEN and WTSI) using a single tumor-blood DNA pair. Analyses by each center and with one standardized algorithm revealed significant discrepancies. Although most pipelines performed well for coding mutations, library preparation methods and sequencing coverage metrics clearly influenced downstream results. PCR-free methods showed reduced GC-bias and more even coverage. Increasing sequencing depth to ~100x (two- to three-fold higher than current standards) showed a benefit, as long as the tumor:control coverage ratio remained balanced. To become part of routine clinical care, high-throughput sequencing must be globally compatible and comparable. This benchmarking exercise has highlighted several fundamental parameters to consider in this regard, which will allow for better optimization and planning of both basic and translational studies.
0

A Comprehensive Assessment of Somatic Mutation Calling in Cancer Genomes

Tyler Alioto et al.May 6, 2020
+58
T
S
T
The emergence of next generation DNA sequencing technology is enabling high-resolution cancer genome analysis. Large-scale projects like the International Cancer Genome Consortium (ICGC) are systematically scanning cancer genomes to identify recurrent somatic mutations. Second generation DNA sequencing, however, is still an evolving technology and procedures, both experimental and analytical, are constantly changing. Thus the research community is still defining a set of best practices for cancer genome data analysis, with no single protocol emerging to fulfil this role. Here we describe an extensive benchmark exercise to identify and resolve issues of somatic mutation calling. Whole genome sequence datasets comprising tumor-normal pairs from two different types of cancer, chronic lymphocytic leukaemia and medulloblastoma, were shared within the ICGC and submissions of somatic mutation calls were compared to verified mutations and to each other. Varying strategies to call mutations, incomplete awareness of sources of artefacts, and even lack of agreement on what constitutes an artefact or real mutation manifested in widely varying mutation call rates and somewhat low concordance among submissions. We conclude that somatic mutation calling remains an unsolved problem. However, we have identified many issues that are easy to remedy that are presented here. Our study highlights critical issues that need to be addressed before this valuable technology can be routinely used to inform clinical decision-making.
0
Paper
Citation11
0
Save
0

Endogenization and excision of human herpesvirus 6 in human genomes

Xiaoxi Liu et al.May 7, 2020
+19
R
S
X
ABSTRACT The genome of human herpesvirus 6 (HHV-6) is integrated within the nuclear genome of about 1% of humans, but how this came about is not clear. HHV-6 integrates into telomeres, and this has recently been associated with polymorphisms affecting MOV10L1 . MOV10L1 is located on the subtelomere of chromosome 22q (chr22q) and is required to make PIWI-interacting RNAs (piRNAs). piRNAs block integration of transposons in the germline, so piRNA-mediated repression of HHV-6 integration has been suspected. Whether integrated HHV-6 can reactive into an infectious virus is also uncertain. In vitro , recombination of the viral genome along its terminal direct repeats (DRs) leads to excision from the telomere and viral reactivation, but the expected single DR “scar” has not been described in vivo . We analyzed whole-genome sequencing (WGS) data from 13,040 subjects, including 7,485 from Japan. We found an association between integrated HHV-6 and polymorphisms on chr22q in Japanese subjects. However, association with the reported MOV10L1 polymorphism was driven by physical linkage to a single ancient endogenous HHV-6A variant integrated into the telomere of chr22q in East Asians. We resolved the junction of the human chromosome with this viral genome using long read sequencing. Unexpectedly, an HHV-6B variant has also endogenized in chr22q; two endogenous HHV-6 variants at this locus thus account for 72% of all integrated HHV-6 in Japan. We also report human genomes carrying only one portion of the HHV-6B genome, a single DR, supporting in vivo excision and viral reactivation. Using WGS data from North American families, we show that the incidence of HHV-6 integration into the germline is lower than its prevalence, and that integrated HHV-6 is not associated with the reported variant in MOV10L1 . Together these results explain the recently reported association between integrated HHV-6 and MOV10L1/ piRNAs, suggest exaptation of HHV-6 in its coevolution with human chr22q, and clarify the evolution and risk of reactivation of the only intact non-retroviral genome known to be present in human germlines. SIGNIFICANCE STATEMENT Human herpesvirus 6 (HHV-6) infects most people during childhood, usually only causing fever and rash. Reactivation of HHV-6 has been linked to a number of neurological diseases including encephalitis, Alzheimer’s disease and multiple sclerosis. However, about 1% of people are born with the HHV-6 genome present within their genome, included in the end “cap” of one of their 46 chromosomes. Little is known about how and when HHV-6 genomes entered human genomes, whether or not they still do, and whether or not this poses risk for virus reactivation. We looked for HHV-6 in genome sequences from over 13,000 people. Most HHV-6 variants present in human genomes have been co-evolving with human chromosomes for many generations, and new integration events are rare. Surprisingly, in almost three fourths of Japanese people with HHV-6 in their genome, HHV-6 integrated in the same end of the same chromosome – 22q. Persistence of the HHV-6 genome within the short “cap” that preserves the end of chromosome 22q suggests that the integrated viral sequence may have taken on a useful function for this chromosome. We also found that some human genomes harbor only one part of the HHV-6 genome. This part is the same part that remains after experimental viral reactivation, during which most of the virus is cut out of the genome. This warrants assessment of the risk that integration of HHV-6 into inherited human genomes is not irreversible, and possibly leads to production of infectious virus.
0
Paper
Citation1
0
Save
0

Mutational signatures associated with tobacco smoking in human cancer

Ludmil Alexandrov et al.May 6, 2020
+11
K
Y
L
Tobacco smoking increases the risk of at least 15 classes of cancer. We analyzed somatic mutations and DNA methylation in 5,243 cancers of types for which tobacco smoking confers an elevated risk. Smoking is associated with increased mutation burdens of multiple distinct mutational signatures, which contribute to different extents in different cancers. One of these signatures, mainly found in cancers derived from tissues directly exposed to tobacco smoke, is attributable to misreplication of DNA damage caused by tobacco carcinogens. Others likely reflect indirect activation of DNA editing by APOBEC cytidine deaminases and of an endogenous clock-like mutational process. The results are consistent with the proposition that smoking increases cancer risk by increasing the somatic mutation load, although direct evidence for this mechanism is lacking in some smoking-related cancer types.
0

Whole genome and RNA sequencing of 1,220 cancers reveals hundreds of genes deregulated by rearrangement of cis-regulatory elements

Yiqun Zhang et al.May 6, 2020
+6
N
K
Y
Using a dataset of somatic Structural Variants (SVs) in cancers from 2658 patients — 1220 with corresponding gene expression data — we identified hundreds of genes for which the nearby presence (within 100kb) of an SV breakpoint was associated with altered expression. For the vast majority of these genes, expression was increased rather than decreased with corresponding SV event. Well-known up-regulated cancer-associated genes impacted by this phenomenon included TERT, MDM2, CDK4, ERBB2, CD274, PDCD1LG2, and IGF2. SVs upstream of TERT involved ~3% of cancer cases and were most frequent in liver-biliary, melanoma, sarcoma, stomach, and kidney cancers. SVs associated with up-regulation of PD1 and PDL1 genes involved ~1% of non-amplified cases. For many genes, SVs were significantly associated with either increased numbers or greater proximity of enhancer regulatory elements near the gene. DNA methylation near the gene promoter was often increased with nearby SV breakpoint, which may involve inactivation of repressor elements.
0
0
Save
0

Large scale genome-wide association study in a Japanese population identified 45 novel susceptibility loci for 22 diseases

Kazuyoshi Ishigaki et al.May 6, 2020
+79
M
M
K
The overwhelming majority of participants in current genetic studies are of European ancestry, limiting our genetic understanding of complex disease in non-European populations. To address this, we aimed to elucidate polygenic disease biology in the East Asian population by conducting a genome-wide association study (GWAS) with 212,453 Japanese individuals across 42 diseases. We detected 383 independent signals in 331 loci for 30 diseases, among which 45 loci were novel (P < 5 x 10-8). Compared with known variants, novel variants have lower frequency in European populations but comparable frequency in East Asian populations, suggesting the advantage of this study in discovering these novel variants. Three novel signals were in linkage disequilibrium (r2 > 0.6) with missense variants which are monomorphic in European populations (1000 Genomes Project) including rs11235604 (p.R220W of ATG16L2, a autophagy-related gene) associated with coronary artery disease. We further investigated enrichment of heritability within 2,868 annotations of genome-wide transcription factor occupancy, and identified 378 significant enrichments across nine diseases (FDR < 0.05) (e.g. NF-κB for immune-related diseases). This large-scale GWAS in a Japanese population provides insights into the etiology of common complex diseases and highlights the importance of performing GWAS in non-European populations.
0

Immuno-genomic Pan-cancer Landscape Reveals Diverse Immune Escape Mechanisms and Immuno-Editing Histories

Shinichi Mizuno et al.May 6, 2020
+16
T
R
S
Immune reactions in the tumor micro-environment are one of the cancer hallmarks and emerging immune therapies have been proven effective in many types of cancer. To investigate cancer genome-immune interactions and the role of immuno-editing or immune escape mechanisms in cancer development, we analyzed 2,834 whole genomes and RNA-seq datasets across 31 distinct tumor types from the Pan-Cancer Analysis of Whole Genomes (PCAWG) project with respect to key immunogenomic aspects. We show that selective copy number changes in immune-related genes could contribute to immune escape. Furthermore, we developed an index of the immuno-editing history of each tumor sample based on the information of mutations in exonic regions and pseudogenes. Our immuno-genomic analyses of pan-cancer analyses have the potential to identify a subset of tumors with immunogenicity and diverse background or intrinsic pathways associated with their immune status and immuno-editing history.
0

In-depth characterization of the cisplatin mutational signature in human cell lines and in esophageal and liver tumors

Arnoud Boot et al.May 7, 2020
+7
A
M
A
Cisplatin reacts with DNA, and thereby likely generates a characteristic pattern of somatic mutations, called a mutational signature. Despite widespread use of cisplatin in cancer treatment and its role in contributing to secondary malignancies, its mutational signature has not been delineated. We hypothesize that cisplatin's mutational signature can serve as a biomarker to identify cisplatin mutagenesis in suspected secondary malignancies. Knowledge of which tissues are at risk of developing cisplatin-induced secondary malignancies could lead to guidelines for non-invasive monitoring for secondary malignancies after cisplatin chemotherapy. Methods: We performed whole genome sequencing of 10 independent clones of cisplatin-exposed MCF 10A and HepG2 cells, and delineated the patterns of single- and dinucleotide mutations in terms of flanking sequence, transcription strand bias, and other characteristics. We used the mSigAct signature presence test and non-negative matrix factorization to search for cisplatin mutagenesis in hepatocellular carcinomas and esophageal adenocarcinomas. Results: All clones showed highly consistent patterns of single- and dinucleotide substitutions. The proportion of dinucleotide substitutions was high: 8.1% of single nucleotide substitutions were part of dinucleotide substitutions, presumably due to cisplatin's propensity to form intra- and inter-strand crosslinks between purine bases in DNA. We identified likely cisplatin exposure in 9 hepatocellular carcinomas and 3 esophageal adenocarcinomas. All hepatocellular carcinomas for which clinical data were available and all esophageal cancers indeed had histories of cisplatin treatment. Conclusions: We experimentally delineated the single- and dinucleotide mutational signature of cisplatin. This signature enabled us to detect previous cisplatin exposure in human hepatocellular carcinomas and esophageal adenocarcinomas with high confidence.
0

Comprehensive Analysis of Indels in Whole-genome Microsatellite Regions and Microsatellite Instability across 21 Cancer Types

Akihiro Fujimoto et al.May 7, 2020
+10
T
M
A
Microsatellites are repeats of 1-6bp units and ~10 million microsatellites have been identified across the human genome. Microsatellites are vulnerable to DNA mismatch errors, and have thus been used to detect cancers with mismatch repair deficiency. To reveal the mutational landscape of the microsatellite repeat regions at the genome level, we analyzed approximately 20.1 billion microsatellites in 2,717 whole genomes of pan-cancer samples across 21 tissue types. Firstly, we developed a new insertion and deletion caller (MIMcall) that takes into consideration the error patterns of different types of microsatellites. Among the 2,717 pan-cancer samples, our analysis identified 31 samples, including colorectal, uterus, and stomach cancers, with higher microsatellite mutation rate (≥ 0.03), which we defined as microsatellite instability (MSI) cancers in genome-wide level. Next, we found 20 highly-mutated microsatellites that can be used to detect MSI cancers with high sensitivity. Third, we found that replication timing and DNA shape were significantly associated with mutation rates of the microsatellites. Analysis of germline variation of the microsatellites suggested that the amount of germline variations and somatic mutation rates were correlated. Lastly, analysis of mutations in mismatch repair genes showed that somatic SNVs and short indels had larger functional impact than germline mutations and structural variations. Our analysis provides a comprehensive picture of mutations in the microsatellite regions, and reveals possible causes of mutations, as well as provides a useful marker set for MSI detection.
0

Somatic mutation landscape reveals differential variability of cell-of-origin for primary liver cancer

Kyungsik Ha et al.May 7, 2020
+6
R
M
K
Background: Primary liver tissue cancers display consistent increase in global disease burden and mortality. Identification of cell-of-origins for primary liver cancers would be a necessity to expand options for designing relevant therapeutics and preventive medicine for these cancer types. Previous reports on cell-of-origin for primary liver cancers was mainly from animal studies, and integrative research utilizing human specimen data was poorly established. Methods: We analyzed a whole-genome sequencing data set for a total of 363 tumor and progenitor tissues along with 423 normal tissue epigenomic marks to predict the cell-of-origin for primary liver cancer subtypes. Results: Despite the mixed histological features, the predicted cell-of-origin for mixed hepatocellular carcinoma / intrahepatic cholangiocarcinoma were uniformly predicted as a hepatocytic origin. Individual sample-level prediction revealed differential level of cell-of-origin heterogeneity depending on the primary liver cancer types, with more heterogeneity observed in intrahepatic cholangiocarcinomas. Additional analyses on the whole genome sequencing data of hepatic progenitor cells suggest these progenitor cells might not a direct cell-of-origin for liver cancers. Conclusions: These results provide novel insights on the heterogeneous nature and potential contributors of cell-of-origin predictions for primary liver cancers.
Load More