SK
Satoshi Koyama
Author with expertise in Genomic Studies and Association Analyses
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
11
(64% Open Access)
Cited by:
406
h-index:
35
/
i10-index:
68
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Large-scale genome-wide association study in a Japanese population identifies novel susceptibility loci across different diseases

Kazuyoshi Ishigaki et al.Jun 8, 2020
+86
M
M
K
The overwhelming majority of participants in current genetic studies are of European ancestry. To elucidate disease biology in the East Asian population, we conducted a genome-wide association study (GWAS) with 212,453 Japanese individuals across 42 diseases. We detected 320 independent signals in 276 loci for 27 diseases, with 25 novel loci (P < 9.58 × 10−9). East Asian–specific missense variants were identified as candidate causal variants for three novel loci, and we successfully replicated two of them by analyzing independent Japanese cohorts; p.R220W of ATG16L2 (associated with coronary artery disease) and p.V326A of POT1 (associated with lung cancer). We further investigated enrichment of heritability within 2,868 annotations of genome-wide transcription factor occupancy, and identified 378 significant enrichments across nine diseases (false discovery rate < 0.05) (for example, NKX3-1 for prostate cancer). This large-scale GWAS in a Japanese population provides insights into the etiology of complex diseases and highlights the importance of performing GWAS in non-European populations. Genome-wide analysis in 212,453 Japanese individuals identifies loci associated with 42 diseases. Comparative analysis with European populations identifies East Asian–specific associations.
0
Citation392
0
Save
44

Mobile elements in human population-specific genome and phenotype divergence

Shohei Kojima et al.Mar 27, 2022
+22
M
S
S
Abstract Mobile genetic elements (MEs) are heritable mutagens that contribute to divergence between lineages by recursively generating structural variants. ME variants (MEVs) are difficult to genotype, obscuring their impact on recent genome and trait diversification. We developed a tool that uses short-read sequence data to accurately genotype MEVs, enabling us to study them using statistical genetics methods in global human genomes. We observe population-specific differences in the distribution of Alu insertions that distinguish Japanese from other populations. We integrated MEVs with epigenomic and expression quantitative trait loci (eQTL) maps to determine how they impact traits. This reveals coherent patterns by which specific MEs regulate tissue-specific gene expression, including creating or attenuating enhancers and recruiting post-transcriptional regulators. We pinpoint MEVs as genetic causes of disease risk, including a LINE-1 insertion linked to keloid and other diseases of fibroblast inflammation, by introducing MEVs into the genome-wide association study (GWAS) framework. In addition to nominating previously-hidden MEVs as causes of human diseases, this work highlights MEs as accelerators of human population divergence and begins to decipher the semantics of MEs.
44
Citation8
0
Save
4

Deep learning-based chest X-ray age serves as a novel biomarker for cardiovascular aging

Hirotaka Ieki et al.Mar 25, 2021
+18
S
Y
H
Abstract Chest X-ray (CXR) is one of the most commonly performed medical imaging tests. Although aging, sex and disease status have been known to cause changes in CXR findings, the extent of these effects has not been fully characterized. Here, we present a deep neural network (DNN) model trained using more than 100,000 CXRs to estimate the patient’s age and sex solely from CXRs. Our DNN exhibited high performance in terms of estimating age and sex, with Pearson’s correlation coefficient between the actual and estimated age of above 0.9 and an area under the ROC curve of 0.98 for sex estimation. The difference between the actual and estimated age is large in CXRs with abnormal findings, suggesting that the estimated age (“CXR age”) can be a biomarker for disease status. Furthermore, by applying our DNN to CXRs of consecutive 1,562 hospitalized heart failure patients, we demonstrated that an elevated CXR age is not only associated with aging-related diseases, such as hypertension and atrial fibrillation, but also a worse outcome of heart failure. Given these results, our new concept “CXR age” serves as a novel biomarker for cardiovascular aging and can help clinicians to predict, prevent, and manage cardiovascular diseases.
4
Citation4
0
Save
0

Integrative Metabolomics Differentiate Coronary Artery Disease, Peripheral Artery Disease, and Venous Thromboembolism Risks

Jiwoo Lee et al.Jul 25, 2024
+7
J
T
J
Arterial and venous cardiovascular conditions, such as coronary artery disease (CAD), peripheral artery disease (PAD), and venous thromboembolism (VTE), are genetically correlated. Interrogating underlying mechanisms may shed light on disease mechanisms. In this study, we aimed to identify (1) epidemiological and (2) causal, genetic relationships between metabolites and CAD, PAD, and VTE.
0

The AORTA Gene score for detection and risk stratification of ascending aortic dilation

James Pirruccello et al.Aug 12, 2024
+9
H
S
J
This study assessed whether a model incorporating clinical features and a polygenic score for ascending aortic diameter would improve diameter estimation and prediction of adverse thoracic aortic events over clinical features alone.
1

Genotype imputation accuracy and the quality metrics of the minor ancestry in multi-ancestry reference panels

Mingyang Shi et al.May 30, 2023
+8
H
C
M
Abstract Large-scale imputation reference panels are now available and have contributed to efficient genome-wide association studies through genotype imputation. However, it is still under debate whether large-size multi-ancestry or small-size population-specific reference panels are the optimal choices for under-represented populations. We imputed genotypes of East Asian (EAS; 180k Japanese) subjects using the Trans-Omics for Precision Medicine (TOPMed) reference panel and found that the standard imputation quality metric (Rsq) substantially overestimated the dosage r 2 (squared correlation between imputed dosage and true genotype). Variance component analysis of Rsq revealed that the increased imputed-genotype certainty (dosages closer to 0, 1, or 2) caused upward bias, indicating some systemic bias in the imputation. Through systematic simulations using different template switching rates (θ value) in the hidden Markov model, we uncovered that the lower θ value increased the imputed-genotype certainty and Rsq; however, dosage r 2 was insensitive to the θ value, thereby causing a deviation. In simulated reference panels with different sizes and ancestral diversities, the θ value estimates from Minimac decreased with the size of a single ancestry and increased with the ancestral diversity. Thus, Rsq could overestimate or underestimate dosage r 2 for a subpopulation in the multi-ancestry panel and the deviation represents different imputed-dosage distributions. Finally, despite the impact of θ value, distant ancestries in the reference panel contributed only a few additional variants passing a predefined Rsq threshold. We conclude that the θ value has a substantial impact on the imputed dosage and the imputation quality metric value.
0

Predicting cell-type-specific non-coding RNA transcription from genome sequence

Masaru Koido et al.Mar 30, 2020
+8
S
C
M
Transcription is regulated through complex mechanisms involving non-coding RNAs (ncRNAs). However, because transcription of ncRNAs, especially enhancer RNAs, is often low and cell type-specific, its dependency on genotype remains largely unexplored. Here, we developed mutation effect prediction on ncRNA transcription (MENTR), a quantitative machine learning framework reliably connecting genetic associations with expression of ncRNAs, resolved to the level of cell type. MENTR-predicted mutation effects on ncRNA transcription were concordant with estimates from previous genetic studies in a cell type-dependent manner. We inferred reliable causal variants from 41,223 GWAS variants, and proposed 7,775 enhancers and 3,548 long-ncRNAs as complex trait-associated ncRNAs in 348 major human primary cells and tissues, including plausible enhancer-mediated functional alterations in single-variant resolution in Crohn’s disease. In summary, we present new resources for discovering causal variants, the biological mechanisms driving complex traits, and the sequence-dependency of ncRNA regulation in relevant cell types.
0

Improving Cardiovascular Disease Primary Prevention Treatment Thresholds in a New England Health Care System

So Cho et al.Sep 6, 2024
+9
S
R
S
Atherosclerotic cardiovascular disease (ASCVD) risk estimation based on the pooled cohort equation (PCE) overestimates in population-based cohorts. Whether it performs equally across disaggregated demographics in health care populations is less known.
0

Population-specific and transethnic genome-wide analyses reveal distinct and shared genetic risks of coronary artery disease

Satoshi Koyama et al.Nov 16, 2019
+39
A
K
S
To elucidate the genetics of coronary artery disease (CAD) in the Japanese population, we conducted a large-scale genome-wide association study (GWAS) of 168,228 Japanese (25,892 cases and 142,336 controls) with genotype imputation using a newly developed reference panel of Japanese haplotypes including 1,782 CAD cases and 3,148 controls. We detected 9 novel disease-susceptibility loci and Japanese-specific rare variants contributing to disease severity and increased cardiovascular mortality. We then conducted a transethnic meta-analysis and discovered 37 additional novel loci. Using the result of the meta-analysis, we derived a polygenic risk score (PRS) for CAD, which outperformed those derived from either Japanese or European GWAS. The PRS prioritized risk factors among various clinical parameters and segregated individuals with increased risk of long-term cardiovascular mortality. Our data improves clinical characterization of CAD genetics and suggests the utility of transethnic meta-analysis for PRS derivation in non-European populations.
0

Transethnic meta-analysis of genome-wide association studies identifies three new loci and characterizes population-specific differences for coronary artery disease

Hiroshi Matsunaga et al.Aug 20, 2019
+33
K
A
H
Background: Genome-wide association studies (GWAS) provided many biological insights into coronary artery disease (CAD), but these studies were mainly performed in Europeans. GWAS in diverse populations have the potential to advance our understanding of CAD. Methods and Results: We conducted two GWAS for CAD in the Japanese population, which included 12,494 cases and 28,879 controls, and 2,808 cases and 7,261 controls, respectively. Then, we performed transethnic meta-analysis using the results of the CARDIoGRAMplusC4D 1000 Genomes meta-analysis with UK Biobank. We identified 3 new loci on chromosome 1q21 (CTSS), 10q26 (WDR11-FGFR2), and 11q22 (RDX-FDX1). Quantitative trait locus analyses suggested the association of CTSS and RDX-FDX1 with atherosclerotic immune cells. Tissue/cell type enrichment analysis showed the involvement of arteries, adrenal glands and fat tissues in the development of CAD. Finally, we performed tissue/cell type enrichment analysis using East Asian-frequent and European-frequent variants according to the risk allele frequencies, and identified significant enrichment of adrenal glands in the East Asian-frequent group while the enrichment of arteries and fat tissues was found in the European-frequent group. These findings indicate biological differences in CAD susceptibility between Japanese and Europeans. Conclusions: We identified 3 new loci for CAD and highlighted the genetic differences between the Japanese and European populations. Moreover, our transethnic analyses showed both shared and unique genetic architectures between the Japanese and Europeans. While most of the underlying genetic bases for CAD are shared, further analyses in diverse populations will be needed to elucidate variations fully.
Load More