MC
Mark Chaffin
Author with expertise in Genomic Studies and Association Analyses
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
24
(50% Open Access)
Cited by:
4,468
h-index:
47
/
i10-index:
80
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

Genome-wide polygenic scores for common diseases identify individuals with risk equivalent to monogenic mutations

Amit Khera et al.Aug 8, 2018
A key public health need is to identify individuals at high risk for a given disease to enable enhanced screening or preventive therapies. Because most common diseases have a genetic component, one important approach is to stratify individuals based on inherited DNA variation1. Proposed clinical applications have largely focused on finding carriers of rare monogenic mutations at several-fold increased risk. Although most disease risk is polygenic in nature2–5, it has not yet been possible to use polygenic predictors to identify individuals at risk comparable to monogenic mutations. Here, we develop and validate genome-wide polygenic scores for five common diseases. The approach identifies 8.0, 6.1, 3.5, 3.2, and 1.5% of the population at greater than threefold increased risk for coronary artery disease, atrial fibrillation, type 2 diabetes, inflammatory bowel disease, and breast cancer, respectively. For coronary artery disease, this prevalence is 20-fold higher than the carrier frequency of rare monogenic mutations conferring comparable risk6. We propose that it is time to contemplate the inclusion of polygenic risk prediction in clinical care, and discuss relevant issues. Genome-wide polygenic risk scores derived from GWAS data for five common diseases can identify subgroups of the population with risk approaching or exceeding that of a monogenic mutation.
0
Citation2,343
0
Save
0

Genetics of blood lipids among ~300,000 multi-ethnic participants of the Million Veteran Program

Derek Klarin et al.Oct 1, 2018
The Million Veteran Program (MVP) was established in 2011 as a national research initiative to determine how genetic variation influences the health of US military veterans. Here we genotyped 312,571 MVP participants using a custom biobank array and linked the genetic data to laboratory and clinical phenotypes extracted from electronic health records covering a median of 10.0 years of follow-up. Among 297,626 veterans with at least one blood lipid measurement, including 57,332 black and 24,743 Hispanic participants, we tested up to around 32 million variants for association with lipid levels and identified 118 novel genome-wide significant loci after meta-analysis with data from the Global Lipids Genetics Consortium (total n > 600,000). Through a focus on mutations predicted to result in a loss of gene function and a phenome-wide association study, we propose novel indications for pharmaceutical inhibitors targeting PCSK9 (abdominal aortic aneurysm), ANGPTL4 (type 2 diabetes) and PDE3B (triglycerides and coronary disease). Analysis of genetic data and blood lipid measurements from over 300,000 participants in the Million Veteran Program identifies new associations for blood lipid traits.
0
Citation561
0
Save
1

Transcriptional and Cellular Diversity of the Human Heart

Nathan Tucker et al.May 14, 2020
The human heart requires a complex ensemble of specialized cell types to perform its essential function. A greater knowledge of the intricate cellular milieu of the heart is critical to increase our understanding of cardiac homeostasis and pathology. As recent advances in low-input RNA sequencing have allowed definitions of cellular transcriptomes at single-cell resolution at scale, we have applied these approaches to assess the cellular and transcriptional diversity of the nonfailing human heart.Microfluidic encapsulation and barcoding was used to perform single nuclear RNA sequencing with samples from 7 human donors, selected for their absence of overt cardiac disease. Individual nuclear transcriptomes were then clustered based on transcriptional profiles of highly variable genes. These clusters were used as the basis for between-chamber and between-sex differential gene expression analyses and intersection with genetic and pharmacologic data.We sequenced the transcriptomes of 287 269 single cardiac nuclei, revealing 9 major cell types and 20 subclusters of cell types within the human heart. Cellular subclasses include 2 distinct groups of resident macrophages, 4 endothelial subtypes, and 2 fibroblast subsets. Comparisons of cellular transcriptomes by cardiac chamber or sex reveal diversity not only in cardiomyocyte transcriptional programs but also in subtypes involved in extracellular matrix remodeling and vascularization. Using genetic association data, we identified strong enrichment for the role of cell subtypes in cardiac traits and diseases. Intersection of our data set with genes on cardiac clinical testing panels and the druggable genome reveals striking patterns of cellular specificity.Using large-scale single nuclei RNA sequencing, we defined the transcriptional and cellular diversity in the normal human heart. Our identification of discrete cell subtypes and differentially expressed genes within the heart will ultimately facilitate the development of new therapeutics for cardiovascular diseases.
1
Citation408
0
Save
0

Whole-Genome Sequencing to Characterize Monogenic and Polygenic Contributions in Patients Hospitalized With Early-Onset Myocardial Infarction

Amit Khera et al.Jan 17, 2019
Background: The relative prevalence and clinical importance of monogenic mutations related to familial hypercholesterolemia and of high polygenic score (cumulative impact of many common variants) pathways for early-onset myocardial infarction remain uncertain. Whole-genome sequencing enables simultaneous ascertainment of both monogenic mutations and polygenic score for each individual. Methods: We performed deep-coverage whole-genome sequencing of 2081 patients from 4 racial subgroups hospitalized in the United States with early-onset myocardial infarction (age ≤55 years) recruited with a 2:1 female-to-male enrollment design. We compared these genomes with those of 3761 population-based control subjects. We first identified individuals with a rare, monogenic mutation related to familial hypercholesterolemia. Second, we calculated a recently developed polygenic score of 6.6 million common DNA variants to quantify the cumulative susceptibility conferred by common variants. We defined high polygenic score as the top 5% of the control distribution because this cutoff has previously been shown to confer similar risk to that of familial hypercholesterolemia mutations. Results: The mean age of the 2081 patients presenting with early-onset myocardial infarction was 48 years, and 66% were female. A familial hypercholesterolemia mutation was present in 36 of these patients (1.7%) and was associated with a 3.8-fold (95% CI, 2.1–6.8; P <0.001) increased odds of myocardial infarction. Of the patients with early-onset myocardial infarction, 359 (17.3%) carried a high polygenic score, associated with a 3.7-fold (95% CI, 3.1–4.6; P <0.001) increased odds. Mean estimated untreated low-density lipoprotein cholesterol was 206 mg/dL in those with a familial hypercholesterolemia mutation, 132 mg/dL in those with high polygenic score, and 122 mg/dL in those in the remainder of the population. Although associated with increased risk in all racial groups, high polygenic score demonstrated the strongest association in white participants ( P for heterogeneity=0.008). Conclusions: Both familial hypercholesterolemia mutations and high polygenic score are associated with a >3-fold increased odds of early-onset myocardial infarction. However, high polygenic score has a 10-fold higher prevalence among patients presents with early-onset myocardial infarction. Clinical Trial Registration: URL: https://www.clinicaltrials.gov . Unique identifier: NCT00597922.
0
Citation250
0
Save
1

Transfer learning enables predictions in network biology

Christina Theodoris et al.May 31, 2023
Mapping gene networks requires large amounts of transcriptomic data to learn the connections between genes, which impedes discoveries in settings with limited data, including rare diseases and diseases affecting clinically inaccessible tissues. Recently, transfer learning has revolutionized fields such as natural language understanding1,2 and computer vision3 by leveraging deep learning models pretrained on large-scale general datasets that can then be fine-tuned towards a vast array of downstream tasks with limited task-specific data. Here, we developed a context-aware, attention-based deep learning model, Geneformer, pretrained on a large-scale corpus of about 30 million single-cell transcriptomes to enable context-specific predictions in settings with limited data in network biology. During pretraining, Geneformer gained a fundamental understanding of network dynamics, encoding network hierarchy in the attention weights of the model in a completely self-supervised manner. Fine-tuning towards a diverse panel of downstream tasks relevant to chromatin and network dynamics using limited task-specific data demonstrated that Geneformer consistently boosted predictive accuracy. Applied to disease modelling with limited patient data, Geneformer identified candidate therapeutic targets for cardiomyopathy. Overall, Geneformer represents a pretrained deep learning model from which fine-tuning towards a broad range of downstream applications can be pursued to accelerate discovery of key network regulators and candidate therapeutic targets. A context-aware, attention-based deep learning model pretrained on single-cell transcriptomes enables predictions in settings with limited data in network biology and could accelerate discovery of key network regulators and candidate therapeutic targets.
70

Deep learning enables genetic analysis of the human thoracic aorta

James Pirruccello et al.May 14, 2020
The aorta is the largest blood vessel in the body, and enlargement or aneurysm of the aorta can predispose to dissection, an important cause of sudden death. While rare syndromes have been identified that predispose to aortic aneurysm, the common genetic basis for the size of the aorta remains largely unknown. By leveraging a deep learning architecture that was originally developed to recognize natural images, we trained a model to evaluate the dimensions of the ascending and descending thoracic aorta in cardiac magnetic resonance imaging. After manual annotation of just 116 samples, we applied this model to 3,840,140 images from the UK Biobank. We then conducted a genome-wide association study in 33,420 individuals, revealing 68 loci associated with ascending and 35 with descending thoracic aortic diameter, of which 10 loci overlapped. Integration of common variation with transcriptome-wide analyses, rare-variant burden tests, and single nucleus RNA sequencing prioritized SVIL , a gene highly expressed in vascular smooth muscle, that was significantly associated with the diameter of the ascending and descending aorta. A polygenic score for ascending aortic diameter was associated with a diagnosis of thoracic aortic aneurysm in the remaining 391,251 UK Biobank participants who did not undergo imaging (HR = 1.44 per standard deviation; P = 3.7·10 −12 ). Defining the genetic basis of the diameter of the aorta may enable the identification of asymptomatic individuals at risk for aneurysm or dissection and facilitate the prioritization of potential therapeutic targets for the prevention or treatment of aortic aneurysm. Finally, our results illustrate the potential for rapidly defining novel quantitative traits derived from a deep learning model, an approach that can be more broadly applied to biomedical imaging data.
70
Citation24
0
Save
152

Rare Genetic Variation Underlying Human Diseases and Traits: Results from 200,000 Individuals in the UK Biobank

Sean Jurgens et al.Nov 29, 2020
Abstract Background Many human diseases are known to have a genetic contribution. While genome-wide studies have identified many disease-associated loci, it remains challenging to elucidate causal genes. In contrast, exome sequencing provides an opportunity to identify new disease genes and large-effect variants of clinical relevance. We therefore sought to determine the contribution of rare genetic variation in a curated set of human diseases and traits using a unique resource of 200,000 individuals with exome sequencing data from the UK Biobank. Methods and Results We included 199,832 participants with a mean age of 68 at follow-up. Exome-wide gene-based tests were performed for 64 diseases and 23 quantitative traits using a mixed-effects model, testing rare loss-of-function and damaging missense variants. We identified 51 known and 23 novel associations with 26 diseases and traits at a false-discovery-rate of 1%. There was a striking risk associated with many Mendelian disease genes including: MYPBC3 with over a 100-fold increased odds of hypertrophic cardiomyopathy, PKD1 with a greater than 25-fold increased odds of chronic kidney disease, and BRCA2, BRCA1, ATM and PALB2 with 3 to 10-fold increased odds of breast cancer. Notable novel findings included an association between GIGYF1 and type 2 diabetes (OR 5.6, P =5.35×10 −8 ), elevated blood glucose, and lower insulin-like-growth-factor-1 levels. Rare variants in CCAR2 were also associated with diabetes risk (OR 13, P =8.5×10 −8 ), while COL9A3 was associated with cataract (OR 3.4, P =6.7×10 −8 ). Notable associations for blood lipids and hypercholesterolemia included NR1H3, RRBP1, GIGYF1, SCGN, APH1A, PDE3B and ANGPTL8 . A number of novel genes were associated with height, including DTL, PIEZO1, SCUBE3, PAPPA and ADAMTS6 , while BSN was associated with body-mass-index. We further assessed putatively pathogenic variants in known Mendelian cardiovascular disease genes and found that between 1.3 and 2.3% of the population carried likely pathogenic variants in known cardiomyopathy, arrhythmia or hypercholesterolemia genes. Conclusions Large-scale population sequencing identifies known and novel genes harboring high-impact variation for human traits and diseases. A number of novel findings, including GIGYF1 ,represent interesting potential therapeutic targets. Exome sequencing at scale can identify a meaningful proportion of the population that carries a pathogenic variant underlying cardiovascular disease.
152
Citation14
0
Save
57

Genetic Analysis of Right Heart Structure and Function in 40,000 People

James Pirruccello et al.Feb 6, 2021
The heart evolved hundreds of millions of years ago. During mammalian evolution, the cardiovascular system developed with complete separation between pulmonary and systemic circulations incorporated into a single pump with chambers dedicated to each circulation. A lower pressure right heart chamber supplies deoxygenated blood to the lungs, while a high pressure left heart chamber supplies oxygenated blood to the rest of the body. Due to the complexity of morphogenic cardiac looping and septation required to form these two chambers, congenital heart diseases often involve maldevelopment of the evolutionarily recent right heart chamber. Additionally, some diseases predominantly affect structures of the right heart, including arrhythmogenic right ventricular cardiomyopathy (ARVC) and pulmonary hypertension. To gain insight into right heart structure and function, we fine-tuned deep learning models to recognize the right atrium, the right ventricle, and the pulmonary artery, and then used those models to measure right heart structures in over 40,000 individuals from the UK Biobank with magnetic resonance imaging. We found associations between these measurements and clinical disease including pulmonary hypertension and dilated cardiomyopathy. We then conducted genome-wide association studies, identifying 104 distinct loci associated with at least one right heart measurement. Several of these loci were found near genes previously linked with congenital heart disease, such as NKX2-5, TBX3, WNT9B , and GATA4 . We also observed interesting commonalities and differences in association patterns at genetic loci linked with both right and left ventricular measurements. Finally, we found that a polygenic predictor of right ventricular end systolic volume was associated with incident dilated cardiomyopathy (HR 1.28 per standard deviation; P = 2.4E-10), and remained a significant predictor of disease even after accounting for a left ventricular polygenic score. Harnessing deep learning to perform large-scale cardiac phenotyping, our results yield insights into the genetic and clinical determinants of right heart structure and function.
57
Citation10
0
Save
Load More