NG
Namrata Gupta
Author with expertise in Standards and Guidelines for Genetic Variant Interpretation
Achievements
Cited Author
Open Access Advocate
Key Stats
Upvotes received:
0
Publications:
38
(74% Open Access)
Cited by:
40,598
h-index:
63
/
i10-index:
102
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
0

A global reference for human genetic variation

Alexandra Roa et al.Sep 29, 2015
The 1000 Genomes Project set out to provide a comprehensive description of common human genetic variation by applying whole-genome sequencing to a diverse set of individuals from multiple populations. Here we report completion of the project, having reconstructed the genomes of 2,504 individuals from 26 populations using a combination of low-coverage whole-genome sequencing, deep exome sequencing, and dense microarray genotyping. We characterized a broad spectrum of genetic variation, in total over 88 million variants (84.7 million single nucleotide polymorphisms (SNPs), 3.6 million short insertions/deletions (indels), and 60,000 structural variants), all phased onto high-quality haplotypes. This resource includes >99% of SNP variants with a frequency of >1% for a variety of ancestries. We describe the distribution of genetic variation across the global sample, and discuss the implications for common disease studies. Results for the final phase of the 1000 Genomes Project are presented including whole-genome sequencing, targeted exome sequencing, and genotyping on high-density SNP arrays for 2,504 individuals across 26 populations, providing a global reference data set to support biomedical genetics. The 1000 Genomes Project has sought to comprehensively catalogue human genetic variation across populations, providing a valuable public genomic resource. The data obtained so far have found applications ranging from association studies and fine mapping studies to the filtering of likely neutral variants in rare-disease cohorts. The authors now report on the final phase of the project, phase 3, which covers previously uncharacterized areas of human genetic diversity in terms of the populations sampled and categories of characterized variation. The sample now includes more than 2,500 individuals from 26 global populations, with low coverage whole-genome and deep exome sequencing, as well as dense microarray genotyping. They find that while most common variants are shared across populations, rarer variants are often restricted to closely related populations. The authors also demonstrate the use of the phase 3 dataset as a reference panel for imputation to improve the resolution in genetic association studies.
0
0

Analysis of protein-coding genetic variation in 60,706 humans

Olle Melander et al.Aug 1, 2016
Large-scale reference data sets of human genetic variation are critical for the medical and functional interpretation of DNA sequence changes. Here we describe the aggregation and analysis of high-quality exome (protein-coding region) DNA sequence data for 60,706 individuals of diverse ancestries generated as part of the Exome Aggregation Consortium (ExAC). This catalogue of human genetic diversity contains an average of one variant every eight bases of the exome, and provides direct evidence for the presence of widespread mutational recurrence. We have used this catalogue to calculate objective metrics of pathogenicity for sequence variants, and to identify genes subject to strong selection against various classes of mutation; identifying 3,230 genes with near-complete depletion of predicted protein-truncating variants, with 72% of these genes having no currently established human disease phenotype. Finally, we demonstrate that these data can be used for the efficient filtering of candidate disease-causing variants, and for the discovery of human ‘knockout’ variants in protein-coding genes. Exome sequencing data from 60,706 people of diverse geographic ancestry is presented, providing insight into genetic variation across populations, and illuminating the relationship between DNA variants and human disease. As part of the Exome Aggregation Consortium (ExAC) project, Daniel MacArthur and colleagues report on the generation and analysis of high-quality exome sequencing data from 60,706 individuals of diverse ancestry. This provides the most comprehensive catalogue of human protein-coding genetic variation to date, yielding unprecedented resolution for the analysis of very rare variants across multiple human populations. The catalogue is freely accessible and provides a critical reference panel for the clinical interpretation of genetic variants and the discovery of disease-related genes.
0
Citation9,528
0
Save
0

The mutational constraint spectrum quantified from variation in 141,456 humans

Konrad Karczewski et al.May 27, 2020
Abstract Genetic variants that inactivate protein-coding genes are a powerful source of information about the phenotypic consequences of gene disruption: genes that are crucial for the function of an organism will be depleted of such variants in natural populations, whereas non-essential genes will tolerate their accumulation. However, predicted loss-of-function variants are enriched for annotation errors, and tend to be found at extremely low frequencies, so their analysis requires careful variant annotation and very large sample sizes 1 . Here we describe the aggregation of 125,748 exomes and 15,708 genomes from human sequencing studies into the Genome Aggregation Database (gnomAD). We identify 443,769 high-confidence predicted loss-of-function variants in this cohort after filtering for artefacts caused by sequencing and annotation errors. Using an improved model of human mutation rates, we classify human protein-coding genes along a spectrum that represents tolerance to inactivation, validate this classification using data from model organisms and engineered human cells, and show that it can be used to improve the power of gene discovery for both common and rare diseases.
0
Citation7,204
0
Save
0

Clonal Hematopoiesis and Risk of Atherosclerotic Cardiovascular Disease

Siddhartha Jaiswal et al.Jun 21, 2017
Clonal hematopoiesis of indeterminate potential (CHIP), which is defined as the presence of an expanded somatic blood-cell clone in persons without other hematologic abnormalities, is common among older persons and is associated with an increased risk of hematologic cancer. We previously found preliminary evidence for an association between CHIP and atherosclerotic cardiovascular disease, but the nature of this association was unclear.We used whole-exome sequencing to detect the presence of CHIP in peripheral-blood cells and associated such presence with coronary heart disease using samples from four case-control studies that together enrolled 4726 participants with coronary heart disease and 3529 controls. To assess causality, we perturbed the function of Tet2, the second most commonly mutated gene linked to clonal hematopoiesis, in the hematopoietic cells of atherosclerosis-prone mice.In nested case-control analyses from two prospective cohorts, carriers of CHIP had a risk of coronary heart disease that was 1.9 times as great as in noncarriers (95% confidence interval [CI], 1.4 to 2.7). In two retrospective case-control cohorts for the evaluation of early-onset myocardial infarction, participants with CHIP had a risk of myocardial infarction that was 4.0 times as great as in noncarriers (95% CI, 2.4 to 6.7). Mutations in DNMT3A, TET2, ASXL1, and JAK2 were each individually associated with coronary heart disease. CHIP carriers with these mutations also had increased coronary-artery calcification, a marker of coronary atherosclerosis burden. Hypercholesterolemia-prone mice that were engrafted with bone marrow obtained from homozygous or heterozygous Tet2 knockout mice had larger atherosclerotic lesions in the aortic root and aorta than did mice that had received control bone marrow. Analyses of macrophages from Tet2 knockout mice showed elevated expression of several chemokine and cytokine genes that contribute to atherosclerosis.The presence of CHIP in peripheral-blood cells was associated with nearly a doubling in the risk of coronary heart disease in humans and with accelerated atherosclerosis in mice. (Funded by the National Institutes of Health and others.).
0
Citation1,989
0
Save
0

Diagnostic Yield and Clinical Utility of Sequencing Familial Hypercholesterolemia Genes in Patients With Severe Hypercholesterolemia

Amit Khera et al.Apr 3, 2016
Approximately 7% of American adults have severe hypercholesterolemia (untreated low-density lipoprotein [LDL] cholesterol ≥190 mg/dl), which may be due to familial hypercholesterolemia (FH). Lifelong LDL cholesterol elevations in FH mutation carriers may confer coronary artery disease (CAD) risk beyond that captured by a single LDL cholesterol measurement. This study assessed the prevalence of an FH mutation among those with severe hypercholesterolemia and determined whether CAD risk varies according to mutation status beyond the observed LDL cholesterol level. Three genes causative for FH (LDLR, APOB, and PCSK9) were sequenced in 26,025 participants from 7 case-control studies (5,540 CAD case subjects, 8,577 CAD-free control subjects) and 5 prospective cohort studies (11,908 participants). FH mutations included loss-of-function variants in LDLR, missense mutations in LDLR predicted to be damaging, and variants linked to FH in ClinVar, a clinical genetics database. Among 20,485 CAD-free control and prospective cohort participants, 1,386 (6.7%) had LDL cholesterol ≥190 mg/dl; of these, only 24 (1.7%) carried an FH mutation. Within any stratum of observed LDL cholesterol, risk of CAD was higher among FH mutation carriers than noncarriers. Compared with a reference group with LDL cholesterol <130 mg/dl and no mutation, participants with LDL cholesterol ≥190 mg/dl and no FH mutation had a 6-fold higher risk for CAD (odds ratio: 6.0; 95% confidence interval: 5.2 to 6.9), whereas those with both LDL cholesterol ≥190 mg/dl and an FH mutation demonstrated a 22-fold increased risk (odds ratio: 22.3; 95% confidence interval: 10.7 to 53.2). In an analysis of participants with serial lipid measurements over many years, FH mutation carriers had higher cumulative exposure to LDL cholesterol than noncarriers. Among participants with LDL cholesterol ≥190 mg/dl, gene sequencing identified an FH mutation in <2%. However, for any observed LDL cholesterol, FH mutation carriers had substantially increased risk for CAD.
0
Citation796
0
Save
0

A structural variation reference for medical and population genetics

Ryan Collins et al.May 27, 2020
Structural variants (SVs) rearrange large segments of DNA1 and can have profound consequences in evolution and human disease2,3. As national biobanks, disease-association studies, and clinical genetic testing have grown increasingly reliant on genome sequencing, population references such as the Genome Aggregation Database (gnomAD)4 have become integral in the interpretation of single-nucleotide variants (SNVs)5. However, there are no reference maps of SVs from high-coverage genome sequencing comparable to those for SNVs. Here we present a reference of sequence-resolved SVs constructed from 14,891 genomes across diverse global populations (54% non-European) in gnomAD. We discovered a rich and complex landscape of 433,371 SVs, from which we estimate that SVs are responsible for 25-29% of all rare protein-truncating events per genome. We found strong correlations between natural selection against damaging SNVs and rare SVs that disrupt or duplicate protein-coding sequence, which suggests that genes that are highly intolerant to loss-of-function are also sensitive to increased dosage6. We also uncovered modest selection against noncoding SVs in cis-regulatory elements, although selection against protein-truncating SVs was stronger than all noncoding effects. Finally, we identified very large (over one megabase), rare SVs in 3.9% of samples, and estimate that 0.13% of individuals may carry an SV that meets the existing criteria for clinically important incidental findings7. This SV resource is freely distributed via the gnomAD browser8 and will have broad utility in population genetics, disease-association studies, and diagnostic screening.
0
Citation722
0
Save
0

Somatic ERCC2 Mutations Correlate with Cisplatin Sensitivity in Muscle-Invasive Urothelial Carcinoma

Eliezer Allen et al.Aug 6, 2014
Cisplatin-based chemotherapy is the standard of care for patients with muscle-invasive urothelial carcinoma. Pathologic downstaging to pT0/pTis after neoadjuvant cisplatin-based chemotherapy is associated with improved survival, although molecular determinants of cisplatin response are incompletely understood. We performed whole-exome sequencing on pretreatment tumor and germline DNA from 50 patients with muscle-invasive urothelial carcinoma who received neoadjuvant cisplatin-based chemotherapy followed by cystectomy (25 pT0/pTis "responders," 25 pT2+ "nonresponders") to identify somatic mutations that occurred preferentially in responders. ERCC2, a nucleotide excision repair gene, was the only significantly mutated gene enriched in the cisplatin responders compared with nonresponders (q < 0.01). Expression of representative ERCC2 mutants in an ERCC2-deficient cell line failed to rescue cisplatin and UV sensitivity compared with wild-type ERCC2. The lack of normal ERCC2 function may contribute to cisplatin sensitivity in urothelial cancer, and somatic ERCC2 mutation status may inform cisplatin-containing regimen usage in muscle-invasive urothelial carcinoma.Somatic ERCC2 mutations correlate with complete response to cisplatin-based chemosensitivity in muscle-invasive urothelial carcinoma, and clinically identified mutations lead to cisplatin sensitivity in vitro. Nucleotide excision repair pathway defects may drive exceptional response to conventional chemotherapy.
0
Citation534
0
Save
0

Inactivating Mutations in NPC1L1 and Protection from Coronary Heart Disease

Nathan Stitziel et al.Nov 12, 2014
Ezetimibe lowers plasma levels of low-density lipoprotein (LDL) cholesterol by inhibiting the activity of the Niemann-Pick C1-like 1 (NPC1L1) protein. However, whether such inhibition reduces the risk of coronary heart disease is not known. Human mutations that inactivate a gene encoding a drug target can mimic the action of an inhibitory drug and thus can be used to infer potential effects of that drug.We sequenced the exons of NPC1L1 in 7364 patients with coronary heart disease and in 14,728 controls without such disease who were of European, African, or South Asian ancestry. We identified carriers of inactivating mutations (nonsense, splice-site, or frameshift mutations). In addition, we genotyped a specific inactivating mutation (p.Arg406X) in 22,590 patients with coronary heart disease and in 68,412 controls. We tested the association between the presence of an inactivating mutation and both plasma lipid levels and the risk of coronary heart disease.With sequencing, we identified 15 distinct NPC1L1 inactivating mutations; approximately 1 in every 650 persons was a heterozygous carrier for 1 of these mutations. Heterozygous carriers of NPC1L1 inactivating mutations had a mean LDL cholesterol level that was 12 mg per deciliter (0.31 mmol per liter) lower than that in noncarriers (P=0.04). Carrier status was associated with a relative reduction of 53% in the risk of coronary heart disease (odds ratio for carriers, 0.47; 95% confidence interval, 0.25 to 0.87; P=0.008). In total, only 11 of 29,954 patients with coronary heart disease had an inactivating mutation (carrier frequency, 0.04%) in contrast to 71 of 83,140 controls (carrier frequency, 0.09%).Naturally occurring mutations that disrupt NPC1L1 function were found to be associated with reduced plasma LDL cholesterol levels and a reduced risk of coronary heart disease. (Funded by the National Institutes of Health and others.).
0
Citation406
0
Save
0

ANGPTL3 Deficiency and Protection Against Coronary Artery Disease

Nathan Stitziel et al.Apr 1, 2017
Familial combined hypolipidemia, a Mendelian condition characterized by substantial reductions in all 3 major lipid fractions, is caused by mutations that inactivate the gene angiopoietin-like 3 (ANGPTL3). Whether ANGPTL3 deficiency reduces risk of coronary artery disease (CAD) is unknown.The study goal was to leverage 3 distinct lines of evidence-a family that included individuals with complete (compound heterozygote) ANGPTL3 deficiency, a population based-study of humans with partial (heterozygote) ANGPTL3 deficiency, and biomarker levels in patients with myocardial infarction (MI)-to test whether ANGPTL3 deficiency is associated with lower risk for CAD.We assessed coronary atherosclerotic burden in 3 individuals with complete ANGPTL3 deficiency and 3 wild-type first-degree relatives using computed tomography angiography. In the population, ANGPTL3 loss-of-function (LOF) mutations were ascertained in up to 21,980 people with CAD and 158,200 control subjects. LOF mutations were defined as nonsense, frameshift, and splice-site variants, along with missense variants resulting in <25% of wild-type ANGPTL3 activity in a mouse model. In a biomarker study, circulating ANGPTL3 concentration was measured in 1,493 people who presented with MI and 3,232 control subjects.The 3 individuals with complete ANGPTL3 deficiency showed no evidence of coronary atherosclerotic plaque. ANGPTL3 gene sequencing demonstrated that approximately 1 in 309 people was a heterozygous carrier for an LOF mutation. Compared with those without mutation, heterozygous carriers of ANGPTL3 LOF mutations demonstrated a 17% reduction in circulating triglycerides and a 12% reduction in low-density lipoprotein cholesterol. Carrier status was associated with a 34% reduction in odds of CAD (odds ratio: 0.66; 95% confidence interval: 0.44 to 0.98; p = 0.04). Individuals in the lowest tertile of circulating ANGPTL3 concentrations, compared with the highest, had reduced odds of MI (adjusted odds ratio: 0.65; 95% confidence interval: 0.55 to 0.77; p < 0.001).ANGPTL3 deficiency is associated with protection from CAD.
0
Citation386
0
Save
Load More