JW
James Ware
Author with expertise in Standards and Guidelines for Genetic Variant Interpretation
MRC London Institute of Medical Sciences, Imperial College London, Lung Institute
+ 8 more
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
10
(40% Open Access)
Cited by:
101
h-index:
56
/
i10-index:
111
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
3

Dilated Cardiomyopathy Due to BLC2-Associated Athanogene 3 (BAG3) Mutations

Sofía Cuenca et al.Sep 25, 2022
+65
R
Z
S
The BAG3 (BLC2-associated athanogene 3) gene codes for an antiapoptotic protein located on the sarcomere Z-disc. Mutations in BAG3 are associated with dilated cardiomyopathy (DCM), but only a small number of cases have been reported to date, and the natural history of BAG3 cardiomyopathy is poorly understood. This study sought to describe the phenotype and prognosis of BAG3 mutations in a large multicenter DCM cohort. The study cohort comprised 129 individuals with a BAG3 mutation (62% males, 35.1 ± 15.0 years of age) followed at 18 European centers. Localization of BAG3 in cardiac tissue was analyzed in patients with truncating BAG3 mutations using immunohistochemistry. At first evaluation, 57.4% of patients had DCM. After a median follow-up of 38 months (interquartile range: 7 to 95 months), 68.4% of patients had DCM and 26.1% who were initially phenotype-negative developed DCM. Disease penetrance in individuals >40 years of age was 80% at last evaluation, and there was a trend towards an earlier onset of DCM in men (age 34.6 ± 13.2 years vs. 40.7 ± 12.2 years; p = 0.053). The incidence of adverse cardiac events (death, left ventricular assist device, heart transplantation, and sustained ventricular arrhythmia) was 5.1% per year among individuals with DCM. Male sex, decreased left ventricular ejection fraction. and increased left ventricular end-diastolic diameter were associated with adverse cardiac events. Myocardial tissue from patients with a BAG3 mutation showed myofibril disarray and a relocation of BAG3 protein in the sarcomeric Z-disc. DCM caused by mutations in BAG3 is characterized by high penetrance in carriers >40 years of age and a high risk of progressive heart failure. Male sex, decreased left ventricular ejection fraction, and enlarged left ventricular end-diastolic diameter are associated with adverse outcomes in patients with BAG3 mutations.
71

Annotating high-impact 5’untranslated region variants with the UTRannotator

Xiaolei Zhang et al.Oct 24, 2023
N
J
M
X
Abstract Summary Current tools to annotate the predicted effect of genetic variants are heavily biased towards protein-coding sequence. Variants outside of these regions may have a large impact on protein expression and/or structure and can lead to disease, but this effect can be challenging to predict. Consequently, these variants are poorly annotated using standard tools. We have developed a plugin to the Ensembl Variant Effect Predictor, the UTRannotator, that annotates variants in 5’untranslated regions (5’UTR) that create or disrupt upstream open reading frames (uORFs). We investigate the utility of this tool using the ClinVar database, providing an annotation for 30.8% of all 5’UTR (likely) pathogenic variants, and highlighting 31 variants of uncertain significance as candidates for further follow-up. We will continue to update the UTR annotator as we gain new knowledge on the impact of variants in UTRs. Availability and implementation UTRannotator is freely available on Github: https://github.com/ImperialCardioGenetics/UTRannotator Supplementary information Supplementary data are available at bioRxiv.
71
Paper
Citation3
0
Save
0

Reassessment of Mendelian gene pathogenicity using 7,855 cardiomyopathy cases and 60,706 reference samples

Roddy Walsh et al.May 6, 2020
+12
J
K
R
The accurate interpretation of variation in Mendelian disease genes has lagged behind data generation as sequencing has become increasingly accessible. Ongoing large sequencing efforts present huge interpretive challenges, but also provide an invaluable opportunity to characterize the spectrum and importance of rare variation. Here we analyze sequence data from 7,855 clinical cardiomyopathy cases and 60,706 ExAC reference samples to better understand genetic variation in a representative autosomal dominant disorder. We show that in some genes previously reported as important causes of a given cardiomyopathy, rare variation is not clinically informative and there is a high likelihood of false positive interpretation. By contrast, in other genes, we find that diagnostic laboratories may be overly conservative when assessing variant pathogenicity. We outline improved interpretation approaches for specific genes and variant classes and propose that these will increase the clinical utility of testing across a range of Mendelian diseases.
0

Human loss-of-function variants suggest that partial LRRK2 inhibition is a safe therapeutic strategy for Parkinson’s disease

Nicola Whiffin et al.May 6, 2020
+31
A
I
N
Human genetic variants predicted to cause loss-of-function of protein-coding genes (pLoF variants) provide natural in vivo models of human gene inactivation, and can be valuable indicators of gene function and the potential toxicity of therapeutic inhibitors targeting these genes[1][1],[2][2]. Gain-of-kinase-function variants in LRRK2 are known to significantly increase the risk of Parkinson’s disease[3][3],[4][4], suggesting that inhibition of LRRK2 kinase activity is a promising therapeutic strategy. While preclinical studies in model organisms have raised some on-target toxicity concerns[5][5]–[8][6], the biological consequences of LRRK2 inhibition have not been well-characterized in humans. Here we systematically analyse pLoF variants in LRRK2 observed across 141,456 individuals sequenced in the Genome Aggregation Database (gnomAD)[9][7], 49,960 exome sequenced individuals from the UK Biobank, and over 4 million participants in the 23andMe genotyped dataset. After stringent variant curation, we identify 1,455 individuals with high-confidence pLoF variants in LRRK2 , 82.5% with experimental validation. We show that heterozygous pLoF variants in LRRK2 reduce LRRK2 protein levels but are not strongly associated with reduced life expectancy, or with any specific phenotype or disease state. These data suggest that therapeutics that partially downregulate LRRK2 levels or kinase activity are unlikely to have major on-target safety liabilities. Our results demonstrate the value of large-scale genomic databases and phenotyping of human LoF carriers for target validation in drug discovery. [1]: #ref-1 [2]: #ref-2 [3]: #ref-3 [4]: #ref-4 [5]: #ref-5 [6]: #ref-8 [7]: #ref-9
0

Using high-resolution variant frequencies to empower clinical genome interpretation

Nicola Whiffin et al.May 6, 2020
+8
R
E
N
Whole exome and genome sequencing have transformed the discovery of genetic variants that cause human Mendelian disease, but discriminating pathogenic from benign variants remains a daunting challenge. Rarity is recognised as a necessary, although not sufficient, criterion for pathogenicity, but frequency cutoffs used in Mendelian analysis are often arbitrary and overly lenient. Recent very large reference datasets, such as the Exome Aggregation Consortium (ExAC), provide an unprecedented opportunity to obtain robust frequency estimates even for very rare variants. Here we present a statistical framework for the frequency-based filtering of candidate disease-causing variants, accounting for disease prevalence, genetic and allelic heterogeneity, inheritance mode, penetrance, and sampling variance in reference datasets. Using the example of cardiomyopathy, we show that our approach reduces by two-thirds the number of candidate variants under consideration in the average exome, and identifies 43 variants previously reported as pathogenic that can now be reclassified. We present precomputed allele frequency cutoffs for all variants in the ExAC dataset.
0

Analysis of protein-coding genetic variation in 60,706 humans

Monkol Lek et al.May 6, 2020
+76
E
K
M
Large-scale reference data sets of human genetic variation are critical for the medical and functional interpretation of DNA sequence changes. Here we describe the aggregation and analysis of high-quality exome (protein-coding region) sequence data for 60,706 individuals of diverse ethnicities generated as part of the Exome Aggregation Consortium (ExAC). The resulting catalogue of human genetic diversity contains an average of one variant every eight bases of the exome, and provides direct evidence for the presence of widespread mutational recurrence. We show that this catalogue can be used to calculate objective metrics of pathogenicity for sequence variants, and to identify genes subject to strong selection against various classes of mutation; we identify 3,230 genes with near-complete depletion of truncating variants, 72% of which have no currently established human disease phenotype. Finally, we demonstrate that these data can be used for the efficient filtering of candidate disease-causing variants, and for the discovery of human knockout variants in protein-coding genes.
0
0
Save
0

CardioClassifier: demonstrating the power of disease- and gene-specific computational decision support for clinical genome interpretation

Nicola Whiffin et al.May 7, 2020
+18
J
R
N
Purpose: Internationally-adopted variant interpretation guidelines from the American College of Medical Genetics and Genomics (ACMG) are generic and require disease-specific refinement. Here we developed CardioClassifier (www.cardioclassifier.org), a semi-automated decision-support tool for inherited cardiac conditions (ICCs). Methods: CardioClassifier integrates data retrieved from multiple sources with user-input case-specific information, through an interactive interface, to support variant interpretation. Combining disease- and gene-specific knowledge with variant observations in large cohorts of cases and controls, we refined 14 computational ACMG criteria and created three ICC-specific rules. Results: We benchmarked CardioClassifier on 57 expertly-curated variants and show full retrieval of all computational data, concordantly activating 87.3% of rules. A generic annotation tool identified fewer than half as many clinically-actionable variants (64/219 vs 156/219, Fishers P=1.1x10-18), with important false positives; illustrating the critical importance of disease and gene-specific annotations. CardioClassifier identified putatively disease-causing variants in 33.7% of 327 cardiomyopathy cases, comparable with leading ICC laboratories. Through addition of manually-curated data, variants found in over 40% of cardiomyopathy cases are fully annotated, without requiring additional user-input data. Conclusion: CardioClassifier is an ICC-specific decision-support tool that integrates expertly curated computational annotations with case-specific data to generate fast, reproducible and interactive variant pathogenicity reports, according to best practice guidelines.
1

Variant annotation across homologous proteins (“Paralogue Annotation”) identifies disease-causing missense variants with high precision, and is widely applicable across protein families

N. Li et al.Oct 24, 2023
+10
P
E
N
Abstract Background Distinguishing pathogenic variants from those that are rare but benign remains a key challenge in clinical genetics, especially for variants not previously observed and characterised in humans. In vitro and in vivo functional characterisation are typically resource intensive, and model systems may not accurately predict influence on human disease. Many in silico tools have been developed to predict which variants are disease-causing, but typically lack precision. Here we demonstrate the applicability of a framework, called Paralogue Annotation, that draws on information from previously-characterised variants in homologous proteins to predict whether variants in a gene of interest are likely disease causing. Methods We assessed the performance of Paralogue Annotation through three orthogonal approaches: (1) comparison to established in silico variant prediction tools using 47,360 missense variants from ClinVar across 3,524 genes representing a broad range of diverse protein classes, by calculating precision and sensitivity; (2) evaluation against large-scale functional assays of variant effect in TP53 and PPARG ; and (3) comparing odd ratios calculated from case-control association tests for inherited cardiac arrhythmia syndromes, and neurodevelopmental disorders with epilepsy, stratifying variants by Paralogue Annotation. Results Paralogue Annotation correctly annotates 4,328 ClinVar pathogenic variants, with 245 false positives, yielding a precision of 0.95. This increases to 0.99 with more stringent annotation parameters (requiring greater conservation of amino acids between annotated orthologues) at the expense of sensitivity. Compared to established tools, Paralogue Annotation has higher precision for identification of pathogenic variants, albeit with lower sensitivity across diverse test sets. Extending the technique by transferring annotations between homologous protein domains, rather than full-length protein paralogues, increases sensitivity. Rare variants predicted pathogenic by Paralogue Annotation were more strongly disease-associated (increased odds ratio) than unstratified rare variants for six out of eight genes tested with case-control cohort approaches. Conclusions Paralogue Annotation has high precision for detection of pathogenic missense variants, outperforming in silico methods where data are available to make a prediction. As the number of characterised variants increases in reference datasets such as ClinVar, Paralogue Annotation will further increase in sensitivity and applicability.
7

Computational prediction of protein subdomain stability inMYBPC3enables clinical risk stratification in hypertrophic cardiomyopathy and enhances variant interpretation

Andrea Thompson et al.Oct 24, 2023
+16
A
A
A
Abstract Purpose Variants in MYBPC3 causing loss-of-function are the most common cause of HCM. However, a substantial number of patients carry missense variants of uncertain significance (VUS) in MYBPC3. We hypothesize that a structural-based algorithm, STRUM, which estimates the effect of missense variants on protein folding, will improve clinical risk stratification of patients with HCM and a MYBPC3 VUS. Methods Among 7,963 patients in the multi-center Sarcomeric Human Cardiomyopathy Registry, 120 unique missense VUSs in MYBPC3 were identified. Variants were evaluated for their effect on subdomain folding and a stratified time-to-event analysis for an overall composite endpoint (first occurrence of ventricular arrhythmia, heart failure, all-cause mortality, atrial fibrillation, and stroke) was performed for patients with HCM and a MYBPC3 missense VUS. Results We demonstrated that patients carrying a MYBPC3 VUS predicted to cause subdomain misfolding (STRUM +, ΔΔG ≤-1.2 kcal/mol) exhibited a higher rate of adverse events compared to those with a STRUM-VUS (Hazard Ratio=2.29, P=0.0282). In silico saturation mutagenesis of MYBPC3 identified 4,943/23,427 (21%) missense variants that were predicted to cause subdomain misfolding. Conclusions STRUM enables clinical risk stratification of patients with HCM and a MYBPC3 VUS and has the capacity to improve prognostic predictions and clinical decision making.
0

Gene family information facilitates variant interpretation and identification of disease-associated genes

Dennis Lal et al.May 6, 2020
+27
K
P
D
Differentiating risk-conferring from benign missense variants, and therefore optimal calculation of gene-variant burden, represent a major challenge in particular for rare and genetic heterogeneous disorders. While orthologous gene conservation is commonly employed in variant annotation, approximately 80% of known disease-associated genes are paralogs and belong to gene families. It has not been thoroughly investigated how gene family information can be utilized for disease gene discovery and variant interpretation. We developed a paralog conservation score to empirically evaluate whether paralog conserved or non-conserved sites of in-human paralogs are important for protein function. Using this score, we demonstrate that disease-associated missense variants are significantly enriched at paralog conserved sites across all disease groups and disease inheritance models tested. Next, we assessed whether gene family information could assist in discovering novel disease-associated genes. We subsequently developed a gene family de novo enrichment framework that identified 43 exome-wide enriched gene families including 98 de novo variant carrying genes in more than 10k neurodevelopmental disorder patients. 33 gene family enriched genes represent novel candidate genes which are brain expressed and variant constrained in neurodevelopmental disorders.
0
0
Save