SP
Slavé Petrovski
Author with expertise in Genomic Studies and Association Analyses
University of Melbourne, Austin Health, AstraZeneca (United Kingdom)
+ 8 more
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
9
(78% Open Access)
Cited by:
32
h-index:
31
/
i10-index:
46
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
84

Influences of rare protein-coding genetic variants on the human plasma proteome in 50,829 UK Biobank participants

Ryan Dhindsa et al.Oct 24, 2023
+22
B
O
R
Abstract Combining human genomics with proteomics is becoming a powerful tool for drug discovery. Associations between genetic variants and protein levels can uncover disease mechanisms, clinical biomarkers, and candidate drug targets. To date, most population-level proteogenomic studies have focused on common alleles through genome-wide association studies (GWAS). Here, we studied the contribution of rare protein-coding variants to 1,472 plasma proteins abundances measured via the Olink Explore 1536 assay in 50,829 UK Biobank human exomes. Through a variant-level exome-wide association study (ExWAS), we identified 3,674 rare and significant protein quantitative trait loci (pQTLs), of which 76% were undetected in a prior GWAS performed on the same cohort, and we found that rare pQTLs are less likely to be random in their variant effect annotation. In gene-based collapsing analyses, we identified an additional 166 significant gene-protein pQTL signals that were undetected through single-variant analyses. Of the total 456 protein-truncating variant (PTV)-driven cis -pQTLs in the gene-based collapsing analysis, 99.3% were associated with decreased protein levels. We demonstrate how this resource can identify allelic series and propose biomarkers for several candidate therapeutic targets, including GRN, HSD17B13, NLRC4 , and others. Finally, we introduce a new collapsing analysis framework that combines PTVs with missense cis -pQTLs that are associated with decreased protein abundance to bolster genetic discovery statistical power. Our results collectively highlight a considerable role for rare variation in plasma protein abundance and demonstrate the utility of plasma proteomics in gene discovery and unravelling mechanisms of action.
84
Paper
Citation12
0
Save
1

Genotyping, sequencing and analysis of 140,000 adults from the Mexico City Prospective Study

Andrey Ziyatdinov et al.Oct 24, 2023
+41
J
J
A
Abstract The Mexico City Prospective Study (MCPS) is a prospective cohort of over 150,000 adults recruited two decades ago from the urban districts of Coyoacán and Iztapalapa in Mexico City. We generated genotype and exome sequencing data for all individuals, and whole genome sequencing for 10,000 selected individuals. We uncovered high levels of relatedness and substantial heterogeneity in ancestry composition across individuals. Most sequenced individuals had admixed Native American, European and African ancestry, with extensive admixture from indigenous groups in Central, Southern and South Eastern Mexico. Native Mexican segments of the genome had lower levels of coding variation, but an excess of homozygous loss of function variants compared with segments of African and European origin. We estimated population specific allele frequencies at 142 million genomic variants, with an effective sample size of 91,856 for Native Mexico at exome variants, all available via a public browser. Using whole genome sequencing, we developed an imputation reference panel which outperforms existing panels at common variants in individuals with high proportions of Central, South and South Eastern Native Mexican ancestry. Our work illustrates the value of genetic studies in populations with diverse ancestry and provides foundational imputation and allele frequency resources for future genetic studies in Mexico and in the United States where the Hispanic/Latino population is predominantly of Mexican descent.
222

A minimal role for synonymous variation in human disease

Ryan Dhindsa et al.Oct 24, 2023
+7
D
Q
R
Summary Synonymous mutations change the DNA sequence of a gene without affecting the amino acid sequence of the encoded protein. Although emerging evidence suggests that synonymous mutations can impact RNA splicing, translational efficiency, and mRNA stability 1 , studies in human genetics, mutagenesis screens, and other experiments and evolutionary analyses have repeatedly shown that most synonymous variants are neutral or only weakly deleterious, with some notable exceptions. In their recent article, Shen et al. claim to have disproved these well-established findings. They perform mutagenesis experiments in yeast and conclude that synonymous mutations frequently reduce fitness to the same extent as nonsynonymous mutations 2 . Based on their findings, the authors state that their results “imply that synonymous mutations are nearly as important as nonsynonymous mutations in causing disease.” An accompanying News and Views argues that “revising our expectations about synonymous mutations should expand our view of the genetic underpinnings of human health” 3 . Considering potential technical concerns with these experiments 4 and a large, coherent body of knowledge establishing the predominant neutrality of synonymous variants, we caution against interpreting this study in the context of human disease.
18

Cancer-driving mutations are enriched in genic regions intolerant to germline variation

Dimitrios Vitsios et al.Oct 24, 2023
+7
J
R
D
Abstract Large reference datasets of protein-coding variation in human populations have allowed us to determine which genes and genic sub-regions are intolerant to germline genetic variation. There is also a growing number of genes implicated in severe Mendelian diseases that overlap with genes implicated in cancer. Here, we hypothesized that mitotically mutable genic sub-regions that are intolerant to germline variation are enriched for cancer-driving mutations. We introduce a new metric, OncMTR, which uses 125,748 exomes in the gnomAD database to identify genic sub-regions intolerant to germline variation but enriched for hematologic somatic variants. We demonstrate that OncMTR can significantly predict driver mutations implicated in hematologic malignancies. Divergent OncMTR regions were enriched for cancer-relevant protein domains, and overlaying OncMTR scores on protein structures identified functionally important protein residues. Finally, we performed a rare variant, gene-based collapsing analysis on an independent set of 394,694 exomes from the UK Biobank and find that OncMTR dramatically improves genetic signals for hematologic malignancies. Our web app enables easy visualization of OncMTR scores for each protein-coding gene ( https://astrazeneca-cgr-publications.github.io/OncMTR-Viewer/ ).
18
Citation1
0
Save
34

Identification of a novel missense variant in SPDL1 associated with idiopathic pulmonary fibrosis

Ryan Dhindsa et al.Oct 24, 2023
+22
A
J
R
Abstract Idiopathic pulmonary fibrosis (IPF) is a fatal disorder characterised by progressive, destructive lung scarring. Despite significant progress, the genetic determinants of this disease remain incompletely defined. Using next generation sequencing data from 752 individuals with sporadic IPF and 119,055 controls, we performed both variant- and gene-level analyses to identify novel IPF genetic risk factors. Our variant-level analysis revealed a novel rare missense variant in SPDL1 (NM_017785.5 p.Arg20Gln; p = 2.4 × 10 −7 , odds ratio = 2.87). This signal was independently replicated in the FinnGen cohort (combined p = 2.2 × 10 −20 ), firmly associating this variant as a novel IPF risk allele. SPDL1 encodes Spindly, a protein involved in mitotic checkpoint signalling during cell division that has not been previously described in fibrosis. Our results highlight a novel mechanism underlying IPF, providing the potential for new therapeutic discoveries in a disease of great unmet need.
0

Plasma proteomic associations with genetics and health in the UK Biobank

Benjamin Sun et al.Oct 7, 2023
+52
M
J
B
The Pharma Proteomics Project is a precompetitive biopharmaceutical consortium characterizing the plasma proteomic profiles of 54,219 UK Biobank participants. Here we provide a detailed summary of this initiative, including technical and biological validations, insights into proteomic disease signatures, and prediction modelling for various demographic and health indicators. We present comprehensive protein quantitative trait locus (pQTL) mapping of 2,923 proteins that identifies 14,287 primary genetic associations, of which 81% are previously undescribed, alongside ancestry-specific pQTL mapping in non-European individuals. The study provides an updated characterization of the genetic architecture of the plasma proteome, contextualized with projected pQTL discovery rates as sample sizes and proteomic assay coverages increase over time. We offer extensive insights into trans pQTLs across multiple biological domains, highlight genetic influences on ligand–receptor interactions and pathway perturbations across a diverse collection of cytokines and complement networks, and illustrate long-range epistatic effects of ABO blood group and FUT2 secretor status on proteins with gastrointestinal tissue-enriched expression. We demonstrate the utility of these data for drug discovery by extending the genetic proxied effects of protein targets, such as PCSK9, on additional endpoints, and disentangle specific genes and proteins perturbed at loci associated with COVID-19 susceptibility. This public–private partnership provides the scientific community with an open-access proteomics resource of considerable breadth and depth to help to elucidate the biological mechanisms underlying proteo-genomic discoveries and accelerate the development of biomarkers, predictive models and therapeutics1.
0

Misexpression of inactive genes in whole blood is associated with nearby rare structural variants

Thomas Vanderstichele et al.Nov 20, 2023
+22
N
K
T
Gene misexpression is the aberrant transcription of a gene in a context where it is usually inactive. Despite its known pathological consequences in specific rare diseases, we have a limited understanding of its wider prevalence and mechanisms in humans. To address this, we analyzed gene misexpression in 4,568 whole blood bulk RNA sequencing samples from INTERVAL study blood donors. We found that while individual misexpression events occur rarely, in aggregate they were found in almost all samples and over half of inactive genes. Using 2,821 paired whole genome and RNA sequencing samples, we identified that misexpression events are enriched in cis for rare structural variants. We established putative mechanisms through which a subset of SVs lead to gene misexpression, including transcriptional readthrough, transcript fusions and gene inversion. Overall, we develop misexpression as a novel type of transcriptomic outlier analysis and extend our understanding of the variety of mechanisms by which genetic variants can influence gene expression.
0
0
Save
0

Stochastic semi-supervised learning to prioritise genes from high-throughput genomic screens

Dimitrios Vitsios et al.May 7, 2020
S
D
Access to large-scale genomics datasets has increased the utility of hypothesis-free genome-wide analyses that result in candidate lists of genes. Often these analyses highlight several gene signals that might contribute to pathogenesis but are insufficiently powered to reach experiment-wide significance. This often triggers a process of laborious evaluation of highly-ranked genes through manual inspection of various public knowledge resources to triage those considered sufficiently interesting for deeper investigation. Here, we introduce a novel multi-dimensional, multi-step machine learning framework to objectively and more holistically assess biological relevance of genes to disease studies, by relying on a plethora of gene-associated annotations. We developed mantis-ml to serve as an automated machine learning (AutoML) framework, following a stochastic semi-supervised learning approach to rank known and novel disease-associated genes through iterative training and prediction sessions of random balanced datasets across the protein-coding exome (n=18,626 genes). We applied this framework on a range of disease-specific areas and as a generic disease likelihood estimator, achieving an average Area Under Curve (AUC) prediction performance of 0.85. Critically, to demonstrate applied utility on exome-wide association studies, we overlapped mantis-ml disease-specific predictions with data from published cohort-level association studies. We retrieved statistically significant enrichment of high mantis-ml predictions among the top-ranked genes from hypothesis-free cohort-level statistics (p<0.05), suggesting the capture of true prioritisation signals. We believe that mantis-ml is a novel easy-to-use tool to support objectively triaging gene discovery and overall enhancing our understanding of complex genotype-phenotype associations.
215

Genetic regulation of the human plasma proteome in 54,306 UK Biobank participants

Benjamin Sun et al.Oct 11, 2023
+45
M
J
B
Abstract The UK Biobank Pharma Proteomics Project (UKB-PPP) is a collaboration between the UK Biobank (UKB) and thirteen biopharmaceutical companies characterising the plasma proteomic profiles of 54,306 UKB participants. Here, we describe results from the first phase of UKB-PPP, including protein quantitative trait loci (pQTL) mapping of 1,463 proteins that identifies 10,248 primary genetic associations, of which 85% are newly discovered. We also identify independent secondary associations in 92% of cis and 29% of trans loci, expanding the catalogue of genetic instruments for downstream analyses. The study provides an updated characterisation of the genetic architecture of the plasma proteome, leveraging population-scale proteomics to provide novel, extensive insights into trans pQTLs across multiple biological domains. We highlight genetic influences on ligand-receptor interactions and pathway perturbations across a diverse collection of cytokines and complement proteins, and illustrate long-range epistatic effects of ABO blood group and FUT2 secretor status on proteins with gastrointestinal tissue-enriched expression. We demonstrate the utility of these data for drug target discovery by extending the genetic proxied effect of PCSK9 levels on lipid concentrations, cardio- and cerebro-vascular diseases, and additionally disentangle specific genes and proteins perturbed at COVID-19 susceptibility loci. This public-private partnership provides the scientific community with an open-access proteomics resource of unprecedented breadth and depth to help elucidate biological mechanisms underlying genetic discoveries and accelerate the development of novel biomarkers and therapeutics.
215
0
Save