BS
Benjamin Sun
Author with expertise in Genomic Studies and Association Analyses
Biogen (United States), Bejing Institute of Aeronautical Materials, Aero Engine Corporation of China (China)
+ 13 more
Achievements
Open Access Advocate
Cited Author
Key Stats
Upvotes received:
0
Publications:
12
(58% Open Access)
Cited by:
25
h-index:
23
/
i10-index:
29
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
84

Influences of rare protein-coding genetic variants on the human plasma proteome in 50,829 UK Biobank participants

Ryan Dhindsa et al.Oct 24, 2023
+22
B
O
R
Abstract Combining human genomics with proteomics is becoming a powerful tool for drug discovery. Associations between genetic variants and protein levels can uncover disease mechanisms, clinical biomarkers, and candidate drug targets. To date, most population-level proteogenomic studies have focused on common alleles through genome-wide association studies (GWAS). Here, we studied the contribution of rare protein-coding variants to 1,472 plasma proteins abundances measured via the Olink Explore 1536 assay in 50,829 UK Biobank human exomes. Through a variant-level exome-wide association study (ExWAS), we identified 3,674 rare and significant protein quantitative trait loci (pQTLs), of which 76% were undetected in a prior GWAS performed on the same cohort, and we found that rare pQTLs are less likely to be random in their variant effect annotation. In gene-based collapsing analyses, we identified an additional 166 significant gene-protein pQTL signals that were undetected through single-variant analyses. Of the total 456 protein-truncating variant (PTV)-driven cis -pQTLs in the gene-based collapsing analysis, 99.3% were associated with decreased protein levels. We demonstrate how this resource can identify allelic series and propose biomarkers for several candidate therapeutic targets, including GRN, HSD17B13, NLRC4 , and others. Finally, we introduce a new collapsing analysis framework that combines PTVs with missense cis -pQTLs that are associated with decreased protein abundance to bolster genetic discovery statistical power. Our results collectively highlight a considerable role for rare variation in plasma protein abundance and demonstrate the utility of plasma proteomics in gene discovery and unravelling mechanisms of action.
84
Paper
Citation12
0
Save
0

New genetic signals for lung function highlight pathways and pleiotropy, and chronic obstructive pulmonary disease associations across multiple ancestries

Nick Shrine et al.May 6, 2020
+107
A
A
N
Abstract Reduced lung function predicts mortality and is key to the diagnosis of COPD. In a genome-wide association study in 400,102 individuals of European ancestry, we define 279 lung function signals, one-half of which are new. In combination these variants strongly predict COPD in deeply-phenotyped patient populations. Furthermore, the combined effect of these variants showed generalisability across smokers and never-smokers, and across ancestral groups. We highlight biological pathways, known and potential drug targets for COPD and, in phenome-wide association studies, autoimmune-related and other pleiotropic effects of lung function associated variants. This new genetic evidence has potential to improve future preventive and therapeutic strategies for COPD.
0
Citation9
0
Save
0

Blood protein assessment of leading incident diseases and mortality in the UK Biobank

Danni Gadd et al.Sep 6, 2024
+11
Z
R
D
Abstract The circulating proteome offers insights into the biological pathways that underlie disease. Here, we test relationships between 1,468 Olink protein levels and the incidence of 23 age-related diseases and mortality in the UK Biobank ( n = 47,600). We report 3,209 associations between 963 protein levels and 21 incident outcomes. Next, protein-based scores (ProteinScores) are developed using penalized Cox regression. When applied to test sets, six ProteinScores improve the area under the curve estimates for the 10-year onset of incident outcomes beyond age, sex and a comprehensive set of 24 lifestyle factors, clinically relevant biomarkers and physical measures. Furthermore, the ProteinScore for type 2 diabetes outperforms a polygenic risk score and HbA1c—a clinical marker used to monitor and diagnose type 2 diabetes. The performance of scores using metabolomic and proteomic features is also compared. These data characterize early proteomic contributions to major age-related diseases, demonstrating the value of the plasma proteome for risk stratification.
0
Paper
Citation3
0
Save
0

isGWAS: ultra-high-throughput, scalable and equitable inference of genetic associations with disease

Christopher Foley et al.May 29, 2024
+2
R
Z
C
Abstract Genome-wide association studies (GWAS) have proven a powerful tool for human geneticists to generate biological insights or hypotheses for drug discovery. Nevertheless, a dependency on sensitive individual-level data together with ever-increasing cohort sample sizes, numbers of variants and phenotypes studied put a strain on existing algorithms, limiting the GWAS approach from maximising potential. Here we present in-silico GWAS (isGWAS), a uniquely scalable algorithm to infer regression parameters in case-control GWAS from cohort-level summary data. For any sample size, isGWAS computes a variant-disease association parameter in ∼1 millisecond, or ∼11m variants in UK-Biobank within ∼4 minutes (∼1500-fold faster than state-of-the-art). Extensive simulations and empirical tests demonstrate that isGWAS results are highly comparable to traditional regression-based approaches. We further introduce a heuristic re-sampling algorithm, leapfrog re-sampler (LRS), to extrapolate association results to semi-virtually enlarged cohorts. Owing to significant computational gains we anticipate a broad use of isGWAS and LRS which are customizable on a web interface.
0

Consequences Of Natural Perturbations In The Human Plasma Proteome

Benjamin Sun et al.May 6, 2020
+30
J
J
B
Proteins are the primary functional units of biology and the direct targets of most drugs, yet there is limited knowledge of the genetic factors determining inter-individual variation in protein levels. Here we reveal the genetic architecture of the human plasma proteome, testing 10.6 million DNA variants against levels of 2,994 proteins in 3,301 individuals. We identify 1,927 genetic associations with 1,478 proteins, a 4-fold increase on existing knowledge, including trans associations for 1,104 proteins. To understand consequences of perturbations in plasma protein levels, we introduce an approach that links naturally occurring genetic variation with biological, disease, and drug databases. We provide insights into pathogenesis by uncovering the molecular effects of disease-associated variants. We identify causal roles for protein biomarkers in disease through Mendelian randomization analysis. Our results reveal new drug targets, opportunities for matching existing drugs with new disease indications, and potential safety concerns for drugs under development.
0

A fast and efficient colocalization algorithm for identifying shared genetic risk factors across multiple traits

Christopher Foley et al.May 6, 2020
+4
P
J
C
Genome-wide association studies (GWAS) have identified thousands of genomic regions affecting complex diseases. The next challenge is to elucidate the causal genes and mechanisms involved. One approach is to use statistical colocalization to assess shared genetic aetiology across multiple related traits (e.g. molecular traits, metabolic pathways and complex diseases) to identify causal pathways, prioritize causal variants and evaluate pleiotropy. We propose HyPrColoc (Hypothesis Prioritisation in multi-trait Colocalization), an efficient deterministic Bayesian algorithm using GWAS summary statistics that can detect colocalization across vast numbers of traits simultaneously (e.g. 100 traits can be jointly analysed in around 1 second). We performed a genome-wide multi-trait colocalization analysis of coronary heart disease (CHD) and fourteen related traits. HyPrColoc identified 43 regions in which CHD colocalized with ≥1 trait, including 5 potentially new CHD loci. Across the 43 loci, we further integrated gene and protein expression quantitative trait loci to identify candidate causal genes.
215

Genetic regulation of the human plasma proteome in 54,306 UK Biobank participants

Benjamin Sun et al.Oct 11, 2023
+45
M
J
B
Abstract The UK Biobank Pharma Proteomics Project (UKB-PPP) is a collaboration between the UK Biobank (UKB) and thirteen biopharmaceutical companies characterising the plasma proteomic profiles of 54,306 UKB participants. Here, we describe results from the first phase of UKB-PPP, including protein quantitative trait loci (pQTL) mapping of 1,463 proteins that identifies 10,248 primary genetic associations, of which 85% are newly discovered. We also identify independent secondary associations in 92% of cis and 29% of trans loci, expanding the catalogue of genetic instruments for downstream analyses. The study provides an updated characterisation of the genetic architecture of the plasma proteome, leveraging population-scale proteomics to provide novel, extensive insights into trans pQTLs across multiple biological domains. We highlight genetic influences on ligand-receptor interactions and pathway perturbations across a diverse collection of cytokines and complement proteins, and illustrate long-range epistatic effects of ABO blood group and FUT2 secretor status on proteins with gastrointestinal tissue-enriched expression. We demonstrate the utility of these data for drug target discovery by extending the genetic proxied effect of PCSK9 levels on lipid concentrations, cardio- and cerebro-vascular diseases, and additionally disentangle specific genes and proteins perturbed at COVID-19 susceptibility loci. This public-private partnership provides the scientific community with an open-access proteomics resource of unprecedented breadth and depth to help elucidate biological mechanisms underlying genetic discoveries and accelerate the development of novel biomarkers and therapeutics.
215
0
Save
0

ProGeM: A framework for the prioritisation of candidate causal genes at molecular quantitative trait loci

David Stacey et al.May 7, 2020
+6
D
E
D
Quantitative trait locus (QTL) mapping of molecular phenotypes such as metabolites, lipids, and proteins through genome-wide association studies (GWAS) represents a powerful means of highlighting molecular mechanisms relevant to human diseases. However, a major challenge of this approach is to identify the causal gene(s) at the observed QTLs. Here we present a framework for the 'Prioritisation of candidate causal Genes at Molecular QTLs' (ProGeM), which incorporates biological domain-specific annotation data alongside genome annotation data from multiple repositories. We assessed the performance of ProGeM using a reference set of 227 previously reported and extensively curated metabolite QTLs. For 98% of these loci, the expert-curated gene was one of the candidate causal genes prioritised by ProGeM. Benchmarking analyses revealed that 69% of the causal candidates were nearest to the sentinel variant at the investigated molecular QTLs, indicating that genomic proximity is the most reliable indicator of 'true positive' causal genes. In contrast, cis-gene expression QTL data led to three false positive candidate causal gene assignments for every one true positive assignment. We provide evidence that these conclusions also apply to other molecular phenotypes, suggesting that ProGeM is a powerful and versatile tool for annotating molecular QTLs. ProGeM is freely available via GitHub.
0

Interleukin-6 Receptor Signalling and Abdominal Aortic Aneurysm Growth Rates

Ellie Paige et al.May 7, 2020
+22
F
M
E
Objective: The Asp358Ala variant (rs2228145; A>C) in the interleukin-6 receptor (IL6R) gene has been implicated in the development of abdominal aortic aneurysms (AAAs), but its effect on AAA growth over time is not known. We aimed to investigate the clinical association between the IL6R-Asp358Ala variant and AAA growth, and to assess the effect of blocking the IL-6 signalling pathway in mouse models of aneurysm rupture. Approach: Using data from 2,863 participants with AAA from nine prospective cohorts, age- and sex-adjusted mixed-effects linear regression models were used to estimate the association between the IL6R-Asp358Ala variant and annual change in AAA diameter (mm/year). In a series of complementary randomised trials in mice, the effect of blocking the IL-6 signalling pathways was assessed on plasma biomarkers, systolic blood pressure, aneurysm diameter and time to aortic rupture and death. Results: After adjusting for age and sex, baseline aneurysm size was 0.55mm (95% confidence interval [CI]: 0.13, 0.98mm) smaller per copy of the minor allele [C] of the Asp358Ala variant. There was no evidence of a reduction in AAA growth rate (change in growth=-0.06mm per year [-0.18, 0.06] per copy of the minor allele). In two mouse models of AAA, selective blockage of the IL-6 trans-signalling pathway, but not combined blockage of both, the classical and trans-signalling pathways, was associated with improved survival (p<0.05). Conclusions: Our proof-of-principle data are compatible with the concept that IL-6 trans-signalling is relevant to AAA growth, encouraging larger-scale evaluation of this hypothesis.
1

Genetic map of regional sulcal morphology in the human brain

Benjamin Sun et al.Oct 24, 2023
+16
F
S
B
Abstract The human brain is a complex organ underlying many cognitive and physiological processes, affected by a wide range of diseases. Genetic associations with macroscopic brain structure are emerging, providing insights into genetic sources of brain variability and risk for functional impairments and disease. However, specific associations with measures of local brain folding, associated with both brain development and decline, remain under-explored. Here we carried out detailed large-scale genome-wide associations of regional brain cortical sulcal measures derived from magnetic resonance imaging data of 40,169 individuals in the UK Biobank. Combining both genotyping and whole-exome sequencing data (∼12 million variants), we discovered 388 regional brain folding associations across 77 genetic loci at p <5×10 −8 , which replicated at p <0.05. We found genes in associated loci to be independently enriched for expression in the cerebral cortex, neuronal development processes and differential regulation in early brain development. We integrated coding associations and brain eQTLs to refine genes for various loci and demonstrated shared signal in the pleiotropic KCNK2 locus with a cortex-specific KCNK2 eQTL. Genetic correlations with neuropsychiatric conditions highlighted emerging patterns across distinct sulcal parameters and related phenotypes. We provide an interactive 3D visualisation of our summary associations, making complex association patterns easier to interpret, and emphasising the added resolution of regional brain analyses compared to global brain measures. Our results offer new insights into the genetic architecture underpinning brain folding and provide a resource to the wider scientific community for studies of pathways driving brain folding and their role in health and disease.
Load More