SB
Sonja Berndt
Author with expertise in Genomic Studies and Association Analyses
National Institutes of Health, National Cancer Institute, Cancer Institute (WIA)
+ 12 more
Achievements
Cited Author
Key Stats
Upvotes received:
0
Publications:
9
(33% Open Access)
Cited by:
19
h-index:
88
/
i10-index:
316
Reputation
Biology
< 1%
Chemistry
< 1%
Economics
< 1%
Show more
How is this calculated?
Publications
3

A Saturated Map of Common Genetic Variants Associated with Human Height from 5.4 Million Individuals of Diverse Ancestries

Loïc Yengo et al.Jan 12, 2022
+554
E
S
L
ABSTRACT Common SNPs are predicted to collectively explain 40-50% of phenotypic variation in human height, but identifying the specific variants and associated regions requires huge sample sizes. Here we show, using GWAS data from 5.4 million individuals of diverse ancestries, that 12,111 independent SNPs that are significantly associated with height account for nearly all of the common SNP-based heritability. These SNPs are clustered within 7,209 non-overlapping genomic segments with a median size of ~90 kb, covering ~21% of the genome. The density of independent associations varies across the genome and the regions of elevated density are enriched for biologically relevant genes. In out-of-sample estimation and prediction, the 12,111 SNPs account for 40% of phenotypic variance in European ancestry populations but only ~10%-20% in other ancestries. Effect sizes, associated regions, and gene prioritization are similar across ancestries, indicating that reduced prediction accuracy is likely explained by linkage disequilibrium and allele frequency differences within associated regions. Finally, we show that the relevant biological pathways are detectable with smaller sample sizes than needed to implicate causal genes and variants. Overall, this study, the largest GWAS to date, provides an unprecedented saturated map of specific genomic regions containing the vast majority of common height-associated variants.
41

FORGEdb: a tool for identifying candidate functional variants and uncovering target genes and mechanisms for complex diseases

Charles Breeze et al.Oct 24, 2023
+8
M
E
C
Abstract The majority of disease-associated variants identified through genome-wide association studies (GWAS) are located outside of protein-coding regions and are overrepresented in sequences that regulate gene expression. Prioritizing candidate regulatory variants and potential biological mechanisms for further functional experiments, such as genome editing, can be challenging, especially in regions with a high number of variants in strong linkage disequilibrium or multiple proximal gene targets. Improved annotation of the regulatory genome can help identify promising variants and target genes for functional genomics experiments. To advance this area, we developed FORGEdb ( https://forge2.altiusinstitute.org/files/forgedb.html ), a web-based tool that can rapidly integrate data for individual genetic variants, providing information on associated regulatory elements, transcription factor (TF) binding sites and target genes for over 37 million variants. FORGEdb uses annotations derived from data across a wide range of biological samples to delineate the regulatory context for each variant at the cell type level. Multiple data types, such as Combined Annotation Dependent Depletion (CADD) scores, expression quantitative trait loci (eQTLs), activity-by-contact (ABC) interactions, Contextual Analysis of TF Occupancy (CATO) scores, transcription factor (TF) motifs, DNase I hotspots, histone mark ChIP-seq peaks and chromatin states, are included in FORGEdb and these annotations are integrated into a FORGEdb score to guide assessment of functional importance. In summary, FORGEdb provides an expansive and unique resource of genomic annotations and an integrated score that can be used to accelerate the translation of identified genetic loci into biological insight.
41
Paper
Citation3
0
Save
0

A Linear Relationship between the Number of Cancers among First-degree Relatives and the Risk of Multiple Primary Cancers

Shisi He et al.Sep 16, 2024
+4
B
K
S
With advances in the early detection and treatment of cancer, the incidence of multiple primary cancers (MPC) or second primary cancers has increased over time. Characterization of etiologic risk factors, including family history of cancer, within the general population is critical for assessing MPC risk in patients. We examined the association between family history of cancer among first-degree relatives and MPC risk in a prospective study of 139,958 participants from the Prostate, Lung, Colorectal, and Ovarian Cancer Screening Trial. Cox proportional hazard models were used to calculate HRs and 95% confidence intervals (95% CI), adjusting for potential confounders. Over a median follow-up of 16 years (IQR: 11-19 years), 6,170 participants were diagnosed with MPC. Having a family history of cancer increased the risk of MPC by 18% (HR, 1.18; 95% CI, 1.12-1.24). A positive linear trend was observed between the reported number of cancers in the family history and MPC risk with HRs (95% CI) of 1.13 (1.07-1.20), 1.23 (1.14-1.33), 1.29 (1.15-1.45), and 1.42 (1.20-1.70) for one, two, three, and four or more cancers among first-degree relatives, respectively (Ptrend = 2.36 × 10-13). No significant differences were observed by cancer histology or specific cancer types reported in the family history. Our study demonstrates that the family history of cancer is an important risk factor for the development of MPCs and that a comprehensive assessment of the number of cancers reported among first-degree relatives may identify those at higher risk who may benefit from targeted cancer prevention and screening strategies. Prevention Relevance: Our study makes a substantial contribution to the understanding of risk factors for MPCs in the general population. It demonstrates that individuals with a strong family history of cancer are at higher risk for MPCs and may benefit from more targeted cancer prevention and screening interventions.
0
Citation1
0
Save
0

A combined proteomics and Mendelian randomization approach to investigate the effects of aspirin-targeted proteins on colorectal cancer

Aayah Nounu et al.Oct 24, 2023
+59
K
A
A
Abstract Background Evidence for aspirin’s chemopreventative properties on colorectal cancer (CRC) is substantial, but its mechanism of action is not well-understood. We combined a proteomic approach with Mendelian randomization (MR) to identify possible new aspirin targets that decrease CRC risk. Methods Human colorectal adenoma cells (RG/C2) were treated with aspirin (24 hours) and a stable isotope labelling with amino acids in cell culture (SILAC) based proteomics approach identified altered protein expression. Protein quantitative trait loci (pQTLs) from INTERVAL (N=3,301) and expression QTLs (eQTLs) from the eQTLGen Consortium (N=31,684) were used as genetic proxies for protein and mRNA expression levels. Two-sample MR of mRNA/protein expression on CRC risk was performed using eQTL/pQTL data combined with CRC genetic summary data from the Colon Cancer Family Registry (CCFR), Colorectal Transdisciplinary (CORECT), Genetics and Epidemiology of Colorectal Cancer (GECCO) consortia and UK Biobank (55,168 cases and 65,160 controls). Results Altered expression was detected for 125/5886 proteins. Of these, aspirin decreased MCM6, RRM2 and ARFIP2 expression and MR analysis showed that a standard deviation increase in mRNA/protein expression was associated with increased CRC risk (OR:1.08, 95% CI:1.03-1.13, OR:3.33, 95% CI:2.46-4.50 and OR:1.15, 95% CI:1.02-1.29, respectively). Conclusion MCM6 and RRM2 are involved in DNA repair whereby reduced expression may lead to increased DNA aberrations and ultimately cancer cell death, whereas ARFIP2 is involved in actin cytoskeletal regulation indicating a possible role in aspirin’s reduction of metastasis. Impact Our approach has shown how laboratory experiments and population-based approaches can combine to identify aspirin-targeted proteins possibly affecting CRC risk.
0

Winners curse correction and variable thresholding improve performance of polygenic risk modeling based on summary-level data from genome-wide association studies

Jianxin Shi et al.May 7, 2020
+38
J
J
J
Heritability analysis suggests that genome-wide association studies (GWAS) have the potential to improve genetic risk prediction for complex diseases. Polygenic risk-score (PRS) is a widely used modelling technique that requires only availability of summary-level data from the discovery samples. We propose two modifications to improve the performance of PRS. First, we propose threshold dependent winners curse adjustments for marginal association coefficients that are used to weight the SNPs in PRS. Second, to exploit various external functional/annotation knowledge that might identify subset of SNPs highly enriched for association signals, we consider using variable thresholds for SNPs selection. We applied our methods to the GWAS summary-level data of fourteen complex diseases. Our analysis shows that while a simple winners curse correction uniformly leads to enhancement of performance of the models across traits, incorporation of functional SNPs was beneficial for only selected traits. Compared to standard PRS algorithm, the proposed methods in combination leads to substantial efficiency gain (25-50% increase in the prediction R2) for five out of fifteen diseases. As an example, for GWAS of type 2 diabetes, the lasso-based winners curse correction improves prediction R2 from 2.29% based on standard PRS to 3.1% (P=0.0017) and incorporating functional annotation data further improved R2 to 3.53% (P=2.0E-5). Our simulation studies provided further clarification why differential treatment of certain category of functional SNPs, even when shown to be highly enriched for GWAS-heritability, does not lead to proportionate improvement in genetic risk-prediction due to non-uniform linkage disequilibrium structure.
0

The role of glycaemic, lipid, blood pressure and obesity risk factors as mediators of the effect of height on Coronary Artery Disease and Type 2 Diabetes Mellitus: A Mendelian Randomisation Study.

Eirini Marouli et al.May 7, 2020
+10
C
D
E
We investigated by Mendelian Randomisation (MR) analyses the causal effect of adult height on coronary artery disease (CAD) (23,755 cases, 425,339 controls) and type 2 diabetes (T2D) (29,427 cases, 416,908 controls) in UK Biobank. We then examined whether such effects are mediated via known cardiometabolic risk factors including body mass index (BMI), glycaemic traits, lipid levels and blood pressure. We further cross-checked our findings by two-sample MR and Multivariate MR analyses with publicly available summary statistics data. One standard deviation (SD) higher genetically determined height (~6.5 cm) was causally associated with a 14% decrease in CAD risk (OR= 0.86, 95% CI= 0.79-0.94). This causal association remained significant after performing sensitivity analyses relaxing pleiotropy assumptions. The causal effect of height on CAD risk appeared to be independent of risk factors such as lipid levels, blood pressure and BMI; association was reduced by only 1-3% after adjustment for potential mediators. We observed no direct causal effect of height on T2D risk, once its effect on BMI was taken into account (OR= 0.99, 95% CI= 0.96-1.02), suggesting that BMI acts as a mediator.
0

Shared heritability and functional enrichment across six solid cancers

Xia Jiang et al.May 7, 2020
+329
F
H
X
Quantifying the genetic correlation between cancers can provide important insights into the mechanisms driving cancer etiology. Using genome-wide association study summary statistics across six cancer types based on a total of 296,215 cases and 301,319 controls of European ancestry, we estimate the pair-wise genetic correlations between breast, colorectal, head/neck, lung, ovary and prostate cancer, and between cancers and 38 other diseases. We observed statistically significant genetic correlations between lung and head/neck cancer (rg=0.57, p=4.6x10-8), breast and ovarian cancer (rg=0.24, p=7x10-5), breast and lung cancer (rg=0.18, p=1.5x10-6) and breast and colorectal cancer (rg=0.15, p=1.1x10-4). We also found that multiple cancers are genetically correlated with non-cancer traits including smoking, psychiatric diseases and metabolic characteristics. Functional enrichment analysis revealed a significant excess contribution of conserved and regulatory regions to cancer heritability. Our comprehensive analysis of cross-cancer heritability suggests that solid tumors arising across tissues share in part a common germline genetic basis.
0

Physical activity and risks of breast and colorectal cancer: A Mendelian randomization analysis

Nikos Papadimitriou et al.May 7, 2020
+79
K
N
N
Physical activity has been associated with lower risks of breast and colorectal cancer in epidemiological studies; however, it is unknown if these associations are causal or confounded. In two-sample Mendelian randomization analyses, using summary genetic data from the UK Biobank and GWA consortia, we found that a one standard deviation increment in average acceleration was associated with lower risks of breast cancer (odds ratio [OR]: 0.59, 95% confidence interval [CI]: 0.42 to 0.84, P-value=0.003) and colorectal cancer (OR: 0.66, 95% CI: 0.53 to 0.82, P-value=2*E-4). We found similar magnitude inverse associations by breast cancer subtype and by colorectal cancer anatomical site. Our results support a potentially causal relationship between higher physical activity levels and lower risks of breast cancer and colorectal cancer. Based on these data, the promotion of physical activity is probably an effective strategy in the primary prevention of these commonly diagnosed cancers.
0

Narrow-sense heritability estimation of complex traits using identity-by-descent information.

Luke Evans et al.May 7, 2020
+122
M
R
L
Heritability is a fundamental parameter in genetics. Traditional estimates based on family or twin studies can be biased due to shared environmental or non-additive genetic variance. Alternatively, those based on genotyped or imputed variants typically underestimate narrow-sense heritability contributed by rare or otherwise poorly-tagged causal variants. Identical-by-descent (IBD) segments of the genome share all variants between pairs of chromosomes except new mutations that have arisen since the last common ancestor. Therefore, relating phenotypic similarity to degree of IBD sharing among classically unrelated individuals is an appealing approach to estimating the near full additive genetic variance while avoiding biases that can occur when modeling close relatives. We applied an IBD-based approach (GREML-IBD) to estimate heritability in unrelated individuals using phenotypic simulation with thousands of whole genome sequences across a range of stratification, polygenicity levels, and the minor allele frequencies of causal variants (CVs). IBD-based heritability estimates were unbiased when using unrelated individuals, even for traits with extremely rare CVs, but stratification led to strong biases in IBD-based heritability estimates with poor precision. We used data on two traits in ~120,000 people from the UK Biobank to demonstrate that, depending on the trait and possible confounding environmental effects, GREML-IBD can be applied successfully to very large genetic datasets to infer the contribution of very rare variants lost using other methods. However, we observed apparent biases in this real data that were not predicted from our simulation, suggesting that more work may be required to understand factors that influence IBD-based estimates.